leangnews

2026년 02월 13일 11:02

MiniMax M2.5·라이트닝, 최상급 근접 성능… 비용은 Opus 4.6의 1/20

MiniMax M2.5·라이트닝, 최상급 근접 성능… 비용은 Opus 4.6의 1/20


기사 요약

  • 상하이 본사의 중국 AI 스타트업 미니맥스가 MiniMax M2.5와 M2.5 라이트닝을 공개해 최상급 모델에 근접한 성능을 훨씬 낮은 비용으로 제공한다고 밝혔다.
  • MoE 아키텍처와 Forge RL, CISPO 기법으로 230B 중 10B만 활성화하며 실제 업무 도구 사용과 코딩에서 강점을 보였고, SWE-Bench 80.2% 등 벤치마크에서도 상위권을 기록했다.
  • API 요금은 입력 1M당 $0.15부터로 과제당 약 $0.15, 연간 약 $1만으로 에이전트 4개 상시 운용을 내세우며, 오픈소스를 표방하지만 가중치와 라이선스는 아직 미공개다.

MiniMax M2.5 출시 개요와 의미

중국 AI 스타트업 미니맥스가 두 가지 변형의 MiniMax M2.5를 공개했다. 회사는 이 모델을 통해 고성능 인공지능을 사실상 걱정 없이 쓸 수 있을 만큼 저렴한 비용으로 제공한다고 강조한다. '오픈소스' 표방에도 불구하고 가중치와 코드, 정확한 라이선스는 아직 공개되지 않았지만, 파트너와 API를 통한 가격 전략만으로도 파급력이 크다. 이 출시가 중요한 이유는 AI가 단순 '챗봇'을 넘어 실제 업무를 수행하는 '워커'로 전환되는 신호이기 때문이다. MiniMax 내부에서는 이미 전체 업무의 30%를 M2.5가 처리하고, 신규 커밋 코드의 80%를 생성한다고 밝혔다.

가격 혁신과 비용 장벽의 붕괴

M2.5는 최근 몇 년간의 '비싼 컨설턴트' 같은 AI 사용 경험을 뒤집는다. 선단 모델 대비 최대 95% 비용 절감을 내세우며, 복잡한 프롬프트 최적화로 비용을 아끼던 압박을 덜어준다. 팟캐스트 분석에 따르면 MiniMax M2.5는 매우 빠르게 동작해 토큰 사용량 자체가 줄어 과제당 약 $0.15 수준으로, Claude Opus 4.6의 약 $3.00 대비 현저히 낮다. 엔드 투 엔드 작업 완료 속도도 37% 개선되어 모델 간 상호 호출이 잦은 에이전틱 파이프라인을 실시간 서비스로 끌어올릴 토대가 된다.

기술 핵심: MoE·Forge RL·CISPO와 'Architect Mindset'

MiniMax M2.5의 효율성 비결은 Mixture of Experts 구조다. 총 230B 파라미터 중 매 토큰마다 약 10B만 활성화해 대형 모델의 추론 깊이를 유지하면서도 경량 모델의 기민함을 확보했다. 학습에는 자체 강화학습 프레임워크 Forge가 쓰였고, 수천 개의 시뮬레이션 워크스페이스에서 코딩과 도구 사용을 연습하도록 설계되었다. 훈련 안정화를 위해 CISPO(Clipping Importance Sampling Policy Optimization)를 적용해 과교정을 방지했고, 그 결과 코드부터 쓰기보다 구조·기능·인터페이스를 먼저 설계하는 'Architect Mindset'을 습득했다.

벤치마크 성과와 최상위권 근접

최신 리더보드에서 MiniMax M2.5는 상위권으로 도약해 최근 공개된 Anthropic Claude Opus 4.6에 근접했다는 평가를 받는다. SWE-Bench Verified 80.2%, BrowseComp 76.3%(검색·도구 사용 선도), Multi-SWE-Bench 51.3%(다국어 코딩 SOTA), BFCL(툴 콜링) 76.8% 등 결과가 이를 뒷받침한다. 진행자 분석대로 높은 처리 속도는 토큰 소모를 줄여 실사용 비용을 추가로 낮춘다.

제품 라인업과 요금

API로 제공되는 제품은 두 가지다. MiniMax M2.5 라이트닝은 속도 최적화 버전으로 초당 100토큰, 입력 1M당 $0.30·출력 1M당 $2.40이며, 스탠더드 M2.5는 비용 최적화 버전으로 초당 50토큰, 입력 1M당 $0.15·출력 1M당 $1.20이다. 회사는 에이전트 4개를 1년 내내 연속 운용하는 데 약 $10,000면 충분하다고 주장하며, 엔터프라이즈 관점에서 GPT-5나 Claude 4.6 Opus 대비 약 1/10~1/20 수준의 총비용을 제시한다.

엔터프라이즈 전략적 함의

이제 기업은 고컨텍스트·고추론 모델을 일상 업무에도 부담 없이 투입할 수 있다. 에이전틱 워크플로가 실시간 사용자 경험 요구를 맞출 만큼 빨라졌고, 금융 모델링 MEWC 74.4% 성과는 법률·금융 등 특화 산업의 암묵지를 최소 감독으로 다룰 가능성을 시사한다. MiniMax M2.5가 '오픈소스'를 지향하는 만큼, 라이선스와 가중치가 공개되면 대규모 자동화 코드 감사를 자체 데이터 보호 하에 수행할 여지도 커진다. 다만 실제 개방 범위는 관련 조건 공개 이후 확정될 사안이다.

이 기사 공유하기