본문 바로가기
IT

중국 MiniMax, M2.5 / M2.5 Lightning 공개

by 카메라의눈 2026. 2. 18.
반응형
오픈소스 MoE 아키텍처로 가격 파괴… 연 1만 달러에 다수 에이전트 운영 가능

MiniMax

 

중국 AI 스타트업 MiniMax가 2월 12일 M2.5 시리즈를 공개하며 글로벌 LLM 시장의 가격 전쟁을 본격화했습니다. 최고 성능 모델 M2.5는 Claude Opus 4.6과 GPQA·LiveCodeBench·AgentBench 등 주요 벤치마크에서 92~96% 수준의 성능을 기록하면서도 추론 비용은 1/20 수준에 불과하다고 주장했습니다.

반응형

기술적 핵심은 최적화된 Mixture of Experts(MoE) 아키텍처입니다. 총 1.8조 파라미터 중 활성화되는 파라미터를 220억 개로 제한해 연산 효율을 극대화했으며, 128K 컨텍스트를 지원하면서도 메모리 사용량을 Claude의 1/7로 줄였습니다. 특히 ‘M2.5 Lightning’ 버전은 초저지연 추론에 특화되어 실시간 에이전트 작업(채팅·코딩·데이터 분석)에 최적화되어 있습니다.

 

가격 파괴가 가장 큰 충격입니다. Claude Opus 4.6이 입력 1M 토큰당 15달러인 데 비해 M2.5는 0.75달러에 불과합니다. 연간 1만 달러 예산으로 50개 이상의 에이전트를 24시간 풀가동할 수 있어 중소기업과 개발자 커뮤니티에서 폭발적 반응을 얻고 있습니다. 오픈소스 가중치 일부 공개로 Hugging Face 다운로드 수가 출시 48시간 만에 180만 건을 돌파했습니다.

 

중국 정부의 전폭적 지원도 주목됩니다. 국가 AI 펀드로부터 8억 달러 추가 투자를 유치한 MiniMax는 선전·상하이·베이징에 총 3개의 초대형 훈련 클러스터를 구축 중이며, 2026년 말까지 5조 파라미터급 후속 모델을 준비하고 있습니다.

 

서구 업계는 경계와 함께 학습의 기회로 보고 있습니다. Anthropic과 OpenAI는 “중국 모델의 안전성 검증이 미흡하다”며 규제 당국에 주의를 촉구하고 있지만, 많은 기업들은 비용 절감을 위해 이미 파일럿 테스트를 시작했습니다. IDC는 “2026년 말까지 저비용 중국 모델이 글로벌 기업 AI 지출의 18%를 차지할 것”으로 전망했습니다.

 

결국 MiniMax의 등장은 AI 민주화의 상징이 되고 있습니다. ‘누구나 고성능 에이전트를 가질 수 있다’는 새로운 시대가 열리면서, 기존 빅테크 중심의 프리미엄 모델 시장과 저가·오픈소스 시장으로 양극화가 가속화될 전망입니다.

 

출처 : VentureBeat, Radical Data Science, MiniMax Official WeChat (2026.2 중순)

반응형