MiniMax-M3 데뷔, 주요 벤치마크 성능에서 GPT-5.5와 Gemini 3.1 Pro를 능가하며 비용은 단 5-10% 수준
(venturebeat.com)중국 AI 스타트업 미니맥스(MiniMax)가 기존 미국의 상용 모델 대비 5~10% 수준의 파격적인 비용으로 GPT-5.5와 제미나이 3.1 프로를 능가하는 오픈 가중치 기반 멀티모달 대형언어모델 'M3'를 전격 출시했습니다.
전문 번역
중국 AI 스타트업 미니맥스가 프론티어급 코딩 성능과 100만 토큰 컨텍스트 창을 갖춘 멀티모달 거대언어모델 'M3'를 전격 출시하며 글로벌 기업용 AI 시장에 큰 파장을 일으켰습니다. M3는 향후 10일 이내에 허깅페이스와 깃허브를 통해 '오픈 가중치(Open Weights)' 오픈소스 라이선스로 배포되어 기업들이 내부 서버에 로컬로 다운로드하고 커스텀 최적화를 할 수 있도록 지원할 예정입니다. 현재는 출시 특가로 100만 입력 토큰당 0.3달러, 출력 토큰당 1.20달러(총비용 1.50달러 )에 제공되고 있으며, 정상가가 적용되더라도 미국 주요 상용 모델 비용의 8~20% 수준 {p:14}에 불과해 구글, 오픈AI, 앤스로픽 등 미국 거대 기술 기업들을 비용 측면에서 압도합니다.
M3가 이처럼 극적인 비용 절감을 이뤄낸 핵심 비결은 기존 트랜스포머의 제곱비례 연산 비용 폭발 문제를 해결한 '미니맥스 희소 주의(MSA)' 아키텍처 덕분입니다. MSA 기술은 데이터를 고정밀 블록으로 분할해 필요한 쿼리만 동적으로 매칭함으로써 하드웨어 효율을 극대화하며, 100만 토큰을 처리할 때 연산 요구량을 기존의 20분의 1 수준 {p:5}으로 낮추고 디코딩 속도를 15배나 끌어올렸습니다. 이러한 구조적 혁신을 바탕으로 M3는 자율 소프트웨어 엔지니어링 수행 능력을 평가하는 SWE-Bench Pro에서 59.0% {p:59}를 기록하며 폐쇄형 모델인 GPT-5.5나 제미나이 3.1 프로를 제쳤고, 웹 브라우징 및 정보 검색 성능(BrowseComp 83.5% {p:84})에서도 기존 클로드 옵스 4.7의 기록을 넘어섰습니다.
최근 출시된 최고 성능의 폐쇄형 모델 클로드 옵스 4.8(SWE-Bench Pro 69.2% )과 비교하면 초고난도 추론 영역에서 일부 성능 차이가 존재하지만, M3는 막대한 API 구독료 없이도 강력한 로컬 자동화 기준점을 제공합니다. 아울러 미니맥스는 M3를 탑재하여 스스로 코드를 짜고 독립적인 검증 루프를 돌리며 자율 수정하는 '미니맥스 코드' 에이전트 제품군을 함께 선보였으며, 월 20달러(플러스)부터 시작하는 공격적인 요금제를 도입했습니다. 엄격한 데이터 프라이버시와 규정 준수가 필수적인 기업 환경에서 M3의 오픈 가중치 제공은 클라우드 데이터 유출 위험을 원천 차단하고 기업 고유의 핵심 자산으로 내재화할 수 있는 최고의 가성비를 제공할 것으로 기대됩니다
글쓴이의 한줄
ollama 클라우드에서 사용해봐야겠습니다