MiniMax-M3 데뷔, 주요 벤치마크 성능에서 GPT-5.5와 Gemini 3.1 Pro를 능가하며 비용은 단 5-10% 수준

(venturebeat.com)

12P by recast7838 1달전 | ★ favorite | 댓글 6개

중국 AI 스타트업 미니맥스(MiniMax)가 기존 미국의 상용 모델 대비 5~10% 수준의 파격적인 비용으로 GPT-5.5와 제미나이 3.1 프로를 능가하는 오픈 가중치 기반 멀티모달 대형언어모델 'M3'를 전격 출시했습니다.

전문 번역

중국 AI 스타트업 미니맥스가 프론티어급 코딩 성능과 100만 토큰 컨텍스트 창을 갖춘 멀티모달 거대언어모델 'M3'를 전격 출시하며 글로벌 기업용 AI 시장에 큰 파장을 일으켰습니다. M3는 향후 10일 이내에 허깅페이스와 깃허브를 통해 '오픈 가중치(Open Weights)' 오픈소스 라이선스로 배포되어 기업들이 내부 서버에 로컬로 다운로드하고 커스텀 최적화를 할 수 있도록 지원할 예정입니다. 현재는 출시 특가로 100만 입력 토큰당 0.3달러, 출력 토큰당 1.20달러(총비용 1.50달러 {b:4})에 제공되고 있으며, 정상가가 적용되더라도 미국 주요 상용 모델 비용의 8~20% 수준 {p:14}에 불과해 구글, 오픈AI, 앤스로픽 등 미국 거대 기술 기업들을 비용 측면에서 압도합니다.

M3가 이처럼 극적인 비용 절감을 이뤄낸 핵심 비결은 기존 트랜스포머의 제곱비례 연산 비용 폭발 문제를 해결한 '미니맥스 희소 주의(MSA)' 아키텍처 덕분입니다. MSA 기술은 데이터를 고정밀 블록으로 분할해 필요한 쿼리만 동적으로 매칭함으로써 하드웨어 효율을 극대화하며, 100만 토큰을 처리할 때 연산 요구량을 기존의 20분의 1 수준 {p:5}으로 낮추고 디코딩 속도를 15배나 끌어올렸습니다. 이러한 구조적 혁신을 바탕으로 M3는 자율 소프트웨어 엔지니어링 수행 능력을 평가하는 SWE-Bench Pro에서 59.0% {p:59}를 기록하며 폐쇄형 모델인 GPT-5.5나 제미나이 3.1 프로를 제쳤고, 웹 브라우징 및 정보 검색 성능(BrowseComp 83.5% {p:84})에서도 기존 클로드 옵스 4.7의 기록을 넘어섰습니다.

최근 출시된 최고 성능의 폐쇄형 모델 클로드 옵스 4.8(SWE-Bench Pro 69.2% {b:59,69})과 비교하면 초고난도 추론 영역에서 일부 성능 차이가 존재하지만, M3는 막대한 API 구독료 없이도 강력한 로컬 자동화 기준점을 제공합니다. 아울러 미니맥스는 M3를 탑재하여 스스로 코드를 짜고 독립적인 검증 루프를 돌리며 자율 수정하는 '미니맥스 코드' 에이전트 제품군을 함께 선보였으며, 월 20달러(플러스)부터 시작하는 공격적인 요금제를 도입했습니다. 엄격한 데이터 프라이버시와 규정 준수가 필수적인 기업 환경에서 M3의 오픈 가중치 제공은 클라우드 데이터 유출 위험을 원천 차단하고 기업 고유의 핵심 자산으로 내재화할 수 있는 최고의 가성비를 제공할 것으로 기대됩니다

글쓴이의 한줄

ollama 클라우드에서 사용해봐야겠습니다

GeekNews Weekly에 포함된 글입니다. 에디터 코멘트 보기

jimmy2056 1달전 [-]

중국 모델이라 API로 쓰기는 그렇고 로컬에서 돌릴수 있으면 좋겠습니다.

답변달기

recast7838 1달전 [-]

지금 사용중인데 다른 중국모델처럼 글쓰다가 중국어가 튀여나오는 문제가 없네요 tool call도 잘하는듯 싶고요

답변달기

somang04 1달전 [-]

minimax 구독 모델 사용 중인데, 연간 100달러면.. 차고 넘치게 사용이 가능합니다. 심지어 거기에 하루에 일일 100곡 음원 제작도 가능하구요. (어처구니 없이 중국어로 제작된 커트리풍 노래가 나올 때도 있지만..) suno 혹은 flow의 마이너 버전, 그리고 BGM용으로 만들기엔 좋은거 같습니다.

코딩이나 에이전트쪽으론 안써봤지만. gemini / open ai / anthropic api 랑 비교해서 테스트 해봐야겠네요.

답변달기

vndk2234 1달전 [-]

어떻게 가격이 gpt nano급이 나오는건지...
AI사용할때 자기 주민등록증 올려두는 사람이 아니면 중국꺼 써도 큰 문제 없겠네요

답변달기

runableapp 1달전 [-]

중국 모델이라 여전히 사용하기가 조금 꺼려지긴 합니다만, 이런 중국 서비스가 없으면 미국 회사들의 서비스 가격을 얼마나 올렸을까 하는 생각이듭니다. 트럼프가 그런 정책을 내놓은것과 어떤 관계가 있지않나 하는 의심도 드는군요.

답변달기

b8g6pn 1달전 [-]

비빈다는 모델의 기준은 사실 조금 과장되어있겠지만 가격이 충격적이네요

답변달기