아시아 AI 스타트업들, Anthropic Mythos 대체 모델 출시
(techcrunch.com)- 미국 정부의 Mythos·Fable 5 접근 제한이 길어지면서, 일본 Sakana AI와 중국 360이 각각 Fugu와 Tulongfeng/Yitianzhen으로 생긴 공백을 겨냥함
- Sakana AI의 Fugu는 Fable 5·Mythos Preview와 경쟁 가능한 모델로 소개되며, 여러 모델 API를 조율하는 에이전트용 모델로 설계됨
- 중국 360의 Tulongfeng은 소프트웨어 취약점 자동 발견, Yitianzhen은 사이버 방어와 사고 대응 자동화에 초점을 둠
- Sakana AI는 출시 시점이 우연이라고 했지만, “수출 통제 위험 없는 frontier capability”를 내세우며 일본 기업과 정부기관을 겨냥함
- 미국 모델의 중요성은 여전히 남아 있지만, 수출 제한은 도쿄와 중국 기업들이 현지 언어와 맥락에 맞춘 지역 대안을 앞당기는 계기가 됨
Anthropic 수출 제한이 만든 모델 공백
- 중국 사이버보안 기업 360은 수요일 Tulongfeng을 공개했다고 Reuters가 보도함
- 360은 Tulongfeng이 Anthropic의 사이버보안 특화 AI 모델 Mythos와 맞설 수 있다고 밝힘
- Mythos와 더 제한된 버전인 Fable 5는 Trump Administration 조치로 현재 미국인이 아닌 사용자에게 제공되지 않음
- 같은 주 초 도쿄 기반 Sakana AI는 일본어로 복어를 뜻하는 Fugu를 출시함
- Fugu는 “Anthropic의 Fable 5와 Mythos Preview 같은 선도 모델과 어깨를 나란히 한다”는 설명을 받음
- 에이전트용으로 설계됐고, 다른 모델의 API 접근을 조율할 수 있음
- 두 제품 모두 미국 정부의 Anthropic 관련 명령이 나온 지 2주가 지난 시점에 등장함
Sakana AI의 Fugu 전략
- Sakana AI 대변인은 Fugu 출시가 Mythos/Fable 수출 제한과 겹친 것은 “entirely coincidental”이라고 밝힘
- 다만 회사 웹사이트는 “수출 통제 위험 없는 frontier capability”를 홍보함
- Sakana AI는 Fugu를 지난해부터 만들었고, 관련 연구는 올해 봄 ICLR에서 발표됐다고 설명함
- 회사는 2023년 Google 출신 David Ha와 Llion Jones, Mercari와 Stability AI 출신 Ren Ito가 공동 창업함
- 작은 데이터셋에서도 잘 작동하고, 일본어와 일본 문화에 최적화된 저렴한 생성 AI 모델을 만듦
- Fugu의 목표 고객은 강화되는 수출 통제 노출을 줄이려는 일본 기업과 정부기관임
- Sakana AI는 이를 아시아가 미국 AI에서 영구적으로 이탈하는 흐름으로 보지는 않음
- 대변인은 “U.S. models remain important to Asia”라고 밝힘
- Ren Ito는 Project Syndicate 기고에서 미국 연방정부의 첫 우선순위가 가까운 동맹국의 접근 보존이어야 하며, AI는 비축되는 기술이 아니라 함께 개발되는 기술이어야 한다고 주장함
- David Ha는 X에서 “Orchestration Models are the next frontier, beyond bigger models”라고 썼음
- 국가 인프라를 단일 제공자에 의존하는 것은 위험하며, 최근 수출 통제가 그 위험을 무시할 수 없게 만들었다고 봄
- “Access to top models can disappear overnight”라고 쓰며, 집단지성을 권력 집중에 대한 실용적 헤지로 표현함
360의 보안 AI와 전략 자산 논리
- 360은 Reuters와 Quartz 보도 기준으로 두 가지 AI 보안 도구를 공개함
- Tulongfeng: 소프트웨어 취약점을 자동으로 발견하도록 설계됨
- Yitianzhen: 사이버 방어와 사고 대응을 자동화하도록 만들어짐
- 360 창업자 Zhou Hongyi는 Reuters 보도 기준으로 취약점 탐지 AI를 국가 전략 자산으로 봄
- 일부 행위자만 고급 취약점 탐지 역량에 접근할 수 있는 “one-way transparency” 위험을 지적함
- 360은 TechCrunch의 논평 요청에 응답하지 않음
Anthropic의 성장과 지역 대안의 부상
- Anthropic은 2026년 5월 연간 환산 매출이 470억 달러를 넘었다고 밝힌 바 있음
- 이 중 아시아 기업 고객에 얼마나 의존하는지는 공개되지 않음
- 수출 명령 발효 이후 몇 주 사이 Sakana AI와 360이 Anthropic 모델 접근 제한으로 생긴 빈 공간에 진입함
- 미국 기업들이 금지 조치 종료 후 신뢰를 되찾을 수 있더라도, 현지 언어와 뉘앙스를 더 잘 이해하도록 훈련된 지역 대안이 이미 공백을 채우고 있음
댓글과 토론
Hacker News 의견들
-
Fugu 모델을 C#과 Unity에서 MCP, OpenCode로 실제 작업에 써봤는데, 테마 시스템 리뷰와 색상 변경 계획 한 번에 $20 플랜의 5시간 한도를 다 써버림
구현 결과를 보려고 $100 플랜으로 올렸지만 Opus보다 나쁘고 엄청 느렸으며, 새 5시간 한도도 소진하고 주간 한도의 35%를 썼는데도 Opus가 훨씬 적은 시간과 비용으로 하던 수준에 거의 못 미쳤음
이 정보는 알아서 판단하면 되지만, 돈 낭비처럼 보임- Fugu는 독립 모델이 아니라 OpenAI, Anthropic 같은 여러 기존 SaaS 모델을 뒤에서 호출하고, 응답을 모아 결과를 만드는 구조임
여러 AI 모델 결과를 조합한 뒤 자체 독점 모델로 최종 결과를 만들면 단일 백엔드 모델보다 품질이 좋아진다고 주장하지만, 그 자체 모델이 실제로 존재하는지, 충분히 유능한지 의심이 듦
설령 주장이 맞더라도 Claude Code 같은 클라이언트 쪽에서 백그라운드 모델과 비슷한 성능의 모델로 최종 결과를 생성하게 하면 쉽게 구현 가능해 보이고, 서비스에서 수상한 냄새가 남 - Unity 대신 Godot용으로 비슷한 서비스를 제공하는 입장에서, Opus 같은 상위 모델을 쓰면 $20 플랜이 프롬프트 하나에 소진되는 건 그럴듯함
API 가격을 그대로 내고 10배 보조금을 감당하지 못하면 그렇게 됨 - Cursor에서 Fable을 테스트해봤고, 만든 데이터 웹사이트를 덜 “Claude스럽게” 보이게 할 아이디어를 물었더니 10분 만에 $40을 쓰면서 가장 쓸모없고 Claude스러운 CSS 스타일링을 뽑아냈음
그 웹사이트 자체는 Opus로 만든 것이니 결과가 Opus보다 나빴다고도 볼 수 있음
미국 모델로도 같은 경험을 했으니, 어쩌면 그 아시아 모델들도 Mythos류일지도 모르겠음 - 어떤 Unity MCP를 쓰는지 궁금함
공식 MCP를 써보고 있는데, 다른 사람들은 뭘 쓰는지 알고 싶음
유명한 coplay 쪽은 패키지 충돌을 겪었음 - 웹 검색/조사에서도 비슷했고, Opus와 비교하면 나빴음
절반은 놓쳤고 나머지 절반은 오래된 정보였거나 검증하지 않았음
- Fugu는 독립 모델이 아니라 OpenAI, Anthropic 같은 여러 기존 SaaS 모델을 뒤에서 호출하고, 응답을 모아 결과를 만드는 구조임
-
Fugu Ultra는 실제로 모델이 아니라 여러 모델로 라우팅하는 시스템, 클라우드 하네스에 가까워 보이며 OpenRouter의 Fusion과 비슷해 보임
“단일 거대 모델이 아니라, Fugu는 학습된 다중 에이전트 오케스트레이션 시스템이다. 교체 가능한 기반 모델 풀에 작업을 라우팅하고 자기 자신의 인스턴스를 재귀적으로 호출하도록 훈련된 언어 모델이다.” - https://openrouter.ai/sakana/fugu-ultra
[0] https://sakana.ai/fugu/
[1] https://openrouter.ai/openrouter/fusion -
“Mythos-like”라는 표현이 슬슬 짜증남
일반 사용자는 벤치마크를 보는 것 말고는 비교할 방법이 없음- “Mythos-like”는 그냥 소문으로 과대홍보됨이라는 뜻이고, 여기서는 맞게 쓰인 표현임
- 아시아 AI 스타트업들도 과감한 주장을 하면서 실제로 비교할 방법은 없고, Trump 개입의 핵심도 Faible을 증류하지 못하게 막는 것이었다고 볼 수 있음
- 공개 벤치마크도 없는 것 아닌가?
-
신뢰할 만한 벤치마크가 없다면, 이들이 Mythos와 비슷한 건 텍스트를 입력받아 텍스트를 출력한다는 의미뿐임
- 이제 벤치마크는 거의 안 봄
새 모델이 나오면 우리 대규모 독점 시스템 소프트웨어 코드베이스와 실제 출시 제품, 또는 언젠가 출시될 프로젝트에 직접 써봄
어떤 모델이 일을 더 잘하거나 빠르게 해주는지는 꽤 명확하고, 지금은 필요한 만큼 쓸 수 있는 토큰 예산이 있어서 운이 좋은 편임
벤치마크, 평가, 마케팅, 시스템 카드 같은 건 필요 없고, 웹에서는 팁과 실무 방식, 출시 소식만 읽음
동료들과 경험은 공유하지만 그 외는 전부 잡음임 - Mythos처럼 과대홍보됐다면 “Mythos-like” 목록에 그것도 추가할 수 있음
아마 빠진 건 CEO가 “우리 모델은 인터넷에 공개하기엔 너무 위험하니, 너무 늦기 전에 누군가 막아야 한다”고 세상에 경고하는 장면일 듯함 - 논문에 벤치마크가 있음: https://arxiv.org/abs/2606.21228
- 이제 벤치마크는 거의 안 봄
-
투자자 목록이 인상적임: https://sakana.ai/company-info/?lang=en
며칠 전 HN 헤드라인에도 올라왔고 댓글이 100개 넘었음: https://news.ycombinator.com/item?id=48624782- 이 회사들이 이전에 모델을 낸 적이 있나?
갑자기 Mythos급 모델을 냈다고 믿기 어려움
DeepSeek, Z.ai, Alibaba/Qwen은 훨씬 오래 해왔고 지난 18개월 동안 성능을 꾸준히 끌어올린 모델들을 내왔음
아무 이전 출시 없이 새 회사들이 갑자기 Mythos급 모델을 내놓았다는 건 믿기 힘듦 - 작년에 꽤 굴욕적인 철회도 있었음
https://techcrunch.com/2025/02/21/sakana-walks-back-claims-t...
- 이 회사들이 이전에 모델을 낸 적이 있나?
-
올해가 끝나기 전에 “안전 우려”를 이유로 외국산 LLM 금지가 나올 것 같음
실제 성능과는 상관없을 것임
하지만 Anthropic이 Mythos류 시스템의 기준선을 만들어놨고, 그 느슨하게 정의된 기준에 맞는 건 대중에게 위험하다고 취급될 듯함- 실제로는 어떻게 작동할 수 있음?
- 그렇다면 미국 기술은 안녕이고 중국을 환영하게 될 듯함
아무도 기다리지 않을 것이고, 이미 나온 지니를 병에 다시 넣을 수는 없음 - 모델이 발전해도 실제 위험이 없다는 듯이 말하는 건 말도 안 됨
지금 시점에서 똑똑한 말을 하는 건 Claude뿐인 것 같은 다른 현실에 사는 느낌임
사람이 쓴 글은 거의 다 환각과 보여주기식 헛소리처럼 보임
-
냉소적으로 보면, 모델이 괜찮기만 해도 Mythos급이라는 주장을 반박하기 어려움
이제 Mythos를 사용할 수 없기 때문임- Mythos 같은 게 뭔가?
접근 권한이 없었던 사람으로서 궁금함
- Mythos 같은 게 뭔가?
-
첫인상은 “제3자 벤치마크 없으면 꺼져라”임
개인적으로 이 두 회사 모두 들어본 적이 없음
시장 최고 모델들과 맞먹는다는 말을 그냥 믿으라는 건가?
Sakana는 자기 모델을 “Orchestration Model”이라고 설명하는데, 그럼 실제로는 여러 모델을 이어 붙인 것이라는 뜻인가?- 좋은 모델을 만드는 게 실제로 그렇게 어려운가, 아니면 학습에 투입할 자원 규모가 핵심인가?
정말 몰라서 묻는 것임
물론 사소한 일은 아니겠지만, 알려진 기존 기법 위에 만드는 데 세계 최고 수준의 비밀 지식이 필요한가?
아직 탐색할 낮게 매달린 과일이 많고, 시간과 자원이 제한 요인인 느낌임 - 최근 HN에 올라온 릴리스 글의 댓글들은 실제 모델이라기보다 OpenRouter와 비슷하다고 보는 분위기였음
- 내 인상으로는 맞음
새로운 모델 혼합체라기보다, 어떤 동적인 방식으로 즉석에서 접착제를 바르는 구조라고 주장하는 듯함
당시 반응도 여기서 볼 수 있음: https://news.ycombinator.com/item?id=48624782 (6일 전, 244점, 댓글 133개) - Anthropic은 제3자 벤치마크를 줬나?
그때도 그렇게 말했나?
중요하긴 하지만, 태도는 잘못됐음
- 좋은 모델을 만드는 게 실제로 그렇게 어려운가, 아니면 학습에 투입할 자원 규모가 핵심인가?
-
https://arena.ai/leaderboard에 벤치마크가 없으면 100% 사기라고 보면 되는 단순한 사람임
- ARC AGI와 비교하면 어떰?
-
여기 많은 댓글처럼 나도 Fugu와 몇몇 다른 모델을 테스트했는데, 꽤 비싼 모델들이었음
$20으로는 전체 워크플로를 끝내기 부족했고, Opus에서는 가능했음
물론 Opus도 최고의 결과를 원하면 처음부터 프롬프트를 더 다듬어야 할 수 있지만, 지금까지는 그런 경험임
다음 테스트는 에이전트형 시스템으로 해보고 성능을 볼 예정임