미국 정부, Fable 5와 Mythos 5 에 대해 모든 외국인의 접근 중단 지시
(anthropic.com)- 미국 정부가 국가안보 권한을 근거로 내린 수출 통제 명령에 따라, 미국 내외를 막론한 모든 외국 국적자의 Fable 5·Mythos 5 접근이 차단되며 규정 준수를 위해 전체 고객 대상 서비스가 즉시 중단됨
- 명령은 ET 기준 오후 5시 21분에 접수됐으며, 국가안보 우려의 구체적 내용은 명시되지 않음
- 정부의 근거는 Fable 5의 탈옥(jailbreaking) 기법 인지로 파악되나, 해당 기법으로 식별된 취약점은 이미 알려진 경미한 수준이며 다른 공개 모델로도 우회 없이 발견 가능
- Anthropic은 출시 전 미국 정부·UK AISI·외부 기관과 수천 시간 레드팀 테스트를 거쳤고, 어떤 테스터도 범용 탈옥(universal jailbreak) 을 찾지 못함
- 좁은 범위의 탈옥 가능성을 이유로 수억 명이 사용하는 상용 모델을 회수하는 기준에는 동의하지 않으며, 다른 모델 제공자에게도 동일 적용 시 신규 모델 배포가 사실상 중단될 것으로 봄
명령의 내용과 즉각적 영향
- 미국 정부가 국가안보 권한을 인용해 수출 통제 명령을 발령, 미국 내외를 불문한 모든 외국 국적자(외국 국적 Anthropic 직원 포함)의 Fable 5·Mythos 5 접근을 중단시킴
- 명령의 결과로 규정 준수를 위해 전체 고객 대상 Fable 5·Mythos 5를 갑작스럽게 비활성화함
- 그 외 모든 Anthropic 모델 접근은 영향받지 않음
- 명령은 당일 ET 오후 5시 21분에 접수됐으며, 서한에는 국가안보 우려의 구체적 세부사항이 담기지 않음
정부 우려의 추정 근거
- 정부가 Fable 5의 탈옥(jailbreaking) 우회 기법을 인지한 것으로 파악됨
- 해당 기법 시연을 검토한 결과, 이미 알려진 소수의 경미한 취약점을 식별하는 용도였음
- 이 취약점들은 비교적 단순하며, 다른 공개 모델도 우회 없이 동일하게 발견 가능
Fable의 안전장치에 대한 Anthropic의 입장
- 사이버보안 등 작업에서의 오용 가능성을 크게 낮추는 강력한 안전장치를 도입했으며, 다수 사용자가 과도하게 광범위하다고 불만을 제기할 정도임
- 출시 직전 수 주간 미국 정부, UK AISI, 다수 민간 제3자 기관, 내부 팀과 함께 총 수천 시간의 레드팀 검증을 수행함
- 해당 테스트에서 Fable의 안전장치가 기존 배포된 어떤 모델보다 실질적으로 더 효과적임이 확인됨
- 어떤 테스터도 범용 탈옥(universal jailbreak)(모델 안전장치를 광범위하게 우회해 다양한 사이버 역량을 여는 방식)을 찾지 못함
완전한 탈옥 방어의 한계
- 현재 어떤 제공자도 완전한 탈옥 저항은 불가능한 것으로 보며, 업계의 모든 안전장치는 비범용 탈옥(non-universal jailbreak)(특정 상황에서 일부 사이버 정보 유도)에 취약함
- 범용 탈옥도 결국 향후 발견될 가능성이 있으며, 이는 Fable 5 출시 시 명확히 밝힌 사항임
Defense in Depth 전략
- 완전 방어가 불가능한 현실에서 다층 방어(defense in depth) 전략을 채택, 탈옥을 좁은 범위로 한정하거나(비범용) 매우 비싸게(범용) 만들고 철저한 모니터링으로 공격을 신속히 탐지·차단함
- 이를 위해 Fable에 30일 고객 데이터 보존을 요구했으며, 고객 측에 실질적 비용을 수반하나 탈옥 연구·완화를 가능케 함
- 다층 방어 전략을 고수하며, 이는 이미 업계 전반에 배포된 기존 모델과 비교 가능한 수준으로 위험을 낮춤
- 유해 결과로 이어진 우려스러운 비범용 탈옥은 공개받은 바 없으며, 공개된 잠재 탈옥들은 전부 무해한 응답이거나 Mythos 고유 이점이 없는 경미한 발견에 불과함
정부 제출 증거에 대한 검증
- 현재까지 정부는 구두 증거만 제시했으며, 그 내용은 모델에 특정 코드베이스를 읽고 소프트웨어 결함을 수정하도록 요청하는 좁은 범위의 비범용 탈옥임
- 정부에 공유된 잠재 탈옥은 하나로 파악되며, 명령의 근거로 추정되는 보고서를 검토한 결과 제시된 역량 수준이 OpenAI의 GPT-5.5 등 다른 모델에서도 널리 이용 가능함을 확인함
- 해당 역량은 시스템을 지키는 방어자들이 매일 사용하는 수준임
- 향후 24시간 내 추가 세부사항을 공유 예정
Anthropic의 대응과 입장
- 정부의 법적 명령을 준수해 전체 사용자 대상 Fable 5·Mythos 5 접근을 제거함
- 다만 좁은 범위의 잠재 탈옥 발견이 수억 명에게 배포된 상용 모델 회수의 사유가 되는 데는 동의하지 않음
- 동일 기준을 업계 전반에 적용 시 모든 프런티어 모델 제공자의 신규 모델 배포가 사실상 중단될 것으로 봄
- 정부가 안전하지 않은 배포를 차단할 권한은 가져야 하나, 이는 투명·공정·명확하며 기술적 사실에 근거한 법적 절차의 일부여야 하며 이번 조치는 그 원칙에 부합하지 않음
- 고객 혼란에 사과하며, 이를 오해로 보고 가능한 한 빠른 접근 복구를 추진 중
댓글과 토론
몇번을 봐도 그동안 호들갑 떨면서 우리모델은 위험하다 계속 이야기했으니 제 발등 찍은게 아닌가 싶네요.
이게 마케팅의 성공일지 실패일지는 미래는 모르겠는데 당장은 실패로 보이네요.
펜타곤 사건 이후 엔트로픽 유저 유입을 생각해보면 IPO 앞둔 이 시점에서 절대 엔트로픽 손해볼 일은 아니라고 생각합니다.
가드레일등의 이슈를 덮기에도 애초에 모델을 서비스를 안해버리면 더이상 검증이 안될테니 안성맞춤일테고요.
Hacker News 의견들
-
모델을 남들보다 훨씬 앞선 것처럼 팔려고 계속 공포 마케팅을 해왔으니 이제 대가를 치르게 된 셈임
마침내 그 말을 믿어줄 적절한 바보들을 청중으로 찾은 듯함- IPO를 앞두고 자기들 모델이 얼마나 무섭고 강력한지 트윗할 수 있으니, Anthropic 입장에선 좋은 홍보임
- 이건 Anthropic만의 문제가 아님. 권력 다툼이고, 이 기술을 쓰는 모두가 손해를 봄. 기뻐할 일이 아님
- 대가라니? 이건 그들이 바랄 수 있었던 최고의 마케팅임
- 이 내용을 보면 Trump 행정부는 “공포 마케팅”이 없었어도 Anthropic을 겨냥했을 가능성이 커 보임
현재까지 정부가 우리에게 제시한 것은 잠재적으로 좁고 보편적이지 않은 jailbreak에 대한 구두 증거뿐이며, 본질적으로는 모델에게 특정 코드베이스를 읽고 소프트웨어 결함을 고치라고 요청하는 방식입니다. 우리가 이해하기로는 잠재적 jailbreak 하나가 정부와 공유되었습니다. 우리는 그 보고서를 검토했고, 거기서 드러난 능력 수준이 다른 모델들, OpenAI의 GPT-5.5를 포함해, 널리 제공되는 수준이며 시스템을 안전하게 지키는 방어자들이 매일 사용하는 것임을 확인했습니다
- Anthropic이 원했던 건 이런 조치였고, 자신들을 포함해 강력한 모델을 출시하는 다른 프런티어 모델 제공사 모두에게 적용되길 원했음
우리가 공개적으로 밝혔듯, 정부는 투명하고 공정하며 명확하고 기술적 사실에 기반한 법정 절차의 일부로 안전하지 않은 배포를 차단할 수 있어야 한다고 믿습니다. 이번 조치는 그런 원칙을 따르지 않습니다
결국 그들이 원하던 걸 얻은 셈임
-
수많은 기업과 사용자가 중국 모델에 더 강하게 베팅하는 소리가 들리는 듯함
다른 국가들이 이런 모델에 접근하는 게 미국의 국가안보 문제가 될 수는 있음. 하지만 이제 다른 나라가 이런 모델, 더 넓게는 미국 기술 전반에 의존하는 것도 똑같이 국가안보 문제가 됨- 어떤 모델을 말하는 건지 궁금함. 더 구체적으로 어떤 가설을 내놓을 수 있는지 알고 싶음. Anthropic 사용자의 20~50%가 DeepSeek로 빠진다는 얘기인지?
- 가장 큰 Qwen 3.7은 닫힌 모델 아닌가? 중국의 정책도 여기서는 무자비하지 않을 거라고 보긴 어려움
- 중국 모델을 다운로드하거나 사용하는 것까지 불법이 되는 날을 기다려 보라, 반쯤은 농담임
-
논리적으로 보면 미국이 대중에게 공개 허용하는 모델 능력의 상한에 도달했다는 결론밖에 안 남는 것 아닌가? 이런 선례가 생겼는데 왜 더 똑똑한 모델에 투자하겠나
더 중요할 수도 있는 건, Opus 대비 기껏해야 점진적 개선인 Mythos 같은 모델이 이런 취급을 받는다면, ASI/AGI/훨씬 더 나은 모델을 전제로 한 모든 AI 투자는 어떻게 회수되느냐는 점임- 더 그럴듯한 결론은 행정부가 Anthropic에 화가 나서, 손에 잡히는 도구로 보복성 대응을 하고 있다는 쪽으로 보임
OpenAI나 Grok이 같은 수준으로 운영되고 있었다면 정부의 날카로운 몽둥이를 맞지는 않았을 것 같음 - 그렇게 보진 않음. 한때 PlayStation 2도 수출하기엔 너무 강력하다고 여겨졌음: https://www.pcmag.com/news/20-years-later-how-concerns-about...
ChatGPT 2도 한때는 공개하기엔 너무 강력하다고 여겨졌음
AI는 문화와 사고방식보다 빠르게 움직여 왔음. 우리가 이 모델들이 할 수 있는 일에 적응하고 나면 조금 느슨해지고, 그다음 단계적 개선이 다시 모든 걸 반복하게 만들 것임. 항상 이런 식으로 흘러감 - 앞으로 최고의 프런티어 모델은 부유층에게만 통제된 형태로 제공될 거라고 봄
- 이 “기술”은 새 모델을 학습시킬 만큼 돈이 충분한 누구에게나 가능함. 그러니 이 거품이 곧 터지는 것과 별개로, 몇 달만 기다리면 비슷한 모델을 가진 다른 누군가가 나올 것임
이건 대규모 언어 모델을 둘러싼 미국식 스펙터클의 결과임. 이번엔 그게 역효과를 낸 것뿐임 - 월요일 아침까지 이 조치가 뒤집힐 확률이 95% 라서, 그게 답임
- 더 그럴듯한 결론은 행정부가 Anthropic에 화가 나서, 손에 잡히는 도구로 보복성 대응을 하고 있다는 쪽으로 보임
-
앞으로 모델이 정말 위험하든 아니든, 미래 모델에 대한 위험성 주장은 이제 사라질 듯함
정부가 미국 안팎의 모든 외국인에게 무작위로 모델 사용 중단을 명령할 수 있다면, 누구도 이 모델 위에 중요한 것을 구축하려고 위험을 감수하지 않을 것임. 결국 외국 기업이 따라잡아 이런 모델의 상업 시장을 가져가는 건 시간문제임. 다만 미국은 흔히 그러듯 경쟁자를 금지할 테니, 실제로는 미국에서만 백엔드가 다른 모델을 쓰는 상황이 될 수도 있음- 이건 “점점 더 큰 모델의 수익화”를 전제로 한 반도체 붐이 끝나는 쪽에 더 가까워 보임. 미국 정부가 어떤 모델이 “너무 좋아졌다”는 이유로 변덕스러운 명령을 내려 수익화를 막으면, 전체 야바위판이 무너짐
전 세계적 석유 부족, 비료 부족, 거품 확장에 대한 서툰 개입까지 겹친 이런 때에, 법치를 경멸하고 스물두 명의 전문의를 둔 80대 노망난 stable genius가 운전대를 잡고 있음에 감사해야 할 지경임 - 글을 읽어보면 jailbreak 방지가 훨씬 더 엄격해지고 오탐도 많아질 가능성이 커 보임
우리는 오늘 오후 5시 21분(동부시간)에 정부로부터 지시를 받았습니다. 서한에는 국가안보 우려의 구체적 세부사항이 담겨 있지 않았습니다. 우리가 이해하기로 정부는 Fable 5를 우회하거나 “jailbreak”하는 방법을 알게 되었다고 보고 있습니다. 우리는 이 특정 기법이 이전에 알려진 소수의 경미한 취약점을 식별하는 데 사용되는 시연을 검토했습니다. 이 취약점들은 모두 비교적 단순해 보이며, 다른 공개 모델들도 우회 없이 발견할 수 있음을 확인했습니다
- 그런 경우라면 많은 미국인은 그 위에 중요한 걸 구축할 위험을 감수할 것 같음
- 이건 “점점 더 큰 모델의 수익화”를 전제로 한 반도체 붐이 끝나는 쪽에 더 가까워 보임. 미국 정부가 어떤 모델이 “너무 좋아졌다”는 이유로 변덕스러운 명령을 내려 수익화를 막으면, 전체 야바위판이 무너짐
-
대기업이나 어느 정도 규모가 있는 조직 입장에서는, 이런 일로 인프라의 핵심이 갑자기 비활성화될 수 있다는 위협을 감당하기 어려움. 온프레미스와 오프라인 접근에 대한 압력이 압도적으로 커질 것이고, 가중치 라이선스든 TEE/CC 같은 제한된 환경이든 누군가는 그 수요를 채울 것이라고 봄
- 파레토 전선 위의 여러 지점이 생길 가능성이 큼
일부는 더 큰 위험을 감수해 이기거나 지고, 다른 쪽은 더 안전하게 움직이며 천천히 성과를 쌓거나 도태될 것임
이 모델들이 회사 업무를 운영하는 코드를 쓰게 하거나, 에이전트처럼 운영하게 하는 위협은 말할 것도 없음. 자신의 이익과 정반대에 있는 행위자, 기업이든 국가든, 가 학습시킨 모델일 수도 있음
이제 고려할 게 많아졌고, 사업하기엔 흥미로운 시기임 - 온프레미스와 오프라인 접근 수요가 압도적일 것이라는 데는 동의하지만, Big AI가 우리 대부분이 그걸 돌릴 하드웨어를 감당할 수 없게 만들어놨다는 점이 문제임. RAM, NVMe 같은 것들 말임
- 바로 이 이유 때문에 장기적으로는 중국 오픈 모델이 이길 거라고 봄. 큰 그림에서 능력 차이는 극적이지 않은데, 직접 실행할 수 있다는 사실은 엄청난 판매 포인트임
중국 회사에서 오픈 모델을 빌려 쓰더라도, 접근을 끊거나 약관을 마음에 들지 않게 바꾸면 온프레미스로 전환할 수 있음. 귀찮을 수는 있어도 생존을 위협하진 않음. 반면 닫힌 모델에 의존하다가 끊기면 큰 고통에 빠짐
여기서 큰 그림은 인프라 지배력임. 중국 모델은 사람들이 실제로 쓰는 모델이 되면서 표준을 정하게 될 것임. 그러면 더 많은 연구, 더 많은 도구, 그리고 그 주변의 전체 생태계가 형성됨
이번 소동 전에도 중국 모델이 전 세계에서 가장 많이 쓰이는 모델이 되면서 이미 그런 흐름이 시작되고 있었음. https://www.indiatoday.in/amp/technology/features/story/clau...
- 파레토 전선 위의 여러 지점이 생길 가능성이 큼
-
이 시대의 여명은 이란부터 온라인 연령 확인 체제까지 어디서나 보이며, 이것은 시작일 뿐입니다. 앞으로의 세계는 기술적으로는 초현대적이고 심지어 미래적이면서도, 구조적으로는 중세처럼 느껴질 것입니다. 그것은 Frank Herbert의 세계입니다. 하나의 규범적 공간 안으로 모두를 보편적으로 포함하는 방식이 아니라, 보호·수탈·통제된 접근의 구역들이 겹치는 형태로 조직될 것입니다
https://turbulence.substack.com/p/the-gated-age -
자기 제품이 얼마나 위험한지 오랫동안 떠들면, 위험한 제품을 시장에서 막을 권한을 가진 사람들이 그 말을 들을 수도 있음
특히 그 사람들이 지금 그다지 똑똑하지 않고, 별개의 권위주의적 목표 달성을 도와주지 않는다는 이유로 이미 Anthropic에 화가 나 있다면 더 그렇다
이게 Anthropic의 3차원 체스라고는 생각하지 않음. 그들은 자신들이 되고 싶어 하는 것과 달리 배후의 천재 전략가가 아님. 실제로 제품을 써본 사람들은 Fable과 Mythos가 종말 장치가 아니라 점진적 개선이라는 걸 앎. 이건 처벌을 좋아하는 행정부의 징벌적 조치이고, Anthropic이 자기들의 어리석은 수사로 의도치 않게 그 근거를 보강해준 것이라고 봄 -
이 일이 오늘 동부시간 5시 21분에 일어났다고 되어 있음
페이지에는 2026년 6월 11일이 표시돼 있었고, 지난 10분 사이에 2026년 6월 12일로 업데이트됐음
https://imgur.com/a/lx7HCW9
Google은 이 페이지가 며칠 전에 크롤링됐다고 보여줌
“the us government directive to suspend access to fable”로 검색해보면 됨3 days ago — The US government has issued an export control directive to suspend all access to Fable 5 and Mythos 5.
https://imgur.com/a/KQrYPMh- 그건 출시 블로그 글임. Google은 아마 하단의 Related Content 섹션에서 스니펫을 가져온 것 같고, 거기에 미국 정부 지시에 관한 글이 포함되어 있음
- 이 스레드도 똑같이 표시됨
https://imgur.com/a/EOWWUbD - Google이 며칠 전에 크롤링했다는 정보는 어디서 나온 건가? imgur 캡처는 증거로는 가장 약한 편임. 최소한 archive.today를 쓰거나, Google이 크롤링했다는 증거 자체를 캡처해야 함
-
우리는 그 보고서를 검토했고, 거기서 드러난 능력 수준이 다른 모델들, OpenAI의 GPT-5.5를 포함해, 널리 제공되는 수준이며 시스템을 안전하게 지키는 방어자들이 매일 사용하는 것임을 확인했습니다. 앞으로 24시간 안에 더 자세한 내용을 공유하겠습니다
Mythos가 GPT 5.5를 크게 능가한다던 온갖 수사는, 특히 사이버보안에서는, 이걸로 김이 빠짐. 물론 AISI 벤치마크도 이미 그렇게 보여줬지만, 이제 Anthropic이 자기들에게 유리할 때 그 말을 한다는 게 흥미로움- 다른 모델들이 전반적으로 같은 능력 수준이라고 말하는 게 아님. 미국 정부가 테스트한 특정 능력이 다른 모델에도 있다는 뜻임
- 이건 정부가 문제 삼은 특정 능력에 관한 얘기지, Fable의 전반적 능력에 관한 게 아님. 이번 주에 Fable을 매우 복잡한 작업에 써본 개인적 경험으로는, 적어도 소프트웨어 공학에서는 다른 어떤 모델보다 훨씬 강력했음
- 이 일로 5.5가 금지되면 정말 화가 날 것 같음
- 다른 모델과의 비교는 정부 사례에서 jailbreak로 완료하게 한 문제들에 한정한 것이지, 우회 없이 악용할 수 있는 모든 취약점에 대한 말은 아님
-
미국에 있거나 Anthropic 직원이더라도, 어느 나라 출신이든 외국 국적자는 사용하지 못하게 하는 건 지나치게 넓고 가혹해 보임. 그것도 겉보기엔 사소한 잠재적 jailbreak 취약점 하나 때문이라니, 뭔가 보이는 것 이상이 있음
- 누가 계속 사용할 수 있는지의 범위는 ITAR나 EAR 같은 다른 미국 수출통제와 맞춰져 있는 것처럼 들림
- 맞음. 이 정부가 섬세함으로 유명하진 않으니까…
- 안타깝지만 수출통제는 원래 이런 식으로 작동함. 국립연구소에서 일하더라도 외국인 연구자를 국가안보 관련 영역에 들이지 않는 건, 취할 수 있는 가장 쉬운 보안 조치이기 때문임
연구자나 연구 자체에 좋은 결과라는 뜻은 아님. 미국이 지시한 자금 사용에 대한 보험에 가까움 - DoD와 Anthropic 사이에 남아 있는 앙금도 있음. 미국 정부 최고위층의 전반적 성숙도를 생각하면, Mythos가 Hegseth 일당이 보복할 좋은 핑계가 됐다는 쪽에 꽤 걸어볼 만함