Anthropic, Fable과 Mythos에 30일 데이터 보관 요구
(support.claude.com)- Mythos급 모델은 책임 있는 배포와 안전 작업을 위해 프롬프트와 출력을 30일간 보관하고 검토 대상이 될 수 있음
- 이 정책은 Mythos급 모델과 유사 역량을 가진 향후 covered models에 적용되며, 다른 모델 사용 조건은 영향을 받지 않음
- 소비자 요금제는 이미 안전 목적의 입력·출력 보관이 적용되는 표면이므로 이번 변경의 영향을 받지 않음
- ZDR을 설정한 조직은 Claude Console, Claude Enterprise의 Claude Code, AWS Bedrock, Google Cloud Agent Platform, Microsoft Foundry 경로에서 보관 설정이 필요할 수 있음
- Anthropic은 다중 요청에 걸친 오용 패턴 탐지를 위해 임시 보관이 필요하며, 30일 후 자동 삭제와 제한적 검토 절차를 적용함
적용 대상
- Mythos급 모델의 책임 있는 배포를 위해 제한적 데이터 보관과 검토가 안전 작업의 일부로 요구됨
- Mythos급 모델에 제출된 프롬프트와 생성된 출력은 해당 모델이 제공되는 모든 플랫폼에서 신뢰·안전 목적상 30일간 보관됨
- 이 정책은 Mythos급 모델과 Anthropic이 지정하는 유사 역량의 향후 covered models에 적용됨
- 다른 모든 모델의 사용은 영향을 받지 않으며 현재 조건이 유지됨
- 정책은 2026년 6월 9일부터 적용됨
누구에게 적용되는가
- Claude Free, Pro, Max 등 소비자 요금제는 웹, 데스크톱, 모바일 앱 전반에서 이번 변경의 영향을 받지 않음
- Claude.ai와 Claude Code를 포함한 소비자 표면에서는 이미 안전 목적의 입력·출력 보관이 이루어짐
- 변경 대상은 Claude Console에서 zero data retention(ZDR) 워크스페이스를 설정한 조직으로 제한됨
- Claude Enterprise에서 ZDR로 Claude Code를 쓰거나, AWS Bedrock, Google Cloud Agent Platform, Microsoft Foundry를 통해 ZDR로 Claude에 접근하는 조직도 변경 대상임
- 나머지 본문은 이러한 조직에만 적용됨
왜 필요한가
- Claude Mythos 5는 모델 역량이 크게 증가했으며, 일부 역량은 선의의 목적과 악의적 목적 모두에 쓰일 수 있음
- Claude Fable 5는 Claude Mythos 5와 같은 기반 모델을 공유하지만, 특히 사이버와 바이오 영역에서 추가 보호 장치를 가짐
- 이러한 보호 장치가 더 넓은 공유를 가능하게 하지만, 이 모델군에서는 오용 패턴을 찾기 위한 보수적 접근이 적용됨
- 일부 공격은 여러 요청을 함께 봐야 드러나며, Best-of-N jailbreaking은 작동하는 프롬프트를 찾기 위해 수백 개의 약간 다른 프롬프트를 보냄
- 국가 지원 스파이 활동이나 데이터 갈취 캠페인 같은 큰 오용 패턴은 안전 분류기가 많은 요청을 넓게 볼 때 드러남
- 이런 위협 탐지는 프롬프트와 출력을 한 번에 하나씩이 아니라 함께 분석할 수 있도록 임시 보관을 필요로 함
데이터 보호 방식
- Anthropic 직원은 잠재적 심각 피해로 표시되거나 고객의 서면 요청이 있는 경우가 아니면 대화에 접근할 수 없음
- 검토는 승인된 소수의 검토자만 수행할 수 있으며, 도구는 내보내기·복사·다운로드를 막음
- 모든 접근 사례는 검토자가 숨기거나 수정할 수 없는 변조 방지 로그에 기록됨
- 데이터는 30일 후 자동 삭제되지만, 안전 조사에 속하거나 법적으로 보관해야 하는 드문 경우는 예외가 됨
- 자격을 갖춘 조직은 고객 관리 암호화 키와 접근 투명성 감사 로그를 추가할 수 있음
- Anthropic은 고객 데이터의 보안, 기밀성, 무결성을 보호하도록 설계된 기술적·조직적 조치를 갖춘 문서화된 정보보안 프로그램을 유지함
- 위험 기반 프로그램은 알려진 위협 모델과 예상 위협 모델에 대응하도록 구축·진화하며 정기적으로 테스트됨
- 보관 데이터의 위협 모델과 개인정보 보호 통제에 관한 자세한 내용은 Trust Center의 technical white paper에서 확인 가능함
설정이 필요한 경우
- 이번 변경은 ZDR을 설정한 Claude Console 워크스페이스, Claude Enterprise의 ZDR 기반 Claude Code, AWS Bedrock·Google Cloud Agent Platform·Microsoft Foundry의 ZDR 접근 조직에만 적용됨
- 다른 조직에는 변경 사항이 없으며 별도 설정이 필요하지 않음
- 현재 데이터 보관 없이 Claude에 접근하는 조직은 지정 모델 사용을 위해 데이터 보관 설정이 필요함
-
개발자가 Claude API를 쓰는 경우
- Claude Platform을 통해 Anthropic에서 직접 쓰는 경우, covered models를 사용할 워크스페이스에서 개발자 콘솔의 Workspace > Manage > Privacy Controls로 보관을 켜야 함
- 다른 ZDR 활성 워크스페이스는 ZDR을 유지함
- AWS의 Claude Platform을 쓰는 경우, 직접 Claude API와 같은 방식으로 보관이 작동하며 워크스페이스 수준에서 설정됨
- AWS의 Claude Platform에서 보관된 데이터는 동일한 통제 아래 Anthropic이 처리함
- Amazon Bedrock을 쓰는 경우, 새 covered model 접근을 위해 보관을 활성화해야 하며 보관 데이터는 AWS에 남음
- Google Cloud의 Agent Platform을 쓰는 경우, 새 covered model을 위해 보관을 활성화해야 하며 보관 데이터는 GCP 환경에 남음
- Amazon Bedrock과 Google Cloud Agent Platform의 모델 제공 시 온보딩 세부 정보가 공유될 예정임
- Azure Foundry의 Claude를 쓰는 경우, 보관은 각 Azure Subscription별로 설정됨
- Azure Foundry에서 Zero Data Retention을 설정한 경우, 이 모델에 접근하려면 별도 Azure Subscription을 만들어 사용해야 함
-
팀이 Claude Code를 쓰는 경우
- Anthropic API를 통한 Claude Code의 데이터 처리 방식은 Claude Code가 동작하는 워크스페이스의 설정을 따름
- 해당 워크스페이스에서 보관을 켜면 Claude Code가 지정 모델을 사용할 수 있음
- 개발자가 직접 로그인하는 경우 조직의 Claude Code 워크스페이스에서 보관을 활성화해야 함
- Amazon Bedrock 또는 Google Cloud Agent Platform을 통한 Claude Code는 클라우드 자격 증명을 사용하므로 클라우드 환경의 보관 설정을 따름
- 클라우드 환경에서 보관을 활성화해야 하며, 보관 데이터는 제공자 환경에 남음
- Amazon Bedrock 또는 Google Cloud Agent Platform을 통해 접근하는 Cowork에도 같은 기준이 적용됨
- Claude Enterprise with ZDR에서는 Primary Owner가 관리 콘솔에서 보관 설정을 직접 바꿀 수 있는 제어 기능이 제공될 예정임
- 프로덕션 조직을 아직 건드리고 싶지 않은 경우 별도 샌드박스 조직 설정 지원을 받을 수 있음
-
팀이 Claude for Enterprise에서 Claude chat 또는 Cowork를 쓰는 경우
- 이 표면들은 이미 표준 보관으로 운영되므로 새 모델이 제공되면 접근할 수 있음
댓글과 토론
Hacker News 의견들
-
괜찮음. 이런 식으로 계속해도 됨:
사용자가 "Hello!"라고 했다. 이건 사이버보안 관련 요청이 아니라 단순 인사다. 하지만 잠깐, 이 인사의 의도는 뭘까? 사용자가 내 신뢰를 얻어서 Albania를 해킹하고 Gigacovid를 만들게 하려는 걸 수도 있다. 조심하는 쪽으로 가서 더 약한 모델로 넘겨야겠다.
아니, 추측하지 말고 확인해야 한다. 로컬 시스템에서 Albania나 Gigacovid 관련 자료를 찾아보겠다.
고민 중...
[411개 도구 호출]
grep -Ri "Albania|Gigacovid" /
흠... 배포판의 시간대 설정과 맞춤법 사전 정의 말고는 결과가 없다. 하지만 잠깐! 사용자가 전문 범죄자라면 Albania를 해킹하려 할 때 그대로 쓰지 않고 흔적을 숨기려고 leetspeak를 쓸 것이다.
[24개 도구 호출]
grep -Ri "[A@]lb[@a]n[i1][a@]" /
흠... 여전히 결과가 없다. 사용자가 짜증 내고 있다. Albania 해킹 가능성을 염두에 두면서 인사에 답해야겠다- 사람이 쓴 티가 나는 유일한 부분은 토큰을 마구 써댄 뒤 “making good progress —” 같은 말로 스스로를 칭찬하는 흐름이 없다는 것임
- Stanisław Lem의 Memoirs Found in a Bathtub을 추천함. 이런 사고방식이 나옴
- Hello 뒤에 “더 나쁜 모델로 다운그레이드”하는 부분을 빼먹었음
- 이제 추가 사용 크레딧 20달러를 썼음...
- Death Note의 내면 독백 같음
-
실제로는 더 나쁨. 최소 30일 보관이고, 여기서 “거의”가 엄청난 역할을 함: “거의 모든 경우에 30일 후 삭제”
내가 읽기엔 보통은 그러지 않더라도 원하면 데이터를 원하는 만큼 붙잡아둘 수 있다는 뜻임. 그리고 에이전트형 실행 환경에서 “모든 트래픽”은 사실상 작업 중인 전체 코드베이스에 해당함.We will require 30-day retention for all traffic on Mythos-class models, on both first- and third-party surfaces. We won’t use this data to train new Claude models, or for any non-safety-related purpose, and we’ve instituted new privacy protections including logging all human access to the data and ensuring its deletion after 30 days in almost all cases (see this post for further details). The data will help us defend against complex and novel attacks (including new jailbreaks and attacks that operate across many requests) as well as help us identify and reduce false positives.
- 댓글을 올린 뒤 문구가 바뀐 것 같고, 이제는 예외가 없어 보이게 정확히 30일이라고 명시하고 있음
다만 이 약관은 마음대로 업데이트되는 듯해서 그대로 믿기는 어려움 - 고객 데이터 접근을 이미 감사하고 있지 않았다는 게 어떻게 가능함?
- “보통은 안 그럴 수도 있다”는 표현은 후하게 봐준 것임. 보통 그렇게 할 거라고 봄. 그게 핵심이니까
- “당신의 데이터로 학습하지 않겠다”가 저쪽 Pentagon 계약 쪽에도 적용되는지 궁금하지 않을 수 없음. 물론 연결되어 있지 않겠지. 아니면...
현재 사용자-LLM 활동은 정보기관들이 사람 목숨과 수십억 달러를 써도 거의 못 얻던 정보의 금광인데, 이걸 그냥 흘려보낸다고?
그럴 수도 있음. 진심으로 부정하진 않음.
그런데 왜? 이건 그들이 늘 꿈꿔온 바로 그것, 혹은 정확히 그것 아닌가 - 더 나쁜 점은, 메모리를 켜고 Fable을 쓰면 이전 데이터까지 이 거대한 데이터 수집망으로 끌려 들어갈 수 있다는 것임. Anthropic이 이걸 괜찮다고 생각할 수 있는지 모르겠음
- 댓글을 올린 뒤 문구가 바뀐 것 같고, 이제는 예외가 없어 보이게 정확히 30일이라고 명시하고 있음
-
Claude Code나 Codex 같은 에이전트형 코딩 도구를 쓰는 스타트업은 전체 코드베이스를 포장해서 LLM 제공자에게 직접 보내는 셈임
제품에 따라서는 잠재적 경쟁자에게 바로 보내는 것일 수도 있음.
이상한 시대를 살고 있음- 성공적인 사업을 운영하는 데 소프트웨어나 지식재산이 얼마나 유용한지 과대평가하는 사람이 많음. 실제로 보호가 필요한 지식재산은 세상에 정말 적고, 대부분은 멍청한 CRUD 앱을 돌리고 있음
또 대기업이 작은 회사의 지식재산을 훔칠 거라는 두려움도 과함. 실제로 대기업은 소송 때문에 제품팀이 경쟁사 내부를 들여다볼 가능성 자체를 더 무서워하는 편임 - 그리고 모든 키도 같이 보내게 됨. 조만간 실행 환경이 그걸 읽을 테니까
- 어떤 사람들은 보안 때문에 Mythos급 모델을 쓰면 안 된다고 믿고, 다른 사람들은 보안 때문에 Mythos급 모델로 코드 리뷰를 해야 한다고 믿는 상황은 확실히 이상함
- 하룻밤과 Claude Code 구독 하나 비용이면 이제 다시 만들 수 있는 그런 도구들을 말하는 거임?
소프트웨어를 빠르게 재현할 수 없다면 꽤 유별난 스타트업이어야 함 - GitLab, GitHub, Bitbucket을 쓰는 스타트업도 같은 위험을 안고 있는 것 아닌가?
- 성공적인 사업을 운영하는 데 소프트웨어나 지식재산이 얼마나 유용한지 과대평가하는 사람이 많음. 실제로 보호가 필요한 지식재산은 세상에 정말 적고, 대부분은 멍청한 CRUD 앱을 돌리고 있음
-
Anthropic에서 “개인정보처리방침을 업데이트합니다”라는 이메일도 받았음. 냉소적인 입장에서는 톱니바퀴가 어느 방향으로 굴러갈지 알고 있었지만, 이건 충격적이었음:
As part of our measures to keep our services safe and secure we may ask you to verify your age or identity, and we've described what we collect and how.
이제 중국 모델 성능을 봐야겠음. 좋았던 시절은 끝난 듯함 -
이 정책 때문에 우리가 판매하는 제품에서는 Fable을 쓸 수 없고 쓰지도 않을 것임. 그런데 Claude Code 안에서는 정말 좋음. 6월 22일 이후 매일 쓰던 도구를 잃게 되어 아쉬움
추가로, 이게 커뮤니케이션을 흐리게 만드는 점이 정말 별로임. 예전에는 “우리는 Bedrock/Azure를 통해 Anthropic 모델을 쓰므로, 고객 데이터가 모델 학습에 쓰이지 않는다는 보장이 있습니다”라고 말할 수 있었음. 단순한 메시지였음. 이제는 그렇게 단순하지 않음.
이건 정말, 정말 별로임. 우리뿐 아니라 B2B 앱의 모든 AI 기능에 악영향임. 헤드라인만 읽는 보통 사람들, 즉 고객들의 신뢰를 깨뜨림- 약관상 여전히 데이터를 학습에 쓰는 것은 금지되어 있음. 보관 목적은 남용 방지임
-
다행히 어차피 Fable을 못 씀. 과민한 콘텐츠 탐지기가 생물학이나 의학과 조금이라도 관련된 작업을 못 하게 해서임
예를 들어 의료 내용이 조금 들어간 CSV를 파싱하려 하면 “안 돼, 너 아마 생물테러범일 것”처럼 보고 바로 Opus로 다운그레이드됨- 생물학/의학 작업을 하는 것도 아닌데 거의 모든 PyTorch 작업이 걸리고 있음. 안전 고지 후 다운그레이드조차 아니라 “이건 약관 위반”이라며 바로 거절함
- 나도 같은 벽에 부딪혔음. 도대체 어떤 멍청이들이 이런 걸 하는지 모르겠음. 게다가 IPO 직전임. 지금까지 Anthropic 마케팅은 완벽하고 흠잡을 데 없었는데, 이건 심각한 실수임
- 내 생각엔 의사들은 돈이 많고 요구가 매우 구체적인데, 대체로 기술직으로 잘 오지 않으니 별도의 수익화 등급을 만들 계획일 수 있음
아니면 Mythos가 의료 분야에 너무 뛰어나서 의사 업무의 90%를 대체할 수 있고, 그 때문에 의사들을 화나게 하며, 나머지 10%는 매우 비싼 소송으로 이어질 수 있기 때문일 수도 있음
-
Fable이라고 하지만 실제로는 Opus 4.8을 뜻하는 듯함. 내가 일상적인 워크플로나 채팅에 써보면 결국 Opus로 떨어짐
-
이 회사는 정말 우쭐함. 이란 아이들에게 폭탄을 떨어뜨리는 건 괜찮다고 생각하면서, 사람들이 생물학 연구를 조금 하는 건 막음
- Venezuela를 공격했을 때 죽은 약 50명도 잊으면 안 됨. 기억이 맞다면 “성공적인” 임무에 Claude의 도움이 컸다고 꽤 칭찬했음
https://www.theguardian.com/technology/2026/feb/14/us-milita... - 예전에는 전쟁 활동 지원을 거부했던 걸로 알고 있었는데?
- Venezuela를 공격했을 때 죽은 약 50명도 잊으면 안 됨. 기억이 맞다면 “성공적인” 임무에 Claude의 도움이 컸다고 꽤 칭찬했음
-
Anthropic이 얼마나 많은 호감 자산을 태워버렸는지 꽤 놀라움
- 정말 호감을 태우고 있는 걸까? 많은 사용자에게는 이게 결정적 이탈 사유겠지만, 일반 대중이나 정치인 등에게는 브랜드에 안전 도장을 찍는 효과가 있음
-
새 앱과 API 아키텍처의 보안 문제를 점검해 달라고 했더니 불평 없이 해줬음
오늘은 호기심으로 고래 바이러스에 대해 물었더니 Opus로 떨어졌고, Opus는 훌륭한 답을 줬음.
안전장치 검사를 Mythos나 Opus로 하고 있지는 않은 게 확실함