Anthropic의 Claude Code 사용자당 5천 달러 비용 주장은 사실이 아님
(martinalderson.com)- Forbes가 인용한 Claude Code Max 요금제의 5천 달러 계산은 실제 컴퓨트 비용이 아닌 API 소매가 기준임
- OpenRouter의 Qwen 3.5 397B와 Kimi K2.5 모델 가격을 비교하면, Anthropic API 요금의 약 10분의 1 수준에서 유사 규모 모델이 운영되고 있음
- 이 기준으로 계산하면, Anthropic의 실제 추정 비용은 약 500달러, 즉 일부 고사용자에게 월 300달러 손실 수준에 불과함
- 대부분의 사용자는 토큰 한도에 도달하지 않으며, 평균 사용량 기준으로는 손익분기점 또는 이익 구조임
- AI 추론 비용이 과도하다는 인식은 오해이며, 이는 대형 AI 기업의 높은 API 마진을 정당화하는 데 이용되고 있음
Forbes의 5천 달러 주장 검증
- Forbes는 Cursor 관련 기사에서 Anthropic의 200달러 요금제가 5천 달러 상당의 컴퓨트 사용을 허용한다고 인용함
- 해당 인용은 “회사의 컴퓨트 사용 패턴 분석을 본 사람”의 발언으로 소개됨
- 이 수치는 API 소매가 기준 계산으로, 실제 컴퓨트 비용과는 다름
- Anthropic의 Opus 4.6 API 요금은 입력 100만 토큰당 5달러, 출력 100만 토큰당 25달러로 책정되어 있음
- 이 요율로 계산하면, 무거운 사용자는 월 5천 달러 상당의 API 사용량에 도달 가능
실제 컴퓨트 비용 추정
- OpenRouter에서 유사 규모의 Qwen 3.5 397B-A17B 모델은 입력 100만 토큰당 0.39달러, 출력 2.34달러 수준
- Kimi K2.5 모델은 입력 0.45달러, 출력 2.25달러로 더 저렴
- 이는 Anthropic API 요금 대비 약 10배 저렴한 수준
- 캐시 토큰 비용도 유사한 비율로 차이남
- 예: DeepInfra의 Kimi K2.5 캐시 읽기 비용은 0.07달러/MTok, Anthropic은 0.50달러/MTok
- 따라서 실제 컴퓨트 비용은 API 요금의 약 10% 수준으로 추정 가능
Claude Code Max 사용자의 실제 비용
- API 요금 기준으로 5천 달러 상당의 토큰을 사용하는 사용자의 실제 비용은 약 500달러 수준
- 이 경우 Anthropic은 월 300달러 정도 손실
- 그러나 Anthropic은 5% 미만의 사용자만 토큰 한도에 도달한다고 밝힘
- 일반 사용자는 평균적으로 50% 미만의 토큰 사용량
- Anthropic의
/cost데이터에 따르면, 평균 사용자는 일일 6달러 수준의 API 사용량, 90%는 12달러 이하- 실제 비용 기준으로 월 약 18달러로, 20~200달러 구독 요금 대비 수익성 확보 가능
Cursor와의 비용 차이
- 5천 달러 수치는 Cursor의 내부 분석 결과에서 비롯됨
- Cursor는 Anthropic의 소매 API 요금으로 Opus 4.6을 사용해야 함
- 따라서 Cursor 입장에서는 파워 유저 1인당 월 5천 달러 비용이 발생 가능
- 반면 Anthropic의 실제 비용은 약 500달러 수준
- Cursor는 개발자들이 Anthropic 모델을 선호한다는 점에서 어려움을 겪고 있음
Anthropic의 수익 구조와 오해
- Anthropic은 여전히 훈련 비용, 인건비, 대규모 컴퓨트 투자 등으로 인해 전체적으로는 적자 구조
- 그러나 토큰 단위 추론(inference) 비용은 수익성이 높을 가능성이 큼
- “AI 추론은 적자 사업”이라는 인식은 API 가격의 과도한 마진을 정당화하며, 경쟁을 위축시킴
- 실제 추론 경제를 이해하려면 OpenRouter의 공개 모델 가격을 참고하는 것이 현실적임
- 이는 대형 AI 기업의 API 요금 대비 실제 비용의 일부 수준에 불과함
Hacker News 의견들
-
Qwen 3.5 397B-A17B를 Anthropic 모델과 비교하는 건 엉터리 비교임
Qwen이나 DeepSeek 같은 중국 모델들은 Anthropic보다 10배 이상 효율적이라 알려져 있음
OpenRouter 가격과 공식 제공가의 차이가 크지 않은 이유도 여기에 있음. 게다가 OpenRouter 제공자들이 어떤 양자화(quantization) 기법을 쓰는지도 불분명함. 실제로는 100배 효율을 내는지도 모름
물론 모든 사용자가 플랜을 최대치로 쓰는 건 아니기에, 사용자당 5,000달러씩 손실이 나는 건 아님- 그건 순환논리임. 중국 모델이 10배 효율적이라 믿는 이유가 단지 10배 싸기 때문임
Amazon Bedrock의 Opus 4.5와 중국 모델들의 t/s 수치를 보면 비슷한 수준이라, 실제 활성 파라미터 수도 비슷함
OpenRouter에서는 BF16이나 Q8 제공자를 직접 선택할 수도 있음 - 동의하지만, Opus 4.6이 10배 더 큰 모델일 가능성이 높음. GPT-4가 이미 1.6T 모델이고 Llama 4도 훨씬 큼
중국 기업들은 GPU가 부족하지만 추론 효율화에서 많은 혁신을 이뤘음. DeepSeek CEO인 Liang도 관련 논문 저자 명단에 있음 - Qwen 같은 오픈소스 모델을 Anthropic과 비교하는 건 무의미함
Anthropic은 모델 구조나 파라미터 수를 공개한 적이 없음
오픈소스 모델들은 대부분 다른 모델을 증류(distill)하거나 MoE를 써서 계산비용을 줄임
Qwen을 비교 기준으로 삼은 블로그 글은 신뢰하기 어려움 - Opus는 TPU를 활용해 더 낮은 비용을 달성했을 수도 있음
- OpenRouter 제공자 섹션에 양자화 정보가 표시되어 있음
- 그건 순환논리임. 중국 모델이 10배 효율적이라 믿는 이유가 단지 10배 싸기 때문임
-
원문 기사에 따르면, Cursor는 작년에 월 200달러짜리 Claude Code 구독이 최대 2,000달러의 컴퓨팅을 사용한다고 추정했음
지금은 그 보조금이 더 커져서, 같은 플랜이 약 5,000달러의 컴퓨팅을 소비할 수 있다고 함- “이건 모든 걸 바꾸는 정보임”이라는 반응이 나옴
-
많은 사람들이 OpenAI와 Anthropic이 토큰을 손해보고 판다고 믿지만, 실제 증거는 거의 없음
Forbes의 부정확한 기사 때문에 이런 밈이 퍼졌음. 그 기사는 API 비용과 컴퓨팅 비용의 차이조차 이해하지 못함- 하지만 실제로는 손해 판매 증거가 없다고 단정하기도 어려움
Anthropic이 CC 외부 사용을 막는 점, API 지출 한도가 5,000달러인 점 등을 보면 수익성이 낮을 가능성도 있음 - “토큰만 파는 회사가 손해를 안 볼 수 있겠냐”는 주장도 있음
연구·훈련·인프라 인건비 모두 토큰 생성 비용에 포함되어야 함
오픈웨이트 모델의 낮은 가격은 시장 점유율 확보용 덤핑 때문이며, 실제 비용은 더 높음
결국 이 구조는 오래 지속되지 못할 것임 - Anthropic이 토큰당 손해를 보는지보다, 훈련비용이 얼마나 드는지가 더 중요함
모델이 지속적으로 훈련되지 않으면 토큰 가치가 떨어짐 - 참고로 관련 문서가 여기에 있음
- 하지만 실제로는 손해 판매 증거가 없다고 단정하기도 어려움
-
우리 팀이 Claude Code를 API로 쓴다면 월 20만 달러가 들겠지만, 실제로는 Max 구독으로 월 1,400달러만 냄
사용자당 5만 달러 수준이지만, JSON 토큰 수를 보면 대부분 캐시된 요청이라 실제 비용은 훨씬 낮을 듯함- 어떤 일을 그렇게 효율적으로 분배하는지 궁금함. 나도 Claude를 많이 쓰지만 한계가 금방 옴
- Gemini CLI는 세션별 캐시 절감율을 보여주는데 보통 90% 정도임
- 나도 여러 Claude 에이전트를 돌리는데, 입력 토큰의 85%가 캐시 읽기임
실제 비용은 2.5만~3만 달러 수준일 듯. Forbes의 5천 달러 추정은 과장임 -
npx ccusage로 로컬 로그를 확인하면 API 기준 비용을 계산할 수 있음 - 그런데 Max 플랜을 회사 용도로 쓰는 게 약관 위반 아닌가 궁금함
-
Anthropic의 컴퓨팅이 완전히 포화 상태라면, Claude Code의 파워 유저는 사용자당 5,000달러의 기회비용을 발생시킬 수 있음
하지만 이런 비교는 Rolex와 무명 시계의 기어 수를 비교하는 것만큼 부적절함- 기회비용은 실제 비용이 아님. Anthropic이 구독을 못 팔 정도로 포화된 상태인지가 핵심임
- GPU 팜이 완전히 활용될수록 배칭(batch) 효과로 오히려 단가가 낮아짐
- “기회비용”이란 말을 엔터테인먼트 업계도 자주 쓰지만, 실제로는 소비가 줄어드는 게 현실임
Anthropic도 마찬가지로, 사용자가 불확실한 품질에 의문을 품거나 API 기반 과금으로 전환할 가능성이 큼 - “100달러 구독으로 Opus를 넉넉히 쓰는 내 상황이 유지되길 바람”이라는 농담도 나옴
-
추론 비용과 이익률은 오픈웨이트 모델과 대형 클라우드 제공자 간에 큰 차이가 있음
제약 산업의 R&D 비용과 제네릭 생산비 차이와 비슷함
OpenAI의 추론 마진은 약 70%, Anthropic은 40~90%로 추정됨
관련 기사: Phemex, SaaStr, The Information, Investing.com- “이익(profit)”이라는 단어를 너무 쉽게 쓰지 말자는 의견임
회계 기준상으로는 이미 모델당 수익이 훈련비를 상쇄했을 수도 있음
다만 현금흐름 기준으로는 아직 cashflow positive가 아님
이런 차이를 이해하지 못하면 AI 산업 전체를 과소평가하게 됨
- “이익(profit)”이라는 단어를 너무 쉽게 쓰지 말자는 의견임
-
Opus 4.6의 모델 크기가 얼마나 되는지 확신이 없음
Qwen397B보다 훨씬 클 거라 추정함- Musk가 Grok이 수조 개 파라미터라고 밝힌 걸 보면, Opus도 그 수준일 가능성이 큼
Anthropic이 API로 돈을 벌고는 있겠지만 90% 마진은 아닐 듯함 - OpenRouter의 DeepSeek v3.2(685B/37B active)는 $0.26/0.40, Kimi K2.5(1T/32B active)는 $0.45/2.25로 책정되어 있음
- 전문가라면 Opus가 1~2조 파라미터일 거라 추정함
- Musk가 Grok이 수조 개 파라미터라고 밝힌 걸 보면, Opus도 그 수준일 가능성이 큼
-
캐시는 거의 무료에 가깝지만, 실제로는 완전히 공짜가 아님
캐시 토큰 비용을 빼면 $200 구독의 실제 컴퓨팅 사용량은 약 $800 수준으로 떨어짐
대부분의 컴퓨팅은 유휴 상태일 가능성이 높음- 하지만 캐시는 RAM을 계속 점유하므로 완전히 무료는 아님
캐시가 적중하지 않으면 그만큼 기회비용이 발생함 - 캐시 덕분에 더 많은 사용자에게 프리미엄 가격으로 추론을 팔 수 있는 구조라, 사실상 수익 극대화 수단임
- 유휴 컴퓨팅이 아니라면, 그 자원을 모델 훈련이나 연구 실험에 쓸 수도 있음
- 하지만 캐시는 RAM을 계속 점유하므로 완전히 무료는 아님
-
Cursor는 Anthropic의 리테일 API 가격으로 Opus 4.6을 사용해야 하므로, 파워 유저당 월 5,000달러가 들 수 있음
반면 Anthropic의 실제 비용은 500달러 수준일 것임
최근 Swix 팟캐스트에서 Cursor의 클라우드 에이전트 전략을 들었는데, 진입장벽이 낮아지고 있음 -
Claude 구독은 스팟 인스턴스 개념에 가까움
API는 온디맨드 서비스이고, 우선순위는 API에 있음
남는 컴퓨팅은 구독 사용자에게 배정되며, 용량이 부족하면 양자화된 저가 모델로 라우팅됨
이런 구독은 유휴 자원을 활용하고, 예측 가능한 워크플로우로 모델 훈련 품질을 높이는 역할도 함
Qwen Code, Codex, Claude를 모두 써봤는데, Codex는 Qwen보다 2배, Claude는 Codex보다 2배 나았음
그래서 Claude Opus는 Qwen Code보다 4~5배 비쌀 거라 예상함- “Claude가 Codex보다 2배 낫다”는 건 지금은 사실이 아님
- “용량 부족 시 저가 모델로 라우팅된다”는 부분은 공식적으로 발표된 적 없음