# Anthropic의 Claude Code 사용자당 5천 달러 비용 주장은 사실이 아님

> Clean Markdown view of GeekNews topic #27380. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=27380](https://news.hada.io/topic?id=27380)
- GeekNews Markdown: [https://news.hada.io/topic/27380.md](https://news.hada.io/topic/27380.md)
- Type: GN+
- Author: [neo](https://news.hada.io/@neo)
- Published: 2026-03-11T00:33:47+09:00
- Updated: 2026-03-11T00:33:47+09:00
- Original source: [martinalderson.com](https://martinalderson.com/posts/no-it-doesnt-cost-anthropic-5k-per-claude-code-user/)
- Points: 1
- Comments: 1

## Topic Body

- Forbes가 인용한 **Claude Code Max 요금제의 5천 달러 계산**은 실제 **컴퓨트 비용이 아닌 API 소매가 기준**임  
- OpenRouter의 **Qwen 3.5 397B**와 **Kimi K2.5** 모델 가격을 비교하면, **Anthropic API 요금의 약 10분의 1 수준**에서 유사 규모 모델이 운영되고 있음  
- 이 기준으로 계산하면, **Anthropic의 실제 추정 비용은 약 500달러**, 즉 일부 고사용자에게 월 300달러 손실 수준에 불과함  
- 대부분의 사용자는 토큰 한도에 도달하지 않으며, 평균 사용량 기준으로는 **손익분기점 또는 이익 구조**임  
- **AI 추론 비용이 과도하다는 인식은 오해**이며, 이는 대형 AI 기업의 높은 API 마진을 정당화하는 데 이용되고 있음  

---

### Forbes의 5천 달러 주장 검증
- Forbes는 Cursor 관련 기사에서 **Anthropic의 200달러 요금제가 5천 달러 상당의 컴퓨트 사용을 허용한다**고 인용함  
  - 해당 인용은 “회사의 컴퓨트 사용 패턴 분석을 본 사람”의 발언으로 소개됨  
- 이 수치는 **API 소매가 기준 계산**으로, 실제 컴퓨트 비용과는 다름  
- Anthropic의 Opus 4.6 API 요금은 **입력 100만 토큰당 5달러, 출력 100만 토큰당 25달러**로 책정되어 있음  
  - 이 요율로 계산하면, 무거운 사용자는 월 5천 달러 상당의 API 사용량에 도달 가능  

### 실제 컴퓨트 비용 추정
- OpenRouter에서 유사 규모의 **Qwen 3.5 397B-A17B** 모델은 **입력 100만 토큰당 0.39달러, 출력 2.34달러** 수준  
  - **Kimi K2.5** 모델은 입력 0.45달러, 출력 2.25달러로 더 저렴  
- 이는 Anthropic API 요금 대비 **약 10배 저렴**한 수준  
- 캐시 토큰 비용도 유사한 비율로 차이남  
  - 예: DeepInfra의 Kimi K2.5 캐시 읽기 비용은 0.07달러/MTok, Anthropic은 0.50달러/MTok  
- 따라서 실제 컴퓨트 비용은 **API 요금의 약 10% 수준**으로 추정 가능  

### Claude Code Max 사용자의 실제 비용
- API 요금 기준으로 5천 달러 상당의 토큰을 사용하는 사용자의 실제 비용은 약 **500달러 수준**  
  - 이 경우 Anthropic은 월 300달러 정도 손실  
- 그러나 Anthropic은 **5% 미만의 사용자만 토큰 한도에 도달**한다고 밝힘  
  - 일반 사용자는 평균적으로 **50% 미만의 토큰 사용량**  
- Anthropic의 `/cost` 데이터에 따르면, 평균 사용자는 **일일 6달러 수준의 API 사용량**, 90%는 12달러 이하  
  - 실제 비용 기준으로 월 약 18달러로, **20~200달러 구독 요금 대비 수익성 확보 가능**  

### Cursor와의 비용 차이
- 5천 달러 수치는 **Cursor의 내부 분석 결과**에서 비롯됨  
  - Cursor는 Anthropic의 **소매 API 요금으로 Opus 4.6을 사용**해야 함  
- 따라서 Cursor 입장에서는 파워 유저 1인당 월 5천 달러 비용이 발생 가능  
  - 반면 Anthropic의 실제 비용은 약 500달러 수준  
- Cursor는 개발자들이 **Anthropic 모델을 선호**한다는 점에서 어려움을 겪고 있음  

### Anthropic의 수익 구조와 오해
- Anthropic은 여전히 **훈련 비용, 인건비, 대규모 컴퓨트 투자** 등으로 인해 전체적으로는 적자 구조  
- 그러나 **토큰 단위 추론(inference) 비용**은 수익성이 높을 가능성이 큼  
- “AI 추론은 적자 사업”이라는 인식은 **API 가격의 과도한 마진을 정당화**하며, 경쟁을 위축시킴  
- 실제 추론 경제를 이해하려면 **OpenRouter의 공개 모델 가격**을 참고하는 것이 현실적임  
  - 이는 대형 AI 기업의 API 요금 대비 **실제 비용의 일부 수준**에 불과함

## Comments



### Comment 52784

- Author: neo
- Created: 2026-03-11T00:33:47+09:00
- Points: 1

###### [Hacker News 의견들](https://news.ycombinator.com/item?id=47317132) 
- Qwen 3.5 397B-A17B를 Anthropic 모델과 비교하는 건 **엉터리 비교**임  
  Qwen이나 DeepSeek 같은 중국 모델들은 Anthropic보다 **10배 이상 효율적**이라 알려져 있음  
  OpenRouter 가격과 공식 제공가의 차이가 크지 않은 이유도 여기에 있음. 게다가 OpenRouter 제공자들이 어떤 **양자화(quantization)** 기법을 쓰는지도 불분명함. 실제로는 100배 효율을 내는지도 모름  
  물론 모든 사용자가 플랜을 최대치로 쓰는 건 아니기에, 사용자당 5,000달러씩 손실이 나는 건 아님
  - 그건 순환논리임. 중국 모델이 10배 효율적이라 믿는 이유가 단지 10배 싸기 때문임  
    Amazon Bedrock의 Opus 4.5와 중국 모델들의 t/s 수치를 보면 비슷한 수준이라, 실제 **활성 파라미터 수**도 비슷함  
    OpenRouter에서는 BF16이나 Q8 제공자를 직접 선택할 수도 있음
  - 동의하지만, Opus 4.6이 10배 더 큰 모델일 가능성이 높음. GPT-4가 이미 1.6T 모델이고 Llama 4도 훨씬 큼  
    중국 기업들은 GPU가 부족하지만 **추론 효율화**에서 많은 혁신을 이뤘음. DeepSeek CEO인 Liang도 관련 논문 저자 명단에 있음
  - Qwen 같은 오픈소스 모델을 Anthropic과 비교하는 건 무의미함  
    Anthropic은 **모델 구조나 파라미터 수를 공개한 적이 없음**  
    오픈소스 모델들은 대부분 다른 모델을 증류(distill)하거나 MoE를 써서 계산비용을 줄임  
    Qwen을 비교 기준으로 삼은 블로그 글은 신뢰하기 어려움
  - Opus는 **TPU**를 활용해 더 낮은 비용을 달성했을 수도 있음
  - OpenRouter 제공자 섹션에 **양자화 정보**가 표시되어 있음

- 원문 기사에 따르면, Cursor는 작년에 월 200달러짜리 Claude Code 구독이 최대 2,000달러의 컴퓨팅을 사용한다고 추정했음  
  지금은 그 보조금이 더 커져서, 같은 플랜이 약 5,000달러의 컴퓨팅을 소비할 수 있다고 함
  - “이건 모든 걸 바꾸는 정보임”이라는 반응이 나옴

- 많은 사람들이 OpenAI와 Anthropic이 **토큰을 손해보고 판다**고 믿지만, 실제 증거는 거의 없음  
  Forbes의 부정확한 기사 때문에 이런 밈이 퍼졌음. 그 기사는 API 비용과 **컴퓨팅 비용의 차이**조차 이해하지 못함  
  - 하지만 실제로는 손해 판매 증거가 없다고 단정하기도 어려움  
    Anthropic이 CC 외부 사용을 막는 점, API 지출 한도가 5,000달러인 점 등을 보면 수익성이 낮을 가능성도 있음  
  - “토큰만 파는 회사가 손해를 안 볼 수 있겠냐”는 주장도 있음  
    연구·훈련·인프라 인건비 모두 토큰 생성 비용에 포함되어야 함  
    오픈웨이트 모델의 낮은 가격은 **시장 점유율 확보용 덤핑** 때문이며, 실제 비용은 더 높음  
    결국 이 구조는 오래 지속되지 못할 것임  
  - Anthropic이 토큰당 손해를 보는지보다, **훈련비용**이 얼마나 드는지가 더 중요함  
    모델이 지속적으로 훈련되지 않으면 토큰 가치가 떨어짐  
  - 참고로 관련 문서가 [여기](https://www.wheresyoured.at/oai_docs/)에 있음

- 우리 팀이 Claude Code를 API로 쓴다면 월 20만 달러가 들겠지만, 실제로는 Max 구독으로 월 1,400달러만 냄  
  사용자당 5만 달러 수준이지만, JSON 토큰 수를 보면 대부분 **캐시된 요청**이라 실제 비용은 훨씬 낮을 듯함  
  - 어떤 일을 그렇게 효율적으로 분배하는지 궁금함. 나도 Claude를 많이 쓰지만 한계가 금방 옴  
  - Gemini CLI는 세션별 **캐시 절감율**을 보여주는데 보통 90% 정도임  
  - 나도 여러 Claude 에이전트를 돌리는데, 입력 토큰의 85%가 캐시 읽기임  
    실제 비용은 2.5만~3만 달러 수준일 듯. Forbes의 5천 달러 추정은 과장임  
  - `npx ccusage`로 로컬 로그를 확인하면 API 기준 비용을 계산할 수 있음  
  - 그런데 Max 플랜을 회사 용도로 쓰는 게 **약관 위반** 아닌가 궁금함

- Anthropic의 컴퓨팅이 완전히 포화 상태라면, Claude Code의 **파워 유저**는 사용자당 5,000달러의 기회비용을 발생시킬 수 있음  
  하지만 이런 비교는 Rolex와 무명 시계의 **기어 수**를 비교하는 것만큼 부적절함  
  - 기회비용은 실제 비용이 아님. Anthropic이 구독을 못 팔 정도로 포화된 상태인지가 핵심임  
  - GPU 팜이 완전히 활용될수록 **배칭(batch)** 효과로 오히려 단가가 낮아짐  
  - “기회비용”이란 말을 엔터테인먼트 업계도 자주 쓰지만, 실제로는 소비가 줄어드는 게 현실임  
    Anthropic도 마찬가지로, 사용자가 불확실한 품질에 의문을 품거나 **API 기반 과금**으로 전환할 가능성이 큼  
  - “100달러 구독으로 Opus를 넉넉히 쓰는 내 상황이 유지되길 바람”이라는 농담도 나옴

- **추론 비용과 이익률**은 오픈웨이트 모델과 대형 클라우드 제공자 간에 큰 차이가 있음  
  제약 산업의 R&D 비용과 제네릭 생산비 차이와 비슷함  
  OpenAI의 추론 마진은 약 70%, Anthropic은 40~90%로 추정됨  
  관련 기사: [Phemex](https://phemex.com/news/article/openais-ai-profit-margin-climbs-to-70-in-october-outpacing-rivals-47258), [SaaStr](https://www.saastr.com/have-ai-gross-margins-really-turned-the-corner-the-real-math-behind-openais-70-compute-margin-and-why-b2b-startups-are-still-running-on-a-treadmill/), [The Information](https://www.theinformation.com/articles/anthropic-projects-70-billion-revenue-17-billion-cash-flow-2028), [Investing.com](https://www.investing.com/news/stock-market-news/anthropic-trims-profit-margin-outlook-as-ai-operating-costs-rise--the-information-4459316)
  - “이익(profit)”이라는 단어를 너무 쉽게 쓰지 말자는 의견임  
    회계 기준상으로는 이미 **모델당 수익이 훈련비를 상쇄**했을 수도 있음  
    다만 현금흐름 기준으로는 아직 **cashflow positive**가 아님  
    이런 차이를 이해하지 못하면 AI 산업 전체를 과소평가하게 됨

- Opus 4.6의 **모델 크기**가 얼마나 되는지 확신이 없음  
  Qwen397B보다 훨씬 클 거라 추정함  
  - Musk가 Grok이 수조 개 파라미터라고 밝힌 걸 보면, Opus도 그 수준일 가능성이 큼  
    Anthropic이 API로 돈을 벌고는 있겠지만 **90% 마진**은 아닐 듯함  
  - OpenRouter의 DeepSeek v3.2(685B/37B active)는 $0.26/0.40, Kimi K2.5(1T/32B active)는 $0.45/2.25로 책정되어 있음  
  - 전문가라면 Opus가 **1~2조 파라미터**일 거라 추정함

- 캐시는 거의 **무료에 가깝지만**, 실제로는 완전히 공짜가 아님  
  캐시 토큰 비용을 빼면 $200 구독의 실제 컴퓨팅 사용량은 약 $800 수준으로 떨어짐  
  대부분의 컴퓨팅은 **유휴 상태**일 가능성이 높음  
  - 하지만 캐시는 RAM을 계속 점유하므로 완전히 무료는 아님  
    캐시가 적중하지 않으면 그만큼 **기회비용**이 발생함  
  - 캐시 덕분에 더 많은 사용자에게 프리미엄 가격으로 추론을 팔 수 있는 구조라, 사실상 **수익 극대화 수단**임  
  - 유휴 컴퓨팅이 아니라면, 그 자원을 **모델 훈련이나 연구 실험**에 쓸 수도 있음

- Cursor는 Anthropic의 **리테일 API 가격**으로 Opus 4.6을 사용해야 하므로, 파워 유저당 월 5,000달러가 들 수 있음  
  반면 Anthropic의 실제 비용은 500달러 수준일 것임  
  최근 [Swix 팟캐스트](https://www.swix.io/podcast/)에서 Cursor의 클라우드 에이전트 전략을 들었는데, **진입장벽이 낮아지고 있음**

- Claude 구독은 **스팟 인스턴스** 개념에 가까움  
  API는 온디맨드 서비스이고, 우선순위는 API에 있음  
  남는 컴퓨팅은 구독 사용자에게 배정되며, 용량이 부족하면 **양자화된 저가 모델**로 라우팅됨  
  이런 구독은 유휴 자원을 활용하고, 예측 가능한 워크플로우로 **모델 훈련 품질을 높이는 역할**도 함  
  Qwen Code, Codex, Claude를 모두 써봤는데, Codex는 Qwen보다 2배, Claude는 Codex보다 2배 나았음  
  그래서 Claude Opus는 Qwen Code보다 4~5배 비쌀 거라 예상함  
  - “Claude가 Codex보다 2배 낫다”는 건 **지금은 사실이 아님**  
  - “용량 부족 시 저가 모델로 라우팅된다”는 부분은 공식적으로 **발표된 적 없음**
