Anthropic과 OpenAI가 제품-시장 적합성을 찾았다고 생각한다

(simonwillison.net)

9P by GN⁺ 1달전 | ★ favorite | 댓글 1개

Anthropic과 OpenAI의 코딩·범용 에이전트는 소비자 구독보다 엔터프라이즈 사용량 과금에서 더 큰 매출 가능성을 드러냄
Claude Code와 Codex 헤비 유저는 월 $200 구독으로 API 기준 $2,180.16어치 토큰을 쓰지만, 기업 고객은 비슷한 할인에서 제외됨
2026년 4월 두 회사는 Codex와 Claude Code/Cowork의 Enterprise 비용을 공개 API 가격에 맞추고 더 비싼 프런티어 모델도 출시함
OpenAI 채용 공고 703개 중 229개, Anthropic 390개 중 105개가 엔터프라이즈 영업·지원 성격으로 분류돼 직접 판매 전환이 뚜렷함
Uber와 Microsoft의 비용 논란은 AI 실패보다 고객이 부담을 느끼면서도 쓰는 가격 적정성 신호로 해석 가능함

엔터프라이즈 고객이 API 가격을 내기 시작함

Anthropic의 월 $100 Max 플랜과 OpenAI의 월 $100 Pro 플랜은 코딩 에이전트 헤비 유저에게 매우 유리한 가격임
ccusage로 최근 30일 사용량을 API 토큰 가격으로 환산하면 Anthropic Claude Code는 $1,199.79, OpenAI Codex는 $980.37에 해당함
- 합산하면 $2,180.16어치 토큰을 $200에 사용한 셈
- 하루 종일 에이전트를 돌리는 수준이 아닌 “상당히 많이 쓰는 사용자” 기준에서도 큰 차이가 발생함
기업이 에이전트를 대규모로 쓰면 비슷한 할인을 받을 것이라는 가정은 맞지 않았음
Anthropic은 최근 6개월 사이 Enterprise 플랜을 기존 “일반적인 근무일에 충분한 사용량 포함” 구조에서 좌석당 월 $20 + 사용량 API 과금 구조로 바꾼 것으로 보임
- 2025년 8월에는 “Claude seats include enough usage for a typical workday”라고 안내함
- The Information 보도는 2026년 4월 14일자지만, Anthropic 대변인은 가격 변경이 2025년 11월에 이뤄졌다고 밝힘
- 기존 고객은 계약 갱신 시점에 변경 사항을 알게 되는 중
OpenAI도 2026년 4월에 유사한 가격 변경을 적용함
- Codex rate card에 따르면 2026년 4월 2일 Codex 가격은 메시지당 과금이 아니라 API 토큰 사용량 기준으로 맞춰짐
- 4월 2일 변경은 신규 및 기존 Plus, Pro, ChatGPT Business, 신규 ChatGPT Enterprise 플랜에 적용됨
- 4월 23일에는 Edu, Health, Gov, ChatGPT for Teachers를 포함한 모든 기존 ChatGPT Enterprise 플랜에도 적용됨
- 가격은 “크레딧”으로 표시되지만, 모델별 API 토큰 비용과 일치하는 것으로 보임
2026년 4월 기준 OpenAI Codex와 Anthropic Claude Code/Cowork의 Enterprise 비용은 공개 API 가격과 같아짐
같은 달 두 선도 모델 회사는 더 비싼 프런티어 모델도 출시함
- 4월 23일 출시된 GPT-5.5는 GPT-5.4보다 API 가격이 2배임
- 4월 16일 출시된 Opus 4.7은 새 토크나이저를 고려하면 Opus 4.6보다 약 1.4배 비쌈
2026년 4월에는 고가 프런티어 모델 출시와 엔터프라이즈 고객을 기존 대폭 할인 대신 API 가격에 묶는 변화가 동시에 나타남

제품-시장 적합성에 도달했다는 판단

Anthropic과 OpenAI의 갑작스러운 가격 공세는 IPO 준비와도 연결될 수 있지만, 더 중요한 요인은 Claude Code/Cowork와 Codex 같은 코딩·범용 에이전트 제품이 제품-시장 적합성을 찾은 것으로 보인다는 점
ChatGPT는 대중적 인기를 얻었지만 그 인기를 수익으로 바꾸기는 어려웠음
- OpenAI는 2월에 ChatGPT의 주간 활성 사용자가 9억 명 이상이라고 밝힘
- 유료 소비자 구독자는 5천만 명으로, 전체의 5.6% 였음
사용자당 월 $10~$20 과금은 괜찮은 사업이지만, $1조 인프라 비용을 감당하려면 10억~20억 구독자가 4년 동안 유지돼야 함
기업이 사용자당 월 $200 이상을 쓰는 구조는 훨씬 빠르게 큰 매출로 이어질 수 있음
- 파워 유저 기준으로 이미 벤더당 월 약 $1,000 수준의 API 비용에 해당하는 사용량이 발생함
코딩 에이전트는 토큰을 훨씬 많이 소비하지만, 고임금 전문직의 일상 도구가 되고 있음
- 현재는 주로 소프트웨어 엔지니어가 중심
- 컴퓨터에 명령을 입력해 처리할 수 있는 작업을 자동화할 수 있어 더 넓은 숙련 지식노동자에게도 적용 가능함
2025년 11월 출시 모델들은 에이전트를 실제로 유용한 수준으로 끌어올렸고, 이후 6개월 동안 기업들이 이 기술에 적응하면서 실제 지출이 늘기 시작함
ChatGPT는 2023년 2월 역사상 가장 빠르게 성장한 소비자 앱이 되며 제품-시장 적합성을 달성했다고 볼 수도 있지만, 당시에는 실질적인 수익을 만들지 못했음
코딩 에이전트와 엔터프라이즈 가격 정책의 결합은 이 회사들이 매우 실제적인 매출을 만들기 시작한 지점으로 보임

채용 확대로 드러나는 엔터프라이즈 집중

OpenAI와 Anthropic의 공개 채용 공고에서도 엔터프라이즈 에이전트가 제품-시장 적합성을 확보했다는 신호가 나타남
OpenAI는 현재 703개 채용 공고가 있으며, 그중 229개인 32.6% 가 엔터프라이즈 영업·지원 관련으로 분류됨
- 계정 임원, “Go To Market”, “Forward Deployed Engineers” 등이 포함됨
Anthropic은 390개 채용 공고가 있으며, 그중 105개인 26.9% 가 엔터프라이즈 성격으로 보임
AI 연구소들이 인간 노동이 많이 필요한 엔터프라이즈 영업 모델을 선택했다는 점은 아이러니함
- 엔터프라이즈 영업 계약은 많은 사람이 개입해야 성사됨
채용 분석은 Claude Code로 채용 사이트를 스크래핑하고 Datasette의 JSON API, Datasette Cloud, Datasette Agent를 거쳐 수행됐으며 결과는 gist로 공개됨

AI 실패담으로 소비되는 비용 논란은 근거가 약함

대기업들이 AI 사용 비용 급증 때문에 경고음을 내고 있다는 이야기가 늘었지만, 널리 인용되는 사례들은 과장돼 보임
Uber 사례
- 가장 많이 논의된 사례는 Uber CTO Praveen Neppalli Naga가 Uber가 “2026년 몇 달 만에 연간 AI 예산을 모두 소진했다”고 말한 The Information 보도임
- 비용 증가의 상당 부분은 Claude Code 때문으로 제시됨
- Claude Code가 실제로 크게 좋아진 시점이 2025년 11월이므로, 2025년에 세운 예산이 2026년 수요를 예측하지 못한 것은 놀랍지 않음
- Uber COO Andrew Macdonald의 Rapid Response 팟캐스트 발언도 논란을 키웠지만, 해당 구간의 내용은 제한적임
- Andrew Macdonald는 지난 분기 코드 커밋의 25%가 Claude Code를 통해 이뤄졌지만, 그 생산성 증가가 실제로 잘린 프로젝트를 되살렸는지, 소비자에게 유용한 기능을 25% 더 만들었는지 연결하기 어렵다고 말함
- 이 발언은 Business Insider의 “AI tokenmaxxing 지출을 정당화하기 어려워지고 있다” 같은 헤드라인으로 이어짐
Microsoft 사례
- 또 다른 인기 사례는 Microsoft가 Claude Code 라이선스를 취소하기 시작했다는 이야기임
- 표면적으로는 엔지니어들이 자체 Copilot CLI 에이전트를 직접 쓰도록 유도하기 위한 조치
- The Verge의 Tom Warren은 소식통을 인용해 이 결정이 재무적 이유도 있으며, Microsoft의 회계연도 종료일인 6월 30일과 연결된다고 전함
- 두 사례는 AI 실패라기보다 제품 가격이 고객에게 부담을 주면서도 결국 선택되는 가격 적정성의 신호로 해석 가능함
- 좋은 제품 가격은 고객이 잠시 숨을 들이켜고도 “예”라고 말하는 수준이라는 관점과 맞닿아 있음
- Uber의 예산 초과와 Microsoft의 좌석 취소는 그 효과가 현실에서 나타난 것으로 보임

AI 연구소의 지출 규모도 매우 큼

대형 AI 연구소는 학습과 추론 모두에 수십억 달러를 쓰고 있음
정확하고 신뢰할 만한 수치는 드물지만, 최근 SpaceX S-1에 Anthropic 관련 큰 단서가 담김
SpaceX는 2026년 5월 Anthropic PBC와 Cloud Services Agreements를 체결해 COLOSSUS와 COLOSSUS II의 컴퓨트 용량 접근을 제공한다고 밝힘
- Anthropic은 2029년 5월까지 SpaceX에 매월 $12.5억을 지급하기로 합의함
Anthropic의 발표는 이 계약으로 “Claude Code와 Claude API의 사용 한도를 늘릴 수 있다”고 밝힘
- 이는 Colossus가 모델 학습이 아니라 추론 용도로 쓰인다는 점을 강하게 시사함
Anthropic은 이미 다른 공급자들로부터 방대한 컴퓨트 용량을 확보하고 있음
- 단일 벤더의 추가 용량에만 월 $12.5억을 지출하려는 점은 추론 예산이 얼마나 커졌는지 보여줌

API 매출의 상대적 중요성 감소

지난 2년 동안 OpenAI는 구독 매출 비중이 더 컸고, Anthropic은 API 매출 비중이 더 큰 것으로 보였음
Anthropic의 API 매출은 역사적으로 소수의 대형 API 고객에 크게 의존함
- 2025년 8월 VentureBeat 보도에 따르면 Cursor와 GitHub Copilot 두 고객이 당시 $40억 매출 중 $12억을 차지함
현재 Anthropic은 2분기에 $109억 매출에 도달하고, 처음으로 영업이익을 낼 수도 있다는 소문이 있음
엔터프라이즈 전환은 연구소들이 중간 유통자를 줄이고 직접 고객에게 판매하는 쪽에 더 큰 돈이 있다고 판단했음을 시사함
Anthropic의 Claude Code는 Cursor와 Copilot과 직접 경쟁함
- Cursor가 자체 모델에 투자하는 것도 이런 맥락에서 자연스러움

2026년 4월은 새로운 변곡점

2025년 11월은 GPT-5.1과 Opus 4.5가 각각의 코딩 에이전트 하네스와 결합해 실제로 쓸 만해진 시점으로, November inflection point로 볼 수 있음
이후 6개월 동안 기업들은 안정적으로 유용한 작업을 수행하는 에이전트 시스템에 적응해 왔음
2026년 4월은 그 기술 변화의 매출 효과가 본격적으로 나타나기 시작한 새로운 변곡점으로 보임
- 프런티어 AI 연구소에는 이익이 되는 방향
- 대기업 예산에는 실질적인 영향을 주는 방향
향후 Anthropic과 OpenAI의 IPO를 위한 S-1 문서가 공개되면 이 순간의 실체를 감사된 숫자로 확인할 수 있음

GeekNews Weekly에 포함된 글입니다. 에디터 코멘트 보기

GN⁺ 1달전 [-]

Hacker News 의견들

앞으로 5년 안에 5조~10조 달러를 회수해야 하고, 못 하면 하드웨어 증설분을 감가상각하기 시작할 것임
이는 토큰 지출로 매년 1조 달러 이상이 필요하다는 뜻임. 전 세계 지식 노동자 2억 명, 개발자 3천만 명을 기준으로 하면 모든 지식 노동자 급여의 5%, 개발자라면 20%가 토큰으로 들어가야 하는 세계임
주변에서는 이런 도구로 회사가 실제로 신경 쓰는 업무에서 속도가 20~40% 오른다고들 함. 지출 20% 증가로 속도 20% 향상이라면 연간 1조 달러 지출을 정당화하기 어려움
아직 거기까지 가지 못했음. 지금은 과대광고 주기의 상승 구간이고, 개발자가 중요한 일에서 2배, 5배, 10배 생산적이 되게 만들지 못하면 좋게 흘러가지 않을 듯함
- 몇 가지 생각이 있음. 공개된 정보만 보면 추론 비용과 학습 비용의 관계가 서로 충돌함
  데이터센터에 관여하는 전기 엔지니어들은 학습 실행 중 전력 사용 급증을 설계의 주요 요인처럼 말하지만, 비용 최적 스케일링을 다루는 논문들은 추론 시 계산량을 큰 요인으로 확신 있게 다룸
  학습이 상각 후에도 추론보다 훨씬 계산 집약적이라는 쪽의 근거로는, 계산 자원 접근에 제약이 큰 중국 제공업체들이 더 낮은 가격으로 거의 무제한에 가까운 토큰을 제공하지만 모델 성능은 떨어진다는 점이 있음. 미국 업체들이 해외 업체가 감당하지 못한 상각 학습 비용 때문에 추론 비용을 20~30배 부풀리고 있다는 해석이면 말이 됨
  학습 비용이 추론보다 훨씬 크다면, 이들은 일반적인 한계비용 0 경쟁 모델보다 훨씬 심한 죄수의 딜레마에 있음. 반대로 추론 비용이 더 크다면, 일부 사상가들이 말하듯 유틸리티 같은 사업이라는 분석이 맞을 수 있음. CEO들이 그렇게 말할 유인은 매우 큼. 대안인 죄수의 딜레마가 드러나면 투자가 매우 빠르게 멈출 테니까
  사실에 조금이라도 닿아 있는 건 시설 엔지니어들의 소문뿐이고, 나머지는 고수준 분석과 비밀스러운 사업에 대한 탁상 경영에 가까움. 이게 현재 이해 수준을 보여줌
  상각된 자본 지출과 운영 비용의 비율조차 모르면 외부 투자자 분석은 불가능함. 사무실 화분과 실내 화분 회계를 아무리 세분화해도, 사업의 가장 큰 부분이 영업비밀로 가려져 있으면 의미가 없음
- 연매출 1억 5천만 달러, 순이익률 9%짜리 아주 작은 회사에서 일하는데, 우리에겐 충분히 좋기 때문에 로컬 모델을 돌리려고 하드웨어에 10만 달러를 쓰는 걸 이미 검토 중임
  AI 서비스형 지출 예상치는 1년도 안 돼 그 비용을 넘길 것임
  몇 년 안에 아주 작은 회사도 감당 가능한 가격으로 대부분의 일에 충분한 최전선급 모델을 돌릴 하드웨어가 나올 것 같음
- 각자 관찰은 다르겠지만, 내 관찰도 크게 다르진 않음. 다만 그건 아래에서 위로 보는 관점임. 이 시점이면 위에서 아래로도 보여야 하지 않나 싶음
  잠재력 단계를 넘어 의미 있는 생산성 향상으로 들어섰다면 왜 고객 쪽 수치에는 안 나타날까?
  더 나은 소프트웨어 도입 때문에 지난 3개월 동안 Delta Airlines가 운영 효율을 크게 개선하지 못한 이유는 뭘까?
  진짜 궁금함. 단절이 보임
- 1990년대 말~2000년대 초 대학생 때 계량경제학 교수가 했던 말을 뚜렷이 기억함
  케이블 TV와 Pay Per View가 나왔을 때, 영화 무제한 접근권이 있으면 사람들이 영화를 얼마나 볼지 연구가 있었고, 그 결과가 이 사업을 뒷받침할 인프라를 모두 깔아야 한다는 증거처럼 떠돌았음. 그런데 통계학자들이 데이터를 더 분석해보니 사람들은 매일, 주 7일, 하루 10~12시간 영화를 볼 거라고 답했다는 결론이 나왔음. 불가능한 수치였음
  지금도 비슷한 배를 탄 느낌임. 일부는 모두가 최대 토큰을 쓸 것이고, 하드웨어·소프트웨어·설계·시장 압력 개선에도 토큰 가격은 절대 싸지지 않을 것이라고 가정함
- 고려할 요인 하나는 앞으로 5년 동안 기준 인구가 그대로 남아 있지 않다는 점임
  개발자 도구의 매 세대는 절대적인 코드 처리량을 늘리면서 새로운 개발자 계층과 사용자를 만들어왔음
  첫 컴파일러부터 프레임워크 시대를 거쳐 지금까지 늘 그랬고, 개발자가 되기 위해 필요한 숙련도는 내려갔음. 80년대 중후반에는 석사·박사급 컴퓨터과학자가 애플리케이션을 쓸 수 있었지만, 이후 학부생과 IT 엔지니어로 내려왔고 컴퓨터과학 이론은 대체로 선택 사항이 됐으며, 이후 약간의 훈련을 받은 대졸자까지 내려왔고, 2022년 전 retool 같은 노코드/로코드 도구를 거쳐 v0/Replit 같은 에이전트 코드 생성 서비스로 더 내려가는 중임
  다음 세대 개발자는 이전 세대처럼 애플리케이션과 아키텍처를 만들지 않을 것임. 여기 대부분도 pg가 이 플랫폼을 만들 때의 품질 수준으로 만들지는 않지만, 사용자가 가치를 찾을 수 있으면 상관없음. 이미 수많은 중간 품질의 기업용 애플리케이션이 그걸 증명함
  결국 2억/3천만 숫자는 그대로 남지 않는다는 게 이 사업들의 논리임. 그 변화가 자본 지출을 정당화할 만큼 충분히 크고 빠를지는 나도 아니라고 봄. 다만 Web 1, Web 2.0, SaaS, 모바일 혁명도 새 사용자와 개발자 계층을 꽤 빨리 만들었으니 완전히 비현실적이진 않음
  [1] HN은 커스텀 Lisp 구현이라는 강한 이상치지만, 이전 시대에는 선택은 더 온건해도 탄탄한 아키텍처로 쓰인 예가 많았고, 그런 숙련도는 오늘날 창업자 세대에서 찾기 어려울 수 있음
이 분석은 혼란스러움. 코딩 쪽 제품-시장 적합성(PMF) 은 아마 작년에 이미 도달했을 가능성이 큼. 수익성은 별개의 문제이고 아직 모름
글은 둘을 섞으면서도 강한 경제적 논거나 설득력 있는 숫자를 제시하지 않음. Uber 사례가 왜 관련 있는지도 모르겠음. Uber COO도 적어도 투자수익률 관점에서는 결과가 보이지 않는다고 분명히 말했음
내 생각에는 제품은 몇 달 전부터 코딩에 매우 유용했음. 하지만 어떤 비용에서도 유용한 건 절대 아님
- 혼란스러운 점은 사람들이 궤적을 무시하는 듯하다는 것임. 어쩌면 가장 중요한 부분인데 묻혀 있음
  Simon이 말했듯 “충분히 좋은” 코딩 에이전트가 나온 지 6개월밖에 안 됐고, 그건 눈 깜짝할 시간임. 그런데 우리 회사에서 내 업무는 완전히 바뀌었고 거의 꿈같음
  그리고 그건 변곡점 하나일 뿐임. 이미 여러 변곡점이 있었고 더 많은 변곡점이 앞에 있음. 오늘 당장 터무니없는 기업 지출에도 투자수익률이 양수가 아닐 수 있다는 말에는 설득될 수 있지만, 몇 달 뒤, 더 나아가 몇 년 뒤 올 것에 대비해 지금 길을 닦는 건 충분히 합리적임
- PMF는 “있는지 확실하지 않으면 없는 것”처럼 이상하게 정의되는 개념임
  시간을 들여 써보고 이해한 사람들에게는 몇 달 전부터 분명 유용했지만, 이제 그 지식이 지갑을 쥔 사람들에게까지 퍼져서 단순한 유행이나 과대광고가 아니라고 확신하게 됐고, 그래서 PMF를 “주장”할 수 있게 된 듯함
  다만 “저 사람들이 PMF를 가졌다”고 말하는 건 이상하다는 데 동의함. 보통은 자기 제품에 대해 정의하는 개념임
- 맞음. 비용도 경제성의 일부임
  그래서 여기 많은 사람은 논의에 끼지 않는 편이 나음. 이들은 이점만 반복하고 비용과 그 비용이 회사의 재무 상태에 어떤 영향을 주는지 식별하고 설명하지 않음
- 글은 “좋다”라는 단어에 너무 많은 무게를 싣고 있어서 분석을 의심하게 만듦
  “2025년 11월을 11월 변곡점이라고 부른 이유는 GPT-5.1과 Opus 4.5가 각자의 코딩 에이전트 하네스와 결합해 좋아졌기 때문이다. 유용한 작업을 안정적으로 해낼 만큼 좋아져서, 우리는 지난 6개월 동안 에이전트 시스템에 적응해왔다”
- 논리적인 글이어야 하는 게 아님. 이건 LLM 전도 블로그에 가깝고, 업계에 우호적이지 않은 비판적 분석은 거의 없음
  다른 글을 읽어봐도 회의론은 별로 없고, 얼마나 대단한지 홍보하는 내용이 많음
이 글에는 약간 AI 정신증 같은 느낌이 있음
“이 도구들은 훨씬 더 많은 토큰을 태우지만, 매우 높은 보수를 받는 전문가들이 수행하는 일의 일상 도구가 빠르게 되고 있다”
“어쩌다 이 조각이 ‘Uber COO가 AI 토큰 과소비 지출을 정당화하기 어려워지고 있다고 말했다’ 같은 헤드라인으로 변했는데, AI 실패담에 대한 시장은 여전히 거대하기 때문이다”
그래, 그냥 AI 실패를 바라는 욕망일 뿐임. 비용 폭주, 기록적인 매출, 대규모 해고일 리는 없음. 이미 높은 보수를 받는 사람들이 이 도구로 돈을 태우면서도 “가치” 증가는 전혀 만들지 못하고 있다는 가능성도 없을 것임. 산출은 100배지만 결과는 모든 지표에서 평평하다는 점은 인정함
[1] https://cmr.berkeley.edu/2025/10/seven-myths-about-ai-and-pr...
[2] https://futuretech.mit.edu/publication/crashing-waves-vs-ris...
- 정신증이라는 게 정확히 뭐임?
GLM-5.1이 비슷하게 좋고 오픈소스이며 훨씬 싸다면 OpenAI와 Anthropic은 고객을 어떻게 붙잡을 계획일까?
사업 모델이 작동할 것 같지 않음. 아주 가까운 친구가 대기업용 자동화 소프트웨어를 실제로 하는데, Claude나 OpenAI를 전혀 쓰지 않음
주로 Cerebras 위의 gpt 120b와 GLM-5.1을 무거운 사고 작업에 쓰고, 여러 작업에는 다른 작은 모델들을 씀. 전부 오픈소스임
이 시스템들은 기업에 매우 유용하고, 아주 안정적이고 빠른 완전 자동 파이프라인을 돌릴 수 있음
이 주제로 자주 이야기하는데, 우리 둘 다 Claude와 OpenAI로 무거운 에이전트 작업을 하는 기업들은 지난 1년 동안 오픈소스가 얼마나 좋아지고 싸졌는지 정확히 모르는 것 같다고 봄
그러면 기존 기업과 개발자들이 따라잡으면 Claude와 OpenAI는 비용을 회수할 수 없지 않을까?
- GLM-5.1은 같은 수준이 아님. Claude Code의 Opus와는 상대가 안 됨. 직접 써보면 됨. 오픈소스 모델은 적어도 1년쯤 뒤처져 있음
- 사업 모델이 안 보인다는 데 동의함. Porter의 5요인 관점에서는 악몽임
  이 공간에서 엄청나게 많은 기업이 경쟁할 것이고, 자본 집약적이라는 점 때문에 어느 정도 해자는 있겠지만, 그래도 사실상 무한한 경쟁자가 있을 것임
  소비자에게는 좋음
- 코딩에는 항상 해당 분야 최고의 모델을 써야지, 1년 전으로 돌아가면 최고였을 모델을 쓰는 게 아님. GLM 5.1이 딱 그런 위치임
  GLM의 가격 대비 성능이 충분해서 번역 사이트에 쓰는 큰 팬으로서 하는 말임
  지금 돈 대부분은 코딩에 있음. OpenAI와 Anthropic이 최첨단 오픈소스 모델보다 6개월만 앞서 있어도 기업과 개발자 시장 대부분을 가져갈 수 있음
- 코딩 보조용으로 OpenRouter를 통해 여러 대형 오픈 모델을 OpenCode에서 써봤는데, 모두 Claude Opus에 비해 꽤 별로였음
  오픈 모델에서 더 많은 가치를 얻으려면 어떻게 다뤄야 하는지 힌트를 줄 수 있을까?
  오픈 모델이 1년쯤 뒤처진다는 흔한 말에는 동의함. 그런데 약 1년 전에 최첨단 모델이 극도로 유용해지는 마법 같은 일이 있었음. 이 논리라면 곧 오픈 모델도 잘 작동해야 하지만, 지구가 한 바퀴 더 도는 걸 기다리는 것 이상의 뭔가가 있는 것 같아 걱정됨
  참고로 내 용도는 코딩 보조임. 다른 목적에서는 오픈 모델이 훌륭할 수 있음
- “최전선 모델만큼 좋다”는 이 모델들을 돌리려면 5천~1만 달러는 써야 하지 않나?
  직접 코딩 모델을 돌리는 투자수익률에 대해 설득력 있는 분석을 본 적이 없음. 월 20달러나 200달러 플랜과 비교하면 특히 그렇고
“200달러로 2,180.16달러어치 토큰”이라는 표현은 이상함
토큰에는 내재 비용이나 가치가 없음. 2,180.16달러어치 토큰을 썼다고 말하는 건 영업사원이 19.99달러짜리 냄비 세트가 10억 달러어치라고 설득하는 걸 믿는 것과 비슷함
편향된 정보원을 평가할 때 비판적 사고를 창밖으로 던지는 모습이 우스움
- 여기서 무엇에 반박하는지 잘 모르겠음
  나는 200달러를 썼음. API 가격으로 냈다면 2,180.16달러였을 것임. 글은 기업 고객이 API 가격을 낸다는 내용이고, 내가 그런 회사에 고용돼 있었다면 회사에 2,180.16달러 비용을 발생시켰을 거라는 뜻임
  내가 놓친 게 뭘까?
- 토큰에는 분명 계산 가능한 내재 비용이 있음. 생산의 한계비용, 즉 추론 비용이 있고, 그 토큰을 만들어내는 모델에 들어간 상각 연구개발 비용도 있음
  가치를 계산하기는 어렵지만, 다행히 시장 가격 메커니즘은 바로 그 목적을 위해 존재함. 사람들이 지불하려는 가격보다 더 나은 숫자는 없음
  그러니 기업 플랜에서는 2,180.16달러를 쓰게 된다는 말임. 본인은 그만큼 내지 않지만 기업은 냄
- 내 프로젝트 기준의 대략적인 계산으로는 OpenRouter에서 토큰당 지불하는 방식이, 같은 오픈 가중치 모델을 임대 GPU에서 돌리는 것과 경쟁 가능하거나 더 쌀 때도 있음
  토큰당 가격은 폐쇄형 최전선 모델과 오픈 가중치 모델 모두 비슷한 범위, 즉 백만 토큰당 센트~달러 수준임. 내게는 이 가격이 어느 정도 현실에 기반해 있다는 신호로 보임
- 조금만 비판적으로 생각하면 그 문장은 “현재 API 가격 기준 2,180달러어치 토큰”으로 읽힘
- 당연히 내재 비용이 있음. 바닥은 전기요금임. 편향된 정보원을 평가할 때 비판적 사고를 버리는 모습이 정말 우스움
진짜 타이밍은 지금 강한 신규 사업 수요가 부족하고, 충분한 기술 자산을 축적했기 때문에 일이 점점 증분 작업이 되어가고 있다는 데 있음
방대한 과거 작업 위에 안정적인 기능을 쌓을 수 있다는 뜻이고, AI가 특히 빛나는 지점임. 그래서 AI가 있든 없든, 대부분의 일이 기능 하나 추가, 버그 하나 수정, 설정 조금 조정 같은 증분 작업이라면 회사들은 소프트웨어 엔지니어를 덜 뽑았을 것임. AI는 그 압박을 가속했을 뿐임
반대로 20년 전에 같은 AI가 있었다고 상상해보면 다름. 사람들이 아직 JAX-RS를 이해하려고 하던 때 AI가 Jersey를 정말 쓸 수 있었을까? React가 막 발명됐을 때 React에 대한 모든 질문에 답할 수 있었을까? 퍼블릭 클라우드 인프라나 이른바 빅데이터 플랫폼 전체를 구축하는 데 사람을 10분의 1로 줄일 수 있었을까? 당시에는 빠르게 진화 중이라 수많은 가능성을 탐색할 엔지니어가 많이 필요했을 것임. AI로 머신러닝 생태계를 10분의 1 인력으로 만들 수 있었을지도 매우 의심스러움. 20년 전에는 R이 대세였고 Python 생태계는 전혀 성숙하지 않았음. 모바일 컴퓨팅도 마찬가지로, 모든 모바일 앱과 기반 인프라를 만드는 사람을 AI가 10분의 1로 줄였을까?
- “AI가 React에 대한 모든 질문에 답할 수 있었을까?”에는 문맥 내 학습(ICL) 때문에 가능하다고 봄
  “퍼블릭 클라우드 인프라나 빅데이터 플랫폼을 10분의 1 인력으로 만들 수 있었을까?”에는 아니라고 봄. 핵심 문제는 못 풀고, 규모가 커지면 엉망을 만듦
  증분 작업에 대해서는 맞음. 다만 역사적으로 대부분의 일은 증분 작업이었고, 연구개발 직무는 소수였다고 봄
인정할 건 인정해야 함. 이 전체는 역사상 가장 위대한 사기극임
AI에는 쓸모 있는 용례가 있지만 현재 가격으로는 아님. GPT-2 때부터 꽤 많은 헤비 유저와 함께 AI를 써왔음. 모든 사용자가 같은 이야기를 함. 호기심, 놀라움, 과대광고, 혐오, 깨달음. 기업은 보통 조금 늦고 지금은 과대광고 주기에 있음. 바로 그 지점에서 모든 계약을 팔고 IPO를 하는 것임
정말 VC의 교과서 같은 움직임
오해하지 말아야 할 건 AI에 유용한 사례는 있다는 점임. 다만 그들이 원하는 방식은 아님. 블록체인과 꽤 비슷함. 탈중앙화 화폐라는 아이디어는 존재할 권리가 있음. 다른 코인 99%는 아님
AI는 더 빠르지만 여전히 덜 정확한 검색 엔진임. 버그 찾기에는 훌륭하고 러버덕 디버깅에도 좋음
사기극이라고 부르는 이유는 마케팅과 함께 전 세계 수많은 사람에게 이제 스스로 배우지 않아도 스타트업, 게임, 인프라 등을 만들 수 있다는 인상을 주기 때문임. 그 결과 수백만 개의 방치된 저품질 프로젝트와 제품이 생김. 대다수는 문제를 철저히 해결하는 데 필요한 정신 모델을 한 번도 만들지 못했음. 결국 몇 달과 돈을 낭비하고 토큰만 태움. 이걸 사기극이라고 부름
내가 아는 모든 초기 수용자들은 돈 때문이 아니라 새로운 용례가 없어서 사용량을 크게 줄였음. 새 프로젝트를 탐색할 때는 빠르게 온보딩하고 많이 배운 뒤 문서와 실제 테스트로 넘어가면 됨. 내 사용량은 지난 2년 중 최저임
AI가 내 코드를 건드리게 하지는 않을 것임. 다시 기어올라올까 봐 불안함. 대신 내 코드를 읽고 내가 뭘 잘못했는지 알려주게 해서 스스로를 갈고닦게는 함
오픈소스 솔루션을 포함해 수백 개 회사가 그 정도는 제공할 수 있음
비기술 친구들은 모두 지금 과대광고 주기에 있고, 앞으로 올 흥분과 예측 가능한 좌절을 내게 공유함
어떤 의미에서는 AI가 의식적으로든 무의식적으로든 이렇게 철저하게 VC식으로 활용되어, 전 세계가 지켜보는 가운데 거대한 회사들을 만들어낸 점이 인상적임
- 원래 주장을 정리해보려는데 도와줄 수 있을까
  토큰을 쓰는 코딩 모델의 투자수익률이 양수가 아니라서 사기극이라는 뜻인가? 예를 들어 월 100달러를 받을 만큼 충분한 가치를 만들지 못한다는 의미?
  기업 고객은 이걸 볼 만큼 똑똑하지 않다는 뜻인가?
  궁극적으로 블록체인식 허상인데 CEO 수익을 극대화하려고 IPO한다는 뜻인가?
  내가 제대로 이해한 건가, 아니면 말을 덧씌운 건가?
  “사람들에게 이제 스스로 배우지 않아도 자기 스타트업, 게임, 인프라를 만들 수 있다는 인상을 준다”는 부분은 사람들의 믿음과 동기를 단정할 수는 없지만 허수아비치기 아닌가? AI는 사람을 증폭하는 강력한 도구임. “10억 달러 가치의 엔터프라이즈 SaaS 앱 만들어줘”나 “GTA6 만들어줘, 환각하지 말고”라고 프롬프트만 넣을 수는 없음. 하지만 실제로 그런 일이 벌어진다는 인상인가? Dario와 Sam이 “우리 코딩 에이전트 구독을 사면 기술 없이 한 번에 게임을 만들고 부자가 될 수 있다”고 말하고 있나?
  AI 에이전트에서 가치를 못 느끼는 건 오늘도 충분히 그럴 수 있음. 괜히 찜찜할 수도 있고. 하지만 블록체인과 동급의 사기극이라고 하는 건 엄청난 신호들과, 이 시스템들이 오늘 무엇을 할 수 있고 올해 말쯤 무엇을 하리라 기대하는지에 대한 실제 대화와 모순된다고 봄
Anthropic은 내가 읽은 바로는 실제로 수익성이 있는 게 아니고, 할인 때문에 잠깐 흑자로 보였던 것 같음. 이 글이 그 주장을 잘 함: https://www.wheresyoured.at/anthropics-profitability-swindle...
현재 가격 인상이 충분한지도 회의적이고, 앞으로 필요할 더 큰 가격 인상을 대부분의 사용자와 기업이 받아들일지도 회의적임. 특히 개인 사용자에게 월 200달러는 이미 엄청 비싼데, 대부분이 월 1,000달러 같은 가격을 낼 것 같지는 않음
LLM 관련 뉴스는 이 회사들이 IPO한 뒤까지 그냥 무시해야 할 것 같음. 긍정 여론을 꾸미는 봇이 많음
좌석당 월 200달러는 아무것도 아님
우리 연구개발 그룹 사람들이 쓰는 3D CAD 라이선스 패키지 하나는 좌석당 월 수천 달러가 듦
소프트웨어 좌석도 이제 사랑받을 때가 됐음
- AutoCAD는 사용자당 월 175달러임 [1]
  [1] https://www.autodesk.com/products/autocad/buy
- 맞음, 아무것도 아니지만 기업이 실제로 내는 비용도 아님. 글에 나오듯 가격은 좌석당 월 20달러에 토큰당 API 사용료가 추가됨
  기업은 고정 요금제의 “무제한 뷔페”가 아니라 사용량 기반 과금을 내고 있음
- 내가 본 것 중 가장 비싼 CATIA 라이선스도 사용자당 월 약 600달러임. 좌석당 “수천 달러”는 어디서 본 것임?
- 이제 엔지니어 급여까지 더해보면 소프트웨어 좌석은 이미 그 연구개발 좌석보다 더 비싸다는 걸 알게 됨
- CAD가 모든 일하는 사람이 쓰는 도구가 될 예정인가?

답변달기

Anthropic과 OpenAI가 제품-시장 적합성을 찾았다고 생각한다

엔터프라이즈 고객이 API 가격을 내기 시작함

제품-시장 적합성에 도달했다는 판단

채용 확대로 드러나는 엔터프라이즈 집중

AI 실패담으로 소비되는 비용 논란은 근거가 약함

Uber 사례

Microsoft 사례

AI 연구소의 지출 규모도 매우 큼

API 매출의 상대적 중요성 감소

2026년 4월은 새로운 변곡점

함께 보면 좋은 글 β

댓글과 토론

Hacker News 의견들