누가 지능의 가격을 정할 것인가?
(x.com/JayaGup10)- AI가 지능(intelligence)을 가격이 매겨지는 자원으로 바꾸면서, 시장의 모든 계층이 그 가격을 누가 통제할지를 두고 경쟁 중
- AI 랩들은 사용량이 자신을 거쳐 흐르길 원하고, 애플리케이션은 랩들보다 지능을 더 잘 배분할 수 있음을 증명하려 하며, 국가는 지능이 국가 인프라가 될 만큼 저렴해지길 원함
- 지능의 비용은 더 이상 소프트웨어의 입력값이 아니라, 기업·시장·지정학이 재편되는 축(axis) 으로 작동
- AI 투자가 소프트웨어 투자와 다른 이유는 변수가 더 많고, 변수들이 불균등하게 결합(coupled) 되며, 각 변수가 자체 곡선으로 움직이는 하위 변수로 분해되기 때문
- 매시간 방정식 자체가 다시 쓰이는 시스템을 분석하는 것이며, 어떤 변수든 충분히 움직이면 다른 변수의 의미를 바꾸는 재편의 연속
AI 투자가 소프트웨어 투자와 다른 이유
- 소프트웨어에서는 패턴 매칭이 어렵긴 해도 작동했으며, 배포 비용(distribution cost) 이 고객 획득 효율을, 전환 비용(switching cost) 이 유지·확장을 결정
- CAC payback, NDR, magic number, Rule of 40은 모두 이 두 힘의 하위 결과물
- AI는 세 가지 이유로 이를 무너뜨림
- 시스템에 변수가 더 많음
- 변수들이 불균등하게 결합됨
- 각 변수가 자체 곡선으로 움직이는 하위 변수로 분해됨
- Capability, cost, latency, deployment, regulation, talent 중 어느 하나라도 움직이면 나머지의 의미가 바뀌고, 한 제약을 풀면 다음에 중요한 제약이 달라짐
각 변수가 바꾸는 것
- 이미 논의되는 익숙한 변수는 capability, cost, latency
- 더 어려운 변수는 연구·제품에서 나오는 unlocks로, 그 성격과 깊이를 사전에 모델링하기 어렵고 도래 속도가 계속 가속
- 소프트웨어가 고정값으로 다루던 제약이 AI에서는 전략적 선택이 됨: geopolitics, deployment, talent
-
Capability
- reasoning, context, multimodality, tool use, planning, memory, controllability로 분해되며 각각 자체 곡선에서 격렬하게 이동
- context는 3년 만에 4천 토큰에서 100만 토큰 이상으로 확장
- reasoning은 프롬프팅 트릭에서 독자적 모델 클래스로 발전
- retrieval pipelines, output parsers, prompt scaffolds 같은 인프라를 흡수했으며, 이들은 모델 약점을 보완하던 보철물(prosthetics) 이었음
- 프롬프트를 담을 수 있는 모델과 코드베이스나 고객 이력을 담을 수 있는 모델은 서로 다른 제품이며, 성능 향상은 모든 애플리케이션을 균등하게 끌어올리지 않고 병목(bottleneck) 을 이동시킴
- reasoning, context, multimodality, tool use, planning, memory, controllability로 분해되며 각각 자체 곡선에서 격렬하게 이동
-
Cost
- 비용 하락은 단순히 마진을 개선하는 게 아니라 누가 경쟁할 수 있는지를 바꿈
- 한때 frontier API가 필요했던 워크플로가 저렴한 open-weight 모델, 파인튜닝된 전문 모델, 라우팅된 스택으로 이동하며 프리미엄 제품이 commodity feature로 전락
- DeepSeek은 모델 계층의 비용 기대치 변화가 그 위의 마진 풀을 재경로화할 수 있음을 더 격렬하게 보여줌
- 비용 하락은 단순히 마진을 개선하는 게 아니라 누가 경쟁할 수 있는지를 바꿈
-
Latency
- AI가 비동기 프롬프팅에서 실시간 워크플로로 이동하며 변수가 됨
- 느린 모델은 메모 작성엔 괜찮지만 sales call, support conversation, tutoring session, security response에서는 무너짐
- 반대편에 사람이 기다리는 순간 latency는 성능 디테일이 아니라 시장 존재 가능 여부를 결정
- voice는 품질, 인터럽션 처리, 분당 센트 단위 가격이 함께 도래했을 때 그 선을 넘음
- latency 하락은 같은 제품을 빠르게 만드는 데 그치지 않고 새로운 사용 표면(surface) 을 열어줌
- AI가 비동기 프롬프팅에서 실시간 워크플로로 이동하며 변수가 됨
-
새로운 곡선들
- 2년 전엔 목록에 올릴 수 없던 inference-time compute, task horizon, 그리고 AI 자체 생산의 입력
-
Inference-time compute
- 컴퓨팅을 10배 더 쓰면 더 나은 답을 얻는 다이얼은 이전 소프트웨어에 없던 진정한 신규 요소이며, outcome당 비용을 선택의 문제로 만듦
- 같은 모델의 10초 쿼리와 10분 쿼리는 서로 다른 가격의 다른 제품이며, 마진은 모델 가격이 아니라 시스템의 판단에 좌우됨
- 이는 labs에 대한 애플리케이션 계층의 반격으로, frontier 모델이 제품 로직을 흡수할수록 각 기업은 자신이 고객의 토큰을 더 잘 배분할 수 있음을 주장해야 함
- lab은 사용량 확대를, 애플리케이션은 성과 가치가 있는 곳에만 지출하도록 인센티브가 갈림
- 컴퓨팅을 10배 더 쓰면 더 나은 답을 얻는 다이얼은 이전 소프트웨어에 없던 진정한 신규 요소이며, outcome당 비용을 선택의 문제로 만듦
-
Task horizon
- 깊이 다이얼이 inference-time compute라면, task horizon은 길이 다이얼로 AI가 사람 개입 전까지 스스로 작동하는 시간
- 단위가 call에서 workflow로 이동
- 에이전트가 수 시간 작동하고 하위 에이전트를 생성하며 의사결정 경로당 수백만 토큰을 소모해, 사용량이 더 이상 seat에 비례하지 않음
- 길이와 깊이를 곱하면 모든 Fortune 500 CFO가 묻는 토큰 청구서가 됨
- 깊이 다이얼이 inference-time compute라면, task horizon은 길이 다이얼로 AI가 사람 개입 전까지 스스로 작동하는 시간
-
AI 자체 생산의 입력
- synthetic data 생성, 코드 작성, evals 생성, 실험 주기 압축에 AI가 투입됨
- 각 세대가 다음 세대 구축 시간을 단축해 변화율이 내생적(endogenous) 이 됨
- 이 재귀로 인해 변화 주기가 펀드레이징 주기보다 짧아졌고, 어떤 thesis의 반감기도 줄어드는 중
- synthetic data 생성, 코드 작성, evals 생성, 실험 주기 압축에 AI가 투입됨
-
Geopolitics
- 전쟁이 명시적으로 드러나는 지점이며, China는 구조적으로 효율성과 open-weight 공개로 밀림
- 제한된 칩 접근과 frontier 스택 일부에서의 배제가 그 전략을 합리적으로 만듦
- U.S.는 open-weight frontier 모델로 여전히 경쟁 가능하나 아직 동일한 구조적 답을 내놓지 못함
- 소프트웨어는 수십억 달러 규모의 학습이 필요 없었으나, frontier open weights는 compute financing, patient capital, release governance, serving infrastructure, 그리고 인재 경쟁 수단이 필요
- 어떤 미국 그룹은 federation이나 financial engineering을 통해 그 학습 비용을 합리화해야 함
- frontier labs는 기술이 위험하다고 믿어 capability 기반 규제를 주장하며, frontier 접근이 통제·감사·계량되고 API 뒤에 머물 때 이익을 봄
- DeepSeek은 단순한 모델 공개가 아니라 지능의 가격을 누가 정하느냐를 둘러싼 전쟁의 한 발의 총성
- 전쟁이 명시적으로 드러나는 지점이며, China는 구조적으로 효율성과 open-weight 공개로 밀림
-
Deployment
- 가치가 전부 cloud로 귀속되지 않기에 여전히 유동적
- 추론은 제품을 망치지 않는 한 가장 저렴한 곳으로 이동: frontier reasoning은 cloud, latency는 edge, 프라이버시·개인화는 on-device, 세 가지 모두 필요한 워크플로는 hybrid
- 모델이 데이터를 저장만 하는 게 아니라 사용자의 context, memory, documents, voice, code, behavior, enterprise permissions를 추론하기에 프라이버시가 SaaS보다 더 중요
- 추론이 일어나는 위치가 누가 마진을 가져가고, 누가 context를 소유하며, 고객이 누구를 신뢰하는지를 결정
- 가치가 전부 cloud로 귀속되지 않기에 여전히 유동적
-
Talent
- SaaS에서 인재는 실행 변수였으며, 더 나은 팀이 더 빠르게 만들고 더 잘 팔고 더 규율 있게 운영
- AI에서 인재는 생산의 원재료(raw input) 이며, 소수의 연구자가 architecture, data mixture, eval regime, cost-capability 곡선 자체를 바꿀 수 있음
- 팀이 시장에 맞춰 실행하는 데 그치지 않고 시장의 형태를 바꿀 수 있음
- 운영 품질뿐 아니라 research taste가 자산의 일부가 됨
위협이 더 이상 경쟁자가 아님
- SaaS에서는 보통 다른 회사에 의해 죽음: 자금이 더 많은 경쟁자, 더 빠른 팀, 영역을 확장하는 기존 업체
- 한 가지 예외는 타사 플랫폼 위에 세운 회사가 가격·약관 변경으로 경쟁자 없이 소멸되는 경우
- AI는 이 예외를 기본값(default) 으로 만듦
- AI의 위협은 계층 이동(layer migration) 으로, capability, cost, latency, deployment, regulation, trust 중 어느 변수든 충분히 변하면 작업이 이동
- 모델, open-weight 대안, 고객의 데이터 플랫폼, 에이전트 런타임, 또는 디바이스 자체로 옮겨갈 수 있음
- 또 다른 변수는 demand로, 구매자는 느리게 움직이지만 순진하지 않으며 lock-in 비용을 알기에 그 지연 속 차익이 닫히는 중
회사 구축 방식도 역전됨
- 과거 가정과 전통적 VC 조언이 사라짐
- SaaS가 생산성과 좋은 분위기를 팔았다면, AI는 점점 outcomes와 services를 파는 덜 관대한 사업이며, 성과가 작동해야 제품이 좋고 그 성과가 충분히 효율적으로 생산돼야 회사가 작동
-
Consumer와 Enterprise의 분기
- consumer에서는 breadth만으로 충분: 빠르고 저렴하고 폭넓게 유용하며 실패해도 용서됨
- enterprise에서는 기준이 다름: 특정 워크플로 안에서 고객의 context, permissions, data, risk tolerance를 내장한 채 작동해야 함
- 그래서 frontier 모델 단독은 enterprise 제품이 아니며, 가치는 모델을 회사 안에서 쓸모 있게 만드는 application, orchestration, services, proprietary data 계층에 자리함
-
Distribution과 Talent
- 어제의 모델이 새 제품을 가능케 해서 회사가 화요일에 포지션을 바꿀 수 있음
- 일부 회사는 움직이는 목표를 팔 수 있는 사람으로 판매 인력 프로필을 이미 바꿈
- 처음부터 top-down 방식이 일부 회사에서 작동
- 어제의 모델이 새 제품을 가능케 해서 회사가 화요일에 포지션을 바꿀 수 있음
-
경제 구조
- services-as-software가 가격 책정을 바꾸고, systems-integrator 파트너십이 기존 플레이북보다 수년 일찍 발생
- 시장이 갈라짐: 일부 투자자는 제품이 끊임없이 재구축되는 포트폴리오를 보며 제품이 거의 중요하지 않고 services가 진짜 사업이라 결론, 다른 이들은 컨설팅처럼 보이는 것에 거부감
- 더 불편한 진실은 AI에서 product, services, deployment, distribution이 회사마다 재조합되는 중이라는 점
-
창업자의 혁신
- 좁은 ICP, 하나의 wedge, 천천히 구축, 예측 가능한 채용, product-led 유지: 변수가 가만히 있지 않고 고객이 point solution을 원하지 않는 시장에선 어느 것도 충분치 않음
- 승리하는 것으로 보이는 요소는 빠른 피드백 루프, 권한을 가진 소규모 팀, 6개월 전 계획이 아니라 변화에 맞춰 재조직하는 편안함
이제 창업자와 국가의 과제
- AI에서 가치는 한 번 포착해 방어되는 게 아니라 지속적으로 재가격화·재배치되며, 변수는 그 재배치의 방향과 속도를 읽는 수단
- 모든 AI 회사는 가정의 스택 위에 앉아 있고, 견고한 회사는 자신이 어떤 가정에 롱이고 어떤 가정에 숏인지를 앎
- AI에 투자하고 구축하는 일은 소프트웨어 회사를 인수 심사하는 것보다 트레이딩 북(trading book)을 운용하는 것에 가까움
- 일부 곡선엔 롱, 다른 곡선엔 숏이며, 가장 중요한 순간에 깨질 수 있는 상관관계에 노출됨
- 어떤 변수에 베팅할지 고르고, 어떤 변수가 자신을 죽일 수 있는지 알며, 잘못된 베팅이 복리로 쌓이기 전에 더 빨리 회복하도록 회사를 구축해야 함
-
정치적 차원
- U.S. 정부가 두 변수를 동시에 다룰 수 있다면 더 나아짐: 위험한 frontier를 통제하되, 지능을 폐쇄형 labs와 경쟁 국가만이 미래를 정의할 만큼 비싸게 만들지 않기
- 승리하는 국가는 가장 많이 규제하거나 가장 많이 공개하는 나라가 아니라, 지능을 신뢰할 만큼 안전하면서도 퍼질 만큼 저렴하게 만드는 방법을 찾는 나라