8P by GN⁺ | ★ favorite | 댓글 3개
  • AI 모델이 강력해질수록 소프트웨어 자체의 가치는 떨어지며, 살아남으려는 애플리케이션 회사는 데이터 회사이자 핀테크 회사로 동시에 전환 필요
  • 에이전트가 소프트웨어의 주된 사용자가 되면서 per-seat 가격 모델이 붕괴, 천 명이 십만 개 에이전트를 돌려도 십만 개의 좌석이 아니므로 에이전트가 남기는 결정(데이터)과 옮기는 돈(핀테크) 만이 과금 대상으로 남음
  • 프론티어 모델은 회사 운영 방식을 모르는 천재 집단과 같아, 사람들이 가진 암묵적 판단(judgment) 이 진짜 해자이며, 사용자가 모델 결과를 고쳐온 수정 기록(corrections) 이 학습 신호이자 테스트셋 역할
  • 데이터에 돈이 흐르지 않으면 과학 프로젝트에 불과, Toast·Ramp·Shopify처럼 네트워크와 락인이 있는 핀테크만이 모델 가격 하락 속에서도 마진 유지
  • 판단의 축적과 돈의 흐름 장악, 그리고 쓰기(writes) 방어 가 Lab이 모든 토큰을 보더라도 대체 불가능한 회사로 남는 유일한 길

모델 발전과 소프트웨어 가치 하락

  • 어제 Claude Fable 5가 출시됨, 대중이 쓸 수 있는 첫 Mythos-class 모델로 거의 모든 벤치마크에서 1위, 작업이 길어질수록 격차 확대
    • 모델이 똑똑할수록 소프트웨어 자체의 가치는 하락
  • 모든 벤처 투자 애플리케이션 회사는 이제 데이터 회사 또는 핀테크 회사, 이상적으로는 둘 다여야 함

누가 소프트웨어를 쓰는가의 변화

  • 2년 전 글에서 에이전트가 사용자가 되면 per-seat 가격 모델이 깨진다고 지적했고, 그 선을 넘은 것으로 보임
    • Cloudflare가 에이전트 트래픽이 사람 트래픽을 처음으로 추월했다고 발표
    • 온라인에서 논쟁은 있으나 에이전트가 모든 소프트웨어의 주 고객이 되는 추세는 분명
  • 천 명의 직원이 십만 개 에이전트를 돌리는 것은 십만 개의 좌석이 아님
  • 에이전트가 남기는 과금 가능한 두 가지는 그것이 내리는 결정(=데이터) 과 옮기는 돈(=핀테크)

결정(Decisions) — 데이터라는 해자

  • xAI는 Cursor를 600억 달러에 인수할 옵션 보유, Cursor는 연환산 매출 약 40억 달러
    • 소프트웨어가 비싼 값을 치른 주된 이유는 아님
    • Anthropic과 OpenAI는 이미 Claude Code와 Codex로 개발자 작업을 실시간 관찰 중
    • xAI가 Cursor를 산 이유는 토큰 흐름(token flow) 에 가장 빨리 진입하기 위함
    • Musk(세계 첫 조만장자)는 백만 개발자가 모델을 실제로 쓰는 기록이 Grok 학습에 직접 들어간다고 언급, 높은 가격은 데이터를 느리게 모으는 수년을 건너뛰는 통행료
  • Cursor는 출시 직후 몇 주 만에 작동하는 클론들이 나왔으나 어느 것도 자리잡지 못함, 테이스트(taste) 로 승부했기 때문
    • 무엇을 보여주고 언제 사라질지에 대한 수천 개의 작은 판단
    • 클론은 인터페이스만 복제할 뿐, 개발자가 수년간 수락·거부·재작성한 기록은 상속 불가
    • Cursor는 이제 그 diff로 자체 모델을 학습, 데이터가 1차 해자가 됨
  • 600억 달러 가치의 이유: 직원 90%를 회사 운영 방식을 전혀 모르는 천재 팀으로 대체하는 것과 같음
    • Fable 5는 작년 최고 모델이 절반을 겨우 처리하던 실제 소프트웨어 작업의 80%를 해결, 천재들은 서로 구분이 어렵고 교체 가능
    • 이들이 실패하는 이유 하나: 대체된 사람들이 알던 것을 아무도 모름

암묵지(tacit knowledge)와 판단의 축적

  • 임시방편은 사람 머릿속 지식을 꺼내 모델에 컨텍스트로 넘기는 것, 그러나 대부분은 구조화된 형태로 존재하지 않음
    • 포기한 거래, 새벽 2시에 되돌린 코드 한 줄, 아무도 쫓지 않았고 이유도 적히지 않은 고객 — 이것이 진짜 핵심
    • 워크플로우로 적을 수 없는 판단이며 현재 저장되지 않음
  • 이제 context → harness → judgment 로 이동 중
    • Context는 검색(retrieval), 올바른 조각을 모델 앞에 두는 것
    • Harness는 모델이 돌 수 있는 루프(scaffolding)
    • Judgment는 마지막 층이자 유일하게 복리로 쌓이는 층, 모든 호출·수정·되돌림이 데이터 위에 남긴 것
  • 지금 보는 AI 애플리케이션 피치마다 context 슬라이드를 해자로 내세우나, 이제 table stakes에 불과
    • 모든 경쟁자가 같은 방식으로 컨텍스트를 조립 중이기 때문

수정 기록(corrections)의 두 역할

  • 수정은 스코어카드(scorecard) 로 볼 수 있음, 사용자가 모델 결과를 고칠 때마다 그 사업에서 무엇이 옳은지 기록
  • 스코어카드는 두 가지를 동시에 수행
    • 빌린 모델을 그 사업에 맞게 튜닝하는 학습 신호
    • 에이전트가 실제로 나아지는지 아는 유일한 수단인 테스트셋, 공개 벤치마크는 특정 워크플로우를 측정하지 못함
  • 처음부터 모델을 사전학습할 필요 없음, Cursor조차 안 함
    • Cursor의 자체 모델은 오픈소스 베이스 위에 올라가 있고 diff가 차별화 담당
    • 프론티어 모델 위 fine-tuning과 RL 비용이 충분히 저렴해져 Series B 회사도 이 루프 실행 가능, 2년 전에는 lab 필요
  • Sarah Guo는 이 영역을 the untrainable(외부에서 정답을 채점할 수 없는 작업)이라 부름, 수정이 이를 소유하게 되는 방법

수직(vertical) AI 리더들의 사례

  • Harvey는 110억 달러, Legora는 50억 달러 돌파, 둘 다 법률 시장 대상
    • 독립 도구를 넘어 사건(matter) 전체 소유로 질주, 변호사가 초안에 가하는 수정은 누구도 못 보는 corrections이기 때문
  • Rogo는 금융에서 동일 전략, 애널리스트가 모델을 만들고 메모를 고치는 과정을 포착
  • 이들 중 누구도 파운데이션 모델을 학습하지 않음, 빌린 모델 주위에 harness를 짓고 그 안을 흐르는 judgment를 보유, 이것이 복리로 쌓이는 것
  • 기존 강자도 마찬가지
    • Figma는 SVG 이상을 소유, 디자인이 v1에서 v47로 간 역사와 도중에 폐기된 모든 버전 — 디자인 테이스트의 채점된 기록
    • Linear는 닫힌 모든 티켓 아래의 논쟁 보유
    • Notion은 천 번의 편집에 걸친 팀 사고의 형태 보유
    • 경쟁자가 고객을 빼가려 해도 이 모든 것은 export 불가, 제너릭 모델에 없는 답

Lab들이 판단을 사들이는 흐름

  • Lab들이 판단을 기성품으로 사들이는 중, 사람이 라벨링한 데이터에서 시작
    • Mercor는 100억 달러 가치, 전문가 네트워크에 시간당 85달러 지급
    • Meta는 파이프라인 소유를 위해 Scale에 140억 달러 지불
    • 뉴욕의 한 스타트업은 전 과정을 촬영하게 해주면 아파트를 무료로 청소, 로보틱스 팀이 사람이 다음 행동을 결정하는 걸 봐야 하기 때문
    • 다수의 RL environment 회사가 장기 작업에 대한 판단을 팔며 연환산 매출 수억 달러 도달
  • Lab들은 인터넷 전체로 학습하다 동났고, 이제 결정을 직접 구매

돈(Dollars) — 핀테크라는 해자

  • 23andMe는 천오백만 명의 DNA를 보유했음에도 작년 파산
    • 데이터에 돈이 흐르지 않으면 과학 프로젝트 자금 대기에 불과
    • 대부분 창업자가 이 절반을 놓치고 있음
  • Toast는 수년 전 이를 파악, 식당은 본질적으로 주방이 붙은 결제 처리기
    • 결제가 소프트웨어보다 훨씬 큰 수익 창출
  • Ramp는 더 나아감, 무료 법인카드에 어디서도 수수료 없음, 십억 달러가 흐를 때 1달러마다 1~2센트를 떼어감
    • 반올림 오차로 세운 320억 달러 회사, 무료 카드는 interchange로 가는 정문
    • swipe fee는 네트워크가 버텨서 유지되고, 돈은 머무는 동안에도 float를 모으며 수익 제공
  • 모든 돈 미터에 해자가 있는 것은 아님
    • 한 인기 vibe-coding 앱은 판매하는 크레딧에서 약 50% 마진, 연환산 매출 대부분이 추론(inference)에 대한 마크업
    • 토큰 마크업 뒤에는 네트워크가 없고 자체 추론 비용도 분기마다 하락, 모델이 싸지면서 마진이 녹아내림
    • 지속 가능한 핀테크는 락인이 깔린 것 — 네트워크가 버티는 결제, 은행이 못 보는 데이터로 보증하는 대출

에이전트용 결제 인프라

  • 에이전트용 결제 인프라가 드디어 가동
    • 에이전트가 항공권을 예약하고 부품을 주문하고 벤더에 지불할 때, 무언가는 청구를 승인·운반하고 수수료를 떼야 함
    • Stripe가 이를 위한 프로토콜 출시, Visa와 Mastercard가 표준 선점 경쟁 중
    • OpenAI는 이미 자사 에이전트가 사는 것마다 몇 퍼센트 차감
    • 1조 개 에이전트의 거래는 곧 역사상 최대 결제 경제로 부상

하나를 다른 하나로 전환

  • 오래 가는 최고의 애플리케이션 회사는 두 절반을 분리해서 다루지 않음
    • Judgment는 일에 관한 결정의 기록, 핀테크는 돈에 관한 결정의 기록, 강한 회사는 하나를 다른 하나로 전환
  • Shopify가 가장 좋은 예시
    • 매장 소프트웨어로 시작 → 결제 부착 → Shopify Capital로 매장에 흐르는 매출 데이터로 보증한 대출 제공, 은행이 단독으로는 못 하는 대출
    • 가맹점이 크면 매출이 늘고 데이터가 다음 대출을 도움
    • 현재 Shopify 매출의 약 4분의 3이 소프트웨어 구독이 아닌 돈 쪽에서 발생
    • Stripe는 Radar로, Ramp는 지출 데이터와 카드로 동일 루프 운영
  • Rippling도 유사 시도, 핵심 객체는 직원
    • 급여·복지·기기·카드가 하나의 source of truth에 의존
    • 아직 아무도 락인하지 못했고 Gusto와 Deel도 나란히 성장 중이나, 객체를 소유한 회사가 복리로 쌓는 동안 나머지는 손으로 조립

쓰기를 방어하라(Guard the writes)

  • 아무도 풀지 못한 "헤드리스(headless)" 긴장 존재
    • 모든 소프트웨어가 에이전트에 의해 쓰이게 되면, 유용하려면 에이전트를 들여야 하고 살아남으려면 전부 가져가게 둘 수 없음
    • 모든 system of record는 에이전트가 어떤 프로토콜로든 연결될 만큼 열려 있으면서, 필요한 걸 얻은 뒤 아무도 이탈하지 못할 만큼 닫혀 있어야 함
    • Salesforce는 올해 Slack 데이터를 Glean과 외부 에이전트로부터 차단, 공개적으로 한 첫 사례
  • 지속 가능한 회사를 짓는 길은 분리
    • 에이전트가 읽도록 허용, 읽기는 싸고 어쨌든 중요
    • 쓰기는 방어
  • 새 판단이 입력되고 사람과 에이전트가 서로 승인·수정·되돌리는 지점은 경쟁자가 쉽게 이전할 수 없는 부분
    • 그들이 긁어가는 것은 어제의 상태, 지금 내려지는 결정만이 자기 것으로 남음

"앤트로픽이 이걸 만들면?"

  • Lab들이 이미 토큰 흐름 안에 있으니 해자가 어디 있냐는 반론 가능
    • Claude Code는 개발자가 실행하는 모든 명령과 무시한 제안을 보고, ChatGPT는 제품이 1년 동안 기록하는 것보다 많은 결정을 하루에 관찰
  • 반론에 대한 답: 그들의 도구가 보는 것은 대부분 제너릭함
    • 모든 모델이 보는 동일한 코딩과 글쓰기, lab들이 서로 commoditize하려 경쟁하는 바로 그것
    • 희귀한 판단은 한 회사 깊숙이 존재 — 병원이 스캔을 읽는 방식, 회사가 walk away하기로 배운 거래, 어느 것도 lab의 챗박스에 닿지 않음
  • Lab들은 수년간 기업에 그들의 데이터로 학습하지 않는다고 말해 옴
    • 제품 안 모델을 통과하는 암묵지는 계약으로 자기 것으로 유지, 그들은 trace가 지나가는 걸 보지만 보관하지 않기로 합의
  • 핀테크 절반은 lab이 원하지도 않는 것
    • lab은 데이터는 기꺼이 가져가나, loan book·사기 손실·40개 주의 money-transmitter 라이선스는 쓸모없음
    • 구매자에게 데이터는 인수할 가치를 만들고, 핀테크는 떼어내기 어렵게 만듦
  • Cursor는 카테고리 최고의 데이터 엔진을 만들었고 lab이 600억 달러에 인수
    • 이것이 꿈인지 경고인지는 바꾸기에 너무 늦을 때까지 모름
    • 살아남는 두 가지를 지을 것 — 판단을 축적하고 돈의 길목에 앉기, 그것이 "앤트로픽이 이걸 만들면?" 질문을 견디는 법

댓글과 토론

뭔가 그럴듯한데 이해하기 어렵네용

판단의 축적과 돈의 흐름 장악, 그리고 쓰기(writes) 방어 가 라벨(lab)이 모든 토큰을 보더라도 대체 불가능한 회사로 남는 유일한 길 -> 이것의 의미가 모호한데 혹시 부연 설명 가능할까요?

AI가 요약하다 단어 하나는 오류를 낸거 같네요. 라벨이 아니라 Lab 인거 같습니다.