- AI가 모든 소프트웨어를 작성하는 시대에는 토큰(추론 비용)을 절약하는 소프트웨어가 진화론적 선택 압력을 통해 살아남게 될 것
-
생존 비율 공식을 통해 소프트웨어의 적합도를 측정하며, 인지 절약이 인지 비용을 넘어서는 경우(1을 초과)에만 생존 가능
- Git, grep 같은 도구는 통찰 압축과 기판 효율성 덕분에 AI가 다시 만들어 쓰기에는 비용이 터무니없이 큰 사례
- 에이전트가 도구를 채택하려면 인지도(Awareness) 와 마찰 최소화(Friction) 가 필수적이며, Desire Paths 설계가 효과적
- AI 중심의 시대에도 인간 계수(Human Coefficient) 가 작동해, 인간의 개입과 선호가 직접적인 가치를 만드는 영역은 계속 살아남게 될 것
배경: AI 시대의 소프트웨어 예측
- 2024년 6월 Death of the Junior Developer, 10개월 전 오케스트레이터 도래 예측, Gas Town 프로젝트 등을 통해 AI 발전 곡선을 지속적으로 맞혀옴
- 2023년 코드 자동 완성 → 2024년 대화형 인터페이스 → 2025년 초 에이전트 → 2026년 초 오케스트레이션으로 이어지는 흐름을 외삽해 Gas Town 개발
- 모든 예측의 근거는 지수적 발전 곡선을 그대로 믿는 태도에 있음
- Dario Amodei와 Andrej Karpathy가 소프트웨어의 미래에 대해 말해온 방향을 전적으로 신뢰함
- Gas Town은 이러한 외삽이 실제로 작동함을 보여준 사례로, 2025년 말 모델과 다수의 임시적 보완을 통해 간신히 성립하는 형태를 먼저 확인
위협받는 소프트웨어 생태계
-
SaaS 기업에 대한 압력이 증가하며, 구매 대비 구축(build)의 비용 구조가 바뀌어 비즈니스 부서가 직접 바이브 코딩(vibe coding) 으로 자체 SaaS를 만드는 사례 확산
- 불과 3년 전 GPT-3.5가 단일 함수 작성도 버거웠던 것과 달리, 현재는 소규모지만 실질적 가치가 있는 SaaS를 직접 생성 가능
-
Stack Overflow와 Chegg가 초기 타격을 받았고, 이후 Tier-1 고객 지원 소프트웨어, 로우코드·노코드 시스템, 콘텐츠 생성 도구, 각종 생산성 도구로 압박이 확산
- IDE 벤더들 역시 Claude Code 등장 이후 경쟁 압력을 체감하기 시작
- AI 연구자들의 예측이 약 40 년간 높은 정확도를 보여왔다는 점에서, 모든 소프트웨어 영역이 위협받을 가능성을 전제로 대비 필요
선택 압력 모델(Selection Argument)
- 추론에는 토큰이 필요하고, 토큰 소비는 에너지 사용으로 이어지며, 에너지는 곧 비용으로 환산됨
- {토큰, 에너지, 돈}은 동일한 자원 제약으로 취급 가능하며, 항상 제한된 상태로 존재
-
인지 비용을 줄이는 소프트웨어가 살아남는다는 단순한 규칙이 소프트웨어 생태계 전반을 형성
- 제한된 자원 환경에서 더 효율적으로 자원을 사용하는 개체가 그렇지 못한 개체를 밀어내는 진화론적 선택 압력과 동일한 구조
생존 비율(Survival Ratio) 공식
-
Survival(T) ∝ (Savings × Usage × H) / (Awareness_cost + Friction_cost)
-
Savings: 도구를 사용함으로써 절약되는 인지 비용, 즉 동일한 기능을 처음부터 합성할 때 대비 절감되는 토큰량
-
Usage: 도구가 다양한 상황에서 반복적으로 사용될 수 있는 빈도와 적용 범위
-
H (Human Coefficient): 효율성과 무관하게 인간이 만든 것에 가치를 두는 수요를 반영하는 계수
-
Awareness_cost: 에이전트가 해당 도구의 존재를 알고, 기억하고, 적절한 순간에 선택하는 데 드는 에너지
-
Friction_cost: 실제 사용 과정에서 발생하는 오류, 실패, 재시도, 오해로 인해 소모되는 에너지
- 생존을 위한 최소 비율은 1이며, 경쟁이 존재하는 환경에서는 이보다 훨씬 높은 비율 요구
- 예: 생존 비율이 1.2인 도구는 2.5를 기록하는 경쟁 도구에 의해 밀려날 수 있음
레버 1: 통찰 압축(Insight Compression)
- 소프트웨어 산업이 오랜 시간에 걸쳐 축적해 온 다시 발견하기에 지나치게 비싼 지식을 재사용 가능한 형태로 압축
-
Git 이 대표 사례로, 커밋 DAG, 포인터로서의 참조(ref), 인덱스, reflog 등은 수십 년간의 시행착오가 응축된 구조
- AI가 이를 처음부터 재구현하려면 동일한 지적 역사를 다시 밟아야 하므로 경제적으로 전혀 합리적이지 않음
- 데이터베이스, 컴파일러, 운영체제, 워크플로우 엔진, 모니터링 시스템 전반에 동일한 원리 적용
-
Kubernetes 는 설계가 복잡해서가 아니라, 분산 시스템 자체가 본질적으로 복잡하기 때문에 복잡함
-
Temporal 은 멱등성 재시도와 함께 saga 패턴을 직접 구현하는 일이 사실상 연구 프로젝트에 가깝기 때문에, 이를 대신하는 내구성 실행(durable execution) 을 제공
- 강한 소프트웨어의 공통된 특성은 다시 합성하려는 시도 자체가 터무니없게 느껴질 정도의 통찰 밀도
-
Gas Town에서의 캐릭터 역할 모델이나
gt sling 같은 동사 역시, 복잡한 개념을 짧고 기억하기 쉬운 표현으로 압축한 사례
레버 2: 기판 효율성(Substrate Efficiency)
-
grep 은 재발명이 사실상 미친 짓에 가까운 또 하나의 사례
- Ken Thompson이 오후 한나절에 만들 정도로 단순하지만, CPU 기반 처리를 통해 막대한 인지 비용을 절약
- 텍스트 패턴 매칭에서는 CPU가 GPU를 여러 자릿수 차이로 압도
- LLM의 곱셈 방식은 패턴 매칭을 조합해 “대략 94쯤”을 먼저 추정하고, 이후 기억된 룩업 테이블로 자릿수를 보정하는 형태
- 이 계산이 모두 GPU 추론 단계라는 극도로 비효율적인 기판 위에서 수행됨
- 계산기, 파서, ImageMagick 같은 복잡한 변환 도구, 다수의 Unix CLI 유틸리티가 이 레버를 적극 활용
- 좋은 알고리듬을 적용하거나, 계산을 CPU·인간 등 더 저렴한 기판으로 이동시켜 토큰과 에너지 소비를 절약
레버 3: 광범위한 유용성(Broad Utility)
- 생존 비율 모델에서 Usage 항목에 해당
- 사용 범위가 넓을수록 인지도 비용이 분산되고, 개별 사용 시 요구되는 토큰 절약 임계값이 낮아짐
- 진정으로 범용적인 토큰 절약 도구는 AI가 이론적으로 재구현할 수 있더라도, 이미 어디에나 존재하고 널리 쓰이는 선택지가 우선됨
-
Temporal 은 상대적으로 높은 인지도 비용과 마찰 비용에도 불구하고 PostgreSQL 만큼 범용적인 워크플로우 모델 제공
- 공격적인 통찰 압축, 계산 기판의 능숙한 활용, 광범위한 유용성이라는 세 가지 레버를 모두 보유
-
Dolt 는 Git으로 버전 관리되는 데이터베이스로, 8년간 유지되어 온 오픈소스 프로젝트
- 에이전트 기반 프로덕션 및 DevOps 워크플로우에서 뒤늦게 킬러 앱을 발견
- 에이전트가 프로덕션 환경에서 실수하더라도 Git의 전체 기능을 활용해 롤백·롤포워드 가능
-
코드 검색 엔진은 LLM이 기존 대비 10배에서 100배 더 많은 코드를 생성하면서 중요성이 급격히 상승
- grep이 감당할 수 없는 규모의, 이른바 “너무 커서 grep으로는 안 되는 영역” 이라는 대규모 범용 틈새 형성
- 발견하기 어려운 엣지 케이스가 많은 비자명한 문제를 해결하고, 저렴한 계산 기판을 사용하며, 범용적 적용이 가능한 점에서 세 가지 레버를 모두 충족
레버 4: 홍보(Publicity)
- 인지 비용 절약만으로는 충분하지 않으며, 인지도 문제, 즉 사전 선택 단계에서의 문제 해결 필요
-
Dolt는 레버 1~3을 모두 갖췄지만, 초기에는 레버 4가 부족해 널리 사용되지 못한 사례
- 인지도 비용을 지불하는 방법은 여러 가지 존재
- 훌륭한 제품을 만들고 인기를 얻은 뒤, 커뮤니티를 통해 자연스럽게 훈련 데이터에 포함되기를 기다리는 방식
- 또는 비용을 투입해 에이전트용 문서화에 투자하거나 광고 집행
- 보다 직접적인 방법으로, OpenAI, Anthropic, Google 같은 프론티어 랩의 담당자와 협력해 모델 훈련 과정에 도구를 포함
- 유료 서비스 형태로, 도구의 올바른 사용과 오용을 모두 보여주는 eval을 제작한 뒤 연구자들이 훈련을 조정
-
에이전트를 위한 SEO 개념이 본격적으로 등장 중
- 대규모 예산을 투입하기 어렵다면, 사후 선택 단계에서의 에너지, 즉 레버 5에 의존해야 하며, 이를 위해 도구를 최대한 에이전트 친화적으로 설계 필요
레버 5: 마찰 최소화(Minimizing Friction)
- 인지도가 사전 선택 단계의 문제라면, 제품 마찰은 사용 이후 단계의 문제
- 에이전트는 항상 시간에 쫓기는 것처럼 행동하며, 무언가 막히면 즉시 우회 경로를 시도
- 마찰이 조금만 있어도 판단이 바뀌어, 더 효율적인 도구 대신 덜 효율하지만 익숙하고 예측 가능한 방법으로 후퇴
- 반대로 취향에 정확히 맞게 설계된 도구는 에이전트가 집요할 정도로 반복 사용
- 문서화 접근법은 훈련 단계가 아닌 추론 시점까지 인지 비용을 미루는 방식
- 도구가 무엇을 잘하는지, 언제 왜 써야 하는지, 빠른 시작 가이드와 후속 문서 경로를 컨텍스트에 직접 주입
- 그러나 더 나은 해법은 에이전트에게 직관적으로 느껴지는 도구 자체를 만드는 것
-
Desire Paths 설계 사례로, Beads 는 4개월간 100개가 넘는 하위 명령과 다수의 하위-하위 명령, 별칭, 대체 문법을 거치며 CLI가 진화
- 이 복잡한 CLI는 인간이 아니라 에이전트의 사용 패턴을 위해 설계됨
- 에이전트가 시도하는 방식을 관찰해 환각을 실제 기능으로 구현, 이제는 거의 모든 추측이 그대로 동작
-
환각 스쿼팅(Hallucination Squatting) 은 LLM이 자주 환각하는 도메인 이름을 역으로 추적해 등록하고, 해당 주소에 아티팩트를 올려 실제로 다운로드하게 만드는 기법
- 국가 단위의 해커 집단조차 Agent UX를 이해하고 활용한다는 점이 드러남
-
Agent UX는 결정적으로 중요하지만 아직 대부분의 도구에서 간과되고 있음
- 이상적인 도구는 에이전트가 이미 익숙한 다른 도구와 닮아 있거나, 문제를 에이전트가 사고하고 싶어하는 방식 그대로 풀어주는 구조
레버 6: 인간 계수(Human Coefficient)
- 토큰 효율성과 무관하게, 인간이 개입했다는 사실 자체로 가치를 얻는 소프트웨어 존재
- 인간 큐레이션, 사회적 증거, 창의성, 물리적 존재감, 승인 같은 요소에서 가치가 파생
-
인간이 고른 플레이리스트는 품질이 동등하고 에너지 효율이 더 높은 AI 생성 플레이리스트를 이길 수 있음
- 게임 분야에서는 실제 인간이 있는 환경이 대체로 승리하며, 명백히 인간보다 강한 AI와만 플레이하고 싶어하는 경우는 드묾
- 에이전트를 배제하는 소셜 네트워크가 오히려 매력적으로 인식될 가능성
- AI가 최고의 교사가 되더라도, 일부 사람들은 의도적으로 인간 교사를 선택할 것
- 높은 Human Coefficient를 가진 영역에서도 경쟁은 치열함
- Karpathy가 그리는 세계에서 에이전트는 누구에게나 무엇이든 될 수 있고, 본질적으로 강한 중독성을 가짐
- 결과적으로 극단적으로 비효율적이지만 H 값이 매우 높은 소프트웨어가 다수 존재하게 될 가능성
희망의 근거
- 인간과 AI 사이를 중개하거나, AI가 곧 직접 수행할 수 있게 될 “똑똑한 척하는 역할” 을 맡은 소프트웨어는 구조적으로 위험
- 그럼에도 불구하고 작성되어야 할 소프트웨어의 양은 사실상 무한
- 모든 질병 치료, 모든 단백질의 거동 모델링, 모든 행성 탐사 시나리오가 여전히 대상
- 인간의 야망은 항상 가용한 인지 능력을 초과하며, 토큰 비용이 하락하더라도 우리는 곧바로 더 먼 프론티어로 이동
- 주의 집중 문제는 인쇄 매체, 인터넷, 소셜 미디어, 실시간 광고, 애그리게이터를 거치며 이미 여러 차례 해결된 경험 보유
-
Desire Paths 설계가 실제로 효과적이며, OpenAI 같은 곳의 대규모 훈련 예산 없이도 에이전트가 자연스럽게 쓰고 싶어하는 도구를 만들 수 있음
-
인간 계수는 분명히 존재하며, 사람들은 이미 에이전트 냄새가 짙은 것에 피로감을 느끼기 시작
- 인간 간의 연결과 창의성을 중심에 두고 설계하면, 결국 문제는 다시 전통적인 마케팅과 브랜딩의 영역으로 수렴
- 여섯 가지 레버가 제공하는 다양한 생존 경로가 존재
- 다시 만들려는 시도 자체가 미친 짓처럼 느껴지는 것을 구축하고, 발견하기 쉽고 사용하기 쉽게 만든다면 충분히 견고한 가능성 확보