AI 이후의 소프트웨어: 하네스(Harness) 시대의 개막
(tomtunguz.com)- 소프트웨어 시대의 종말은 하네스(harness) 시대의 시작이며, 고정된 워크플로우와 관리형 DB로 작동하던 SaaS가 지능을 갖춘 AI로 대체되는 중
- AI는 강력하지만 야생마처럼 길들여지지 않은 상태로, 그 힘을 활용하기 위해서는 체계적 통제(domestication) 가 필요함
- AI 에이전트 하네스는 중심의 LLM을 둘러싼 7가지 핵심 구성요소로 정의되며, 각 요소가 프로덕션 수준의 신뢰성과 성능을 좌우
- 모든 기업이 동일한 모델에 접근 가능한 시대에는 모델 자체가 아니라 하네스를 더 잘 설계하고 운용하는 쪽(best rider) 이 승리
- 빅랩들이 우선시하지 않는 수천 개의 분리된 시장이 스타트업에게 기회로 남음
하네스 시대의 의미
- AI는 고정 워크플로우 기반의 SaaS와 관리형 데이터베이스를 지능(intelligence)으로 대체하며 소프트웨어 패러다임을 재정의
- AI를 머스탱(야생마)에 비유, 강력하지만 거칠어 그대로는 사용할 수 없으며 길들이는 작업이 곧 하네스
- 길들임의 본질은 LLM을 중심에 두고 그 주위에 7개 구성요소를 방사형으로 배치하는 아키텍처
AI 에이전트 하네스의 7가지 구성요소
-
1. Context & Memory (맥락과 메모리)
- 범용 모델은 용도별 맞춤 검색(bespoke retrieval) 이 필요하며, 방사선 전문의용 컨텍스트 검색 시스템과 법무 보조원용 시스템은 동일할 수 없음
- 단기 메모리 ("에이전트가 45초 전에 무엇을 하고 있었나"), 대규모 이미지 검색(방사선·영상 생성), 수십억 문서 키워드 검색 등 케이스별로 시스템이 달라짐
- 검색 옆에는 컨텍스트 데이터베이스가 위치, 비즈니스가 실제로 어떻게 운영되는지 담은 "레시피북" 역할
- 사람들이 머릿속에 들고 출근하는 표준운영절차(SOP)가 곧 그 레시피
- 초기 캡처와 사람·프로세스 변화에 따른 진화가 컨텍스트 DB의 본질
-
2. Tools & Action (도구와 행동)
- 도구는 에이전트가 외부 세계에 영향을 미치는 수단이며, 컨텍스트 DB의 레시피가 "무엇을 할지"라면 도구는 그것을 실제로 수행하는 재료와 기구
- 현대 하네스는 레지스트리(registry) 를 통해 도구를 노출, 모델이 전달한 인자 검증, 호출 디스패치, 민감 작업은 승인 게이트 통과, 결과를 에이전트 루프로 파싱
- MCP가 도구 연결을 위한 결합 조직(connective tissue)으로 부상
- 하네스의 품질은 안전하게 노출할 수 있는 도구 수와 실패를 깔끔히 처리하는 능력에 의해 결정됨
-
3. Orchestration & Loop (오케스트레이션과 루프)
- 에이전트 루프는 사고(think) → 행동(act) → 관찰(observe) → 반복(repeat) 의 구조
- 계획 수립, 작업 분해, 서브 에이전트, 재시도, 중단 조건이 작업 수행 방식을 규정
- 사용할수록 개선되어야 하며, 각 실행으로부터 학습하는 클로즈드 루프 패턴이 벤더 간 차별화 요소
-
4. State & Persistence (상태와 영속성)
- 다수의 인원이 동시에 시스템을 사용하는 대규모 엔터프라이즈에서는 회복 탄력성(resilient) 이 필수
- 10단계 작업의 7단계에서 하네스가 크래시할 경우 처음부터가 아닌 8단계부터 재개되어야 함
- 파일 시스템, 체크포인트, 세션 스레드, 아티팩트 저장소가 작업 손실을 방지하는 메커니즘
-
5. Sandbox & Compute (샌드박스와 컴퓨팅)
- 각 에이전트에는 독립된 작업 공간(샌드박스) 이 필요
- 격리된 Unix 워크스페이스, 통제된 네트워크 송신(egress), 모델 외부에 보관되는 자격 증명(credentials)이 보안성·기밀성·대규모 속도를 보장
-
6. Observability & Governance (관측성과 거버넌스)
- "볼 수 없는 것은 신뢰할 수 없음" - 모든 단계 추적, 모든 도구 호출 로깅, 회귀 테스트로서의 evals 실행, 최고 리스크 결정에는 사람 개입(human-in-the-loop) 이 데모를 프로덕션 시스템으로 전환시킴
- 가드레일(Guardrails) 은 정책 강제, Evals는 고객보다 먼저 회귀를 포착
-
7. Cost & Workflow Optimization (비용과 워크플로우 최적화)
- 일곱 번째는 아키텍처적 판단력(architectural judgment)
- 결정론적 vs 비결정론적으로 처리할 영역 구분, 단계별 적합 모델(최첨단·중형·소형·파인튜닝) 선택, 지식을 스킬에 둘지 메모리에 둘지의 판단
새로운 경쟁 구도
- 결과는 소프트웨어의 새로운 경쟁 다이내믹이며, 모든 카테고리에 동일하게 적용되지는 않음
- 메이저 랩(주요 AI 연구소)이 우선시하는 시장은 빠른 실행력과 모델 직접 통제에서 이익을 얻음
- 그러나 그 외 수천 개의 별도 시장이 스타트업에게 열려 있음
- 모든 기업이 같은 모델을 사용 가능해진 시대에는 "가장 잘 타는 자(best riders)"가 승리 - 즉 하네스 설계·운용 역량이 핵심 경쟁력
댓글과 토론
저는 저에게 있던 하네스설정을 모두 제거 하였습니다.
하네스는 모델의 발전이 되면 될 수록 모델의 성능을 제약하는 요인으로 동작합니다.
어설픈 하네스 설정은 오히려 더 후진 결과물을 만들어 냅니다.
이미 4.7 이하에 있던 하네스 설정들은 4.8에서는 더 이상 의미가 없으며
지피티 5.5 에서도 걸리적 거리기 만합니다.
OpenAi 홈페이지에 공식적으로 발표한 하네싱 포스팅이 있습니다. OpenAI 내부에서 어떻게 하네싱을 사용했는지 경험담과 팁을 공유하는 내용 입니다. OpenAi조차 자신들 내부 프로젝트에 하네싱을 사용한다는거에요. 하네싱은 분명 필요하고 최종 구현 퀄리티에 직접적인 영향을 줍니다. 무엇보다 같은 퀄리티의 결과물을 구현하는데 드는 토큰을 절반까지도 줄일 수 있습니다. 성능과 가격 전부를 잡을 수 있는데 안쓸 이유가 없죠.