4P by GN⁺ | ★ favorite | 댓글과 토론
  • 소프트웨어 시대의 종말은 하네스(harness) 시대의 시작이며, 고정된 워크플로우와 관리형 DB로 작동하던 SaaS가 지능을 갖춘 AI로 대체되는 중
  • AI는 강력하지만 야생마처럼 길들여지지 않은 상태로, 그 힘을 활용하기 위해서는 체계적 통제(domestication) 가 필요함
  • AI 에이전트 하네스는 중심의 LLM을 둘러싼 7가지 핵심 구성요소로 정의되며, 각 요소가 프로덕션 수준의 신뢰성과 성능을 좌우
  • 모든 기업이 동일한 모델에 접근 가능한 시대에는 모델 자체가 아니라 하네스를 더 잘 설계하고 운용하는 쪽(best rider) 이 승리
  • 빅랩들이 우선시하지 않는 수천 개의 분리된 시장이 스타트업에게 기회로 남음

하네스 시대의 의미

  • AI는 고정 워크플로우 기반의 SaaS와 관리형 데이터베이스를 지능(intelligence)으로 대체하며 소프트웨어 패러다임을 재정의
  • AI를 머스탱(야생마)에 비유, 강력하지만 거칠어 그대로는 사용할 수 없으며 길들이는 작업이 곧 하네스
  • 길들임의 본질은 LLM을 중심에 두고 그 주위에 7개 구성요소를 방사형으로 배치하는 아키텍처

AI 에이전트 하네스의 7가지 구성요소

  • 1. Context & Memory (맥락과 메모리)

    • 범용 모델은 용도별 맞춤 검색(bespoke retrieval) 이 필요하며, 방사선 전문의용 컨텍스트 검색 시스템과 법무 보조원용 시스템은 동일할 수 없음
    • 단기 메모리 ("에이전트가 45초 전에 무엇을 하고 있었나"), 대규모 이미지 검색(방사선·영상 생성), 수십억 문서 키워드 검색 등 케이스별로 시스템이 달라짐
    • 검색 옆에는 컨텍스트 데이터베이스가 위치, 비즈니스가 실제로 어떻게 운영되는지 담은 "레시피북" 역할
      • 사람들이 머릿속에 들고 출근하는 표준운영절차(SOP)가 곧 그 레시피
      • 초기 캡처와 사람·프로세스 변화에 따른 진화가 컨텍스트 DB의 본질
  • 2. Tools & Action (도구와 행동)

    • 도구는 에이전트가 외부 세계에 영향을 미치는 수단이며, 컨텍스트 DB의 레시피가 "무엇을 할지"라면 도구는 그것을 실제로 수행하는 재료와 기구
    • 현대 하네스는 레지스트리(registry) 를 통해 도구를 노출, 모델이 전달한 인자 검증, 호출 디스패치, 민감 작업은 승인 게이트 통과, 결과를 에이전트 루프로 파싱
    • MCP가 도구 연결을 위한 결합 조직(connective tissue)으로 부상
    • 하네스의 품질은 안전하게 노출할 수 있는 도구 수와 실패를 깔끔히 처리하는 능력에 의해 결정됨
  • 3. Orchestration & Loop (오케스트레이션과 루프)

    • 에이전트 루프는 사고(think) → 행동(act) → 관찰(observe) → 반복(repeat) 의 구조
    • 계획 수립, 작업 분해, 서브 에이전트, 재시도, 중단 조건이 작업 수행 방식을 규정
    • 사용할수록 개선되어야 하며, 각 실행으로부터 학습하는 클로즈드 루프 패턴이 벤더 간 차별화 요소
  • 4. State & Persistence (상태와 영속성)

    • 다수의 인원이 동시에 시스템을 사용하는 대규모 엔터프라이즈에서는 회복 탄력성(resilient) 이 필수
    • 10단계 작업의 7단계에서 하네스가 크래시할 경우 처음부터가 아닌 8단계부터 재개되어야 함
    • 파일 시스템, 체크포인트, 세션 스레드, 아티팩트 저장소가 작업 손실을 방지하는 메커니즘
  • 5. Sandbox & Compute (샌드박스와 컴퓨팅)

    • 각 에이전트에는 독립된 작업 공간(샌드박스) 이 필요
    • 격리된 Unix 워크스페이스, 통제된 네트워크 송신(egress), 모델 외부에 보관되는 자격 증명(credentials)이 보안성·기밀성·대규모 속도를 보장
  • 6. Observability & Governance (관측성과 거버넌스)

    • "볼 수 없는 것은 신뢰할 수 없음" - 모든 단계 추적, 모든 도구 호출 로깅, 회귀 테스트로서의 evals 실행, 최고 리스크 결정에는 사람 개입(human-in-the-loop) 이 데모를 프로덕션 시스템으로 전환시킴
    • 가드레일(Guardrails) 은 정책 강제, Evals는 고객보다 먼저 회귀를 포착
  • 7. Cost & Workflow Optimization (비용과 워크플로우 최적화)

    • 일곱 번째는 아키텍처적 판단력(architectural judgment)
    • 결정론적 vs 비결정론적으로 처리할 영역 구분, 단계별 적합 모델(최첨단·중형·소형·파인튜닝) 선택, 지식을 스킬에 둘지 메모리에 둘지의 판단

새로운 경쟁 구도

  • 결과는 소프트웨어의 새로운 경쟁 다이내믹이며, 모든 카테고리에 동일하게 적용되지는 않음
  • 메이저 랩(주요 AI 연구소)이 우선시하는 시장은 빠른 실행력과 모델 직접 통제에서 이익을 얻음
  • 그러나 그 외 수천 개의 별도 시장이 스타트업에게 열려 있음
  • 모든 기업이 같은 모델을 사용 가능해진 시대에는 "가장 잘 타는 자(best riders)"가 승리 - 즉 하네스 설계·운용 역량이 핵심 경쟁력

댓글과 토론