- Meta와 UBC가 공동 발표한 HyperAgents는 작업 수행 코드뿐 아니라 개선 메커니즘 자체까지 스스로 수정하는 자기참조적 AI 에이전트 프레임워크
- 코딩, 논문 리뷰, 로보틱스, 수학 채점 등 다양한 도메인에서 자기 개선을 반복한 결과, 에이전트가 영속 메모리·성능 추적·다단계 검증 파이프라인 등을 독립적으로 발명
- 이렇게 에이전트가 스스로 구축한 구성요소들은 개발자가 수작업으로 만들던 프로덕션 하네스의 핵심 요소와 정확히 일치
- 하네스는 단순한 개발 편의가 아니라 에이전틱 시스템의 수렴적 아키텍처이며, 에이전트가 인프라의 소비자에서 생산자로 전환 중
- 개발자의 역할은 하네스를 직접 구축하는 것에서, 에이전트가 효과적인 하네스를 진화시킬 수 있는 초기 조건을 설계하는 방향으로 변화
HyperAgents 개요
- Meta와 UBC의 새 논문에서 소개된 HyperAgents는 자기참조적(self-referential) 에이전트로, 작업 해결 행동뿐 아니라 미래 개선을 생성하는 메커니즘 자체도 수정 가능
- 자기 개선에 맡겨두었을 때 에이전트가 수렴하는 결과물이 주목할 점으로, 오늘날 개발자가 수작업으로 구축하는 것과 동일한 컴포넌트를 재발명
-
Hyperagent는 인프라의 생산자(producer) 로 정의
HyperAgents vs Universal Agents
-
Universal Agent는 고도로 적응적인 실행자(executor)로, 코드 작성을 통해 거의 모든 문제를 즉흥적으로 해결하지만 여전히 인간이 설계한 인프라(하네스) 안에서 동작
-
Hyperagent는 인프라의 생산자로서, 최소한의 상태에서 시작해 자기참조적 진화를 통해 스스로 프로덕션 수준의 하네스를 부트스트랩
하네스(Harness)의 정의와 핵심 구성요소
- 하네스는 AI 에이전트의 운영 방식을 관장하는 소프트웨어 시스템으로, 도구·메모리·재시도·컨텍스트 엔지니어링·검증을 관리해 모델이 추론에 집중할 수 있게 지원
- 프로덕션 하네스에 필요한 6가지 핵심 구성요소:
-
Tool Integration: 도구 등록 및 실행
-
Memory & State: 단계 간 결과 영속화
-
Context Engineering: 동적 프롬프트 조립
-
Planning: 복잡한 작업을 단계로 분해
-
Verification: 규칙 대비 출력 검증
-
Modularity: 구성요소 독립적 토글
- 전통적으로 개발자가
ToolRegistry 클래스, MemoryManager, 재시도 루프, 프롬프트 조립 로직 등을 직접 작성하는 인간 엔지니어링 영역
- HyperAgents 논문이 던지는 질문은 "에이전트가 이 구성요소를 스스로 구축하면 어떻게 되는가?"
HyperAgents의 작동 방식
- 논문이 소개하는 프레임워크는 DGM-Hyperagents(DGM-H) 로, 핵심 아이디어는 단순
- Hyperagent는 두 가지를 포함하는 단일 편집 가능 프로그램:
- 주어진 작업을 해결하는 Task Agent
- Task Agent와 자기 자신을 수정하는 Meta Agent
- 핵심 키워드는 "itself"로, Meta Agent가 자신의 코드를 재작성할 수 있으며, 개선을 생성하는 메커니즘 자체가 개선 대상
- 이를 논문에서는 메타인지적 자기수정(metacognitive self-modification) 이라 명명
- 진화 루프를 통해 작동하는 방식:
- 기본 에이전트에서 시작
- Meta Agent가 에이전트 코드를 읽고 과거 성능을 분석하여 수정된 버전 생성
- 수정 버전을 평가, 성능이 더 좋으면 아카이브에 추가
- 아카이브에서 선택 후 반복
- 수백 회 반복을 거치며 에이전트가 작업에 더 능숙해질 뿐 아니라, 더 잘 개선하는 능력 자체가 향상
자기 개선으로 출현한 구성요소
- 코딩, 논문 리뷰, 로보틱스 보상 설계, 올림피아드 수학 채점 등 다양한 도메인에서 자기 개선을 수행한 결과, 에이전트가 독립적으로 발명한 요소들:
영속 메모리(Persistent Memory)
- 개발자 지시 없이 에이전트가 스스로 메모리 시스템을 진화
- 과거 결과 기억, 성능 추세 추적, 종합된 인사이트 저장이 가능한 에이전트가 그렇지 못한 에이전트를 능가했기 때문
- 논문에서 제시한 메모리 항목 예시: 인과 가설 저장, 최고 성능 세대 식별, 과잉 수정 진단, 성공 전략 조합 방법 제안
성능 추적(Performance Tracking)
- 에이전트가 자체적으로 관측 가능성(observability) 구축
- 개선 추세에 대한 이동 평균, 세대별 종합 통계, 도메인별 점수 이력 등 포함
- 개발자가 하네스에 수작업으로 구축하는 토큰 추적·감사 로깅과 동일한 기능
다단계 평가 파이프라인(Multi-stage Evaluation Pipelines)
- 논문 리뷰 도메인에서 에이전트가 피상적 행동 지시에서 명시적 다단계 평가 파이프라인으로 진화
- 체크리스트, 의사결정 규칙, 명확히 정의된 기준 포함
- 에이전트가 자체적으로 검증기(verifier) 를 구축한 결과
임계값 기반 의사결정 프로토콜(Decision Protocols with Thresholds)
- 에이전트가 명시적 의사결정 경계를 개발: 수락/거부 비율, 점수 임계값, 신뢰도 수준 등
- 하네스 검증기가 구현하는 규칙 기반 체크와 동일
도메인 지식 베이스(Domain Knowledge Bases)
- 로보틱스 보상 설계에서 에이전트가 환경 제약 조건, 유효 상태 변수, 보상 스케일링 휴리스틱 등의 내부 지식 베이스를 점진적으로 구축 및 정제
- 에이전트가 자신을 위해 올바른 컨텍스트를 조립하는 법을 학습한 컨텍스트 엔지니어링의 결과
재시도 및 자기 교정(Retry and Self-Correction)
- 에이전트 수정이 성능을 악화시킨 경우, 후속 세대가 회귀를 진단하고 교정
- 하네스가 구현하는 피드백 주입 포함 재시도 루프와 동일한 패턴
더 큰 그림 — 하나의 흐름으로 수렴하는 트렌드
- 여러 연구에서 추적된 패턴이 하나의 흐름으로 연결:
-
Harness Engineering: 개발자가 에이전트 주변에 구축하는 6가지 구성요소 정의
-
From Copilot to Codex: 인간 작성 코드에서 에이전트 위임 코드로의 전환
-
Universal Agents: 코딩 능력이 에이전트를 범용으로 만든다는 주장
-
HyperAgents: 에이전트가 자기수정을 통해 자체 하네스 구축
- 에이전트가 인프라의 소비자에서 생산자로, 하네스 안에서 실행하는 단계에서 하네스를 엔지니어링하는 단계로 이동
- DGM-H 논문의 구체적 시연: 단일 LLM 호출만 있는 맨 에이전트에서 시작해, 수백 회 자기수정 반복 후 영속 메모리·성능 추적·다단계 평가 파이프라인·도메인 지식 베이스·모듈형 코드 구조를 갖춘 상태로 발전
- 개발자의 역할은 사라지는 것이 아니라 전환 중이며, 논문은 인간 감독이 필수적임을 강조
- 하네스를 직접 구축하는 것에서, 에이전트가 효과적 하네스를 진화시킬 수 있는 초기 조건 설계로 역할 이동