멀티 에이전트 오케스트레이션은 왜 잘 안 되는가?

최근 AI로 “제로 휴먼 컴퍼니” 를 운영할 수 있게 해주는 ‘Paperclip’ 프로젝트가 이슈가 되었는데요. 에이전트들을 회사 조직도처럼 구성해서 CEO, 팀장, 실무자 역할을 부여하고 회사의 미션과 세부 프로젝트 들을 정의하면 자율적으로 일하기 시작합니다. 한 달 만에 github 스타 4만 개를 돌파했습니다.

그 이전에 비슷한 접근으로 에이전트들을 "도시" 로 은유한 Gastown도 있고, Anthropic의 Claude Code Agent Teams, Cursor의 클라우드 에이전트까지 - 업계 전반에서 "에이전트 여러 개를 조직처럼 굴리자"는 흐름이 뚜렷합니다.

저도 이 흐름에 호기심을 이기지 못하고 Gastown과 Paperclip을 써봤습니다. API 토큰 비용으로 계산하면 $5,000 정도 지출했고요. 🫠
결론부터 말씀드리면, 확실히 효과가 있는 영역은 일부 있었지만 한계가 훨씬 뚜렷했어요.

토큰 비용은 단일 에이전트 대비 5~10배 소비되는데 생산성이 비례하지 않고, 에이전트들이 맥락을
잃어버리거나, 인수인계가 중간에 끊기거나, 틀린 결과를 스스로 "완료"로 처리하는 문제가 반복됐습니다. 그래서 제가 겪은 문제들과 이를 통해 얻은 인사이트를 정리해봤습니다:

→ 멀티 에이전트 오케스트레이션의 3가지 구조적 병목
→ "도시"나 "회사" 메타포가 왜 잘 안 먹히는지
→ 어떤 구조가 실전에서 강건한지
→ 내 업무에서 에이전트 위임 가능 영역을 판별하는 5가지 기준과 스코어링

에이전트 시대에 "무엇을 맡기고, 무엇을 맡기지 말아야 하는가"를 고민하시는 분들에게 도움이 되면 좋겠습니다.

멀티 에이전트 오케스트레이션은 왜 잘 안 되는가?

함께 보면 좋은 글 β

댓글과 토론