Anthropic이 실제 프로덕션 경험을 바탕으로 정리한 AI 에이전트 워크플로우의 가장 실무적으로 많이 쓰이는 3가지 패턴과 언제 어떤 걸 선택해야 하는지 핵심만 정리.

핵심 메시지

  • 에이전트가 많아질수록 구조(워크플로우)가 더 중요해짐
  • 잘못된 패턴 → 레이턴시↑, 비용↑, 신뢰성↓
  • 패턴은 자율성을 없애는 게 아니라 자율성의 범위를 설계하는 것

1. 순차 워크플로우 (Sequential)

  • 단계별로 하나씩 순서대로 실행 (A → B → C)
  • 적합 : 단계 간 의존성이 뚜렷할 때
    예: 마케팅 카피 → 번역 → 검수
    문서 데이터 추출 → 스키마 검증 → DB 적재
  • 장점: 각 에이전트가 한 가지에 집중 → 정확도 ↑
  • 단점: 기다림 때문에 레이턴시 길어짐
  • 팁: 무조건 멀티스텝 가지 말고, 단일 에이전트로 먼저 충분히 테스트하기

2. 병렬 워크플로우 (Parallel)

  • 독립적인 작업을 동시에 여러 에이전트에 분배 → 결과 모음 (fan-out → fan-in)
  • 적합 : 여러 측면을 동시에 평가해야 할 때
    예: 코드 리뷰 (취약점 종류별 분담)
    문서 분석 (주제·감성·사실검증 동시)
    다각도 품질 평가
  • 장점: 팀별 관심사 분리 쉬움, 개별 최적화 가능
  • 단점: 동시 API 호출 많아 비용 ↑, 결과 합치는 로직(다수결? 가중치? 전문가 우선?) 필수 설계

3. 평가자-최적화 워크플로우 (Evaluator-Optimizer)

  • 생성 에이전트 ↔ 평가 에이전트가 반복 피드백 주고받음
  • 생성 → 평가 → 수정 → 평가… (품질 기준 충족 or 최대 반복까지)
  • 적합 : 품질이 매우 중요한 작업
    예: API 문서 자동 생성
    고객 커뮤니케이션 (톤·정책 준수)
    보안 중요한 SQL 쿼리 작성
  • 장점: 생성과 평가를 전문화 → 더 높은 완성도
  • 단점: 토큰·시간 많이 소모 → 중단 조건(최대 반복 횟수 + 품질 임계값) 반드시 설정

실무 적용 원칙 (중요!)

  1. 가장 단순한 것부터 시작
    단일 에이전트로 충분 → 끝
    순차로 해결됨 → 끝
    첫 결과가 기준 충족 → 끝
  2. 필요할 때만 업그레이드
  3. 세 패턴은 조합 가능 (순차 안에 병렬 넣기, 평가 루프에 병렬 평가자 등)

https://aisparkup.com/posts/9963