Anthropic이 자사의 최상위 모델인 Claude Opus의 업그레이드 버전인 Claude Opus 4.8을 출시했습니다. 이전 버전인 4.7을 기반으로 벤치마크 성능을 개선하고 협업 능력을 강화했으며, 가격은 동일하게 유지됩니다.

주요 개선 사항 및 특징

  • 성능 향상: 코딩, 에이전트 기술, 추론 및 실무 지식 작업 전반에서 이전 모델 및 GPT-5.5 등 경쟁 모델 대비 우수한 성능을 보입니다.
  • 정직성(Honesty) 강화: AI가 근거 없는 주장을 하거나 성급히 결론을 내리는 문제를 개선했습니다. Opus 4.8은 불확실한 부분을 스스로 표시하며, 코드 내 결함을 놓칠 확률이 이전 모델 대비 약 4배 낮아졌습니다.
  • 신뢰할 수 있는 에이전트 능력: 초기 테스트 결과, 복잡한 다단계 작업을 수행할 때 판단력이 날카로워졌으며, 자신의 실수를 포착하고 계획이 타당하지 않을 때 이의를 제기하는 등 더 나은 협업 능력을 보여줍니다.
  • 비용 효율성: 'Fast Mode'의 속도가 2.5배 빨라졌으며, 비용은 이전 모델 대비 3배 저렴해졌습니다.

함께 출시된 새로운 기능

  • 다이내믹 워크플로우(Dynamic Workflows): Claude Code의 연구 프리뷰 기능으로, 수백 개의 병렬 서브 에이전트를 실행하여 대규모 코드베이스 마이그레이션과 같은 복잡한 작업을 수행할 수 있습니다.
  • 노력 제어(Effort Control): 사용자가 Claude가 작업에 투입할 노력의 수준을 선택할 수 있습니다. 높은 설정에서는 더 깊게 생각하여 고품질의 응답을 제공하고, 낮은 설정에서는 더 빠르게 응답합니다.
  • 메시지 API 업데이트: 시스템 엔트리를 메시지 배열 내에 포함할 수 있게 되어, 프롬프트 캐시를 깨뜨리지 않고 작업 중간에 지침을 업데이트할 수 있습니다.

향후 계획

Anthropic은 Opus급의 성능을 더 낮은 비용으로 제공하는 모델을 개발 중이며, Project Glasswing을 통해 Opus보다 더 높은 지능을 가진 새로운 클래스의 모델(Claude Mythos)을 준비하고 있습니다. 현재 일부 조직에서 보안 테스트 중이며, 몇 주 내에 모든 고객에게 공개될 예정입니다.

가격 및 이용 안내

  • 일반 모드: 입력 $5 / 1M 토큰, 출력 $25 / 1M 토큰 (Opus 4.7과 동일)
  • 패스트 모드: 입력 $10 / 1M 토큰, 출력 $50 / 1M 토큰
  • 모델명: claude-opus-4-8

댓글과 토론