Anthropic, Claude Opus 4.7 출시 - 셀프 검증, 3.3배 고해상도 비전, 코딩 13% 향상
(anthropic.com)Anthropic이 플래그십 모델 Claude Opus 4.7을 출시했습니다.
- SWE-bench Verified 87.6% (+6.8pp), SWE-bench Pro 64.3%로 GPT-5.4(57.7%)를 제치고 1위
- GPQA Diamond 94.2%, Terminal-Bench 2.0 69.4%, Finance Agent 64.4% 달성
- 코딩 벤치마크에서 Opus 4.6 대비 13% 향상, 프로덕션 태스크 해결률 3배 증가
- 새로운 셀프 검증(Self-Verification) 기능: 작업 완료 전 자체적으로 검증 단계를 설계하고 실행
- 3.3배 고해상도 비전 (최대 2,576px), 새로운 토크나이저 적용
- xhigh effort 레벨 추가, 에이전틱 추론 14% 개선, 도구 오류 1/3로 감소
- 가격은 Opus 4.6과 동일 ($5/$25 per MTok)
- 비공개 모델 Mythos보다는 성능이 낮다고 Anthropic이 직접 인정
Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry에서도 사용 가능합니다.