Anthropic, Claude Opus 4.7 출시 - 셀프 검증, 3.3배 고해상도 비전, 코딩 13% 향상

(anthropic.com)

2P by minodevs 3달전 | ★ favorite | 댓글 1개

Anthropic이 플래그십 모델 Claude Opus 4.7을 출시했습니다.

SWE-bench Verified 87.6% (+6.8pp), SWE-bench Pro 64.3%로 GPT-5.4(57.7%)를 제치고 1위
GPQA Diamond 94.2%, Terminal-Bench 2.0 69.4%, Finance Agent 64.4% 달성
코딩 벤치마크에서 Opus 4.6 대비 13% 향상, 프로덕션 태스크 해결률 3배 증가
새로운 셀프 검증(Self-Verification) 기능: 작업 완료 전 자체적으로 검증 단계를 설계하고 실행
3.3배 고해상도 비전 (최대 2,576px), 새로운 토크나이저 적용
xhigh effort 레벨 추가, 에이전틱 추론 14% 개선, 도구 오류 1/3로 감소
가격은 Opus 4.6과 동일 ($5/$25 per MTok)
비공개 모델 Mythos보다는 성능이 낮다고 Anthropic이 직접 인정

Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry에서도 사용 가능합니다.

runai 3달전 [-]

OPUS 4.7 > GPT 5.4 > OPUS 4.6