2P by minodevs 4시간전 | ★ favorite | 댓글과 토론

Anthropic이 플래그십 모델 Claude Opus 4.7을 출시했습니다.

  • SWE-bench Verified 87.6% (+6.8pp), SWE-bench Pro 64.3%로 GPT-5.4(57.7%)를 제치고 1위
  • GPQA Diamond 94.2%, Terminal-Bench 2.0 69.4%, Finance Agent 64.4% 달성
  • 코딩 벤치마크에서 Opus 4.6 대비 13% 향상, 프로덕션 태스크 해결률 3배 증가
  • 새로운 셀프 검증(Self-Verification) 기능: 작업 완료 전 자체적으로 검증 단계를 설계하고 실행
  • 3.3배 고해상도 비전 (최대 2,576px), 새로운 토크나이저 적용
  • xhigh effort 레벨 추가, 에이전틱 추론 14% 개선, 도구 오류 1/3로 감소
  • 가격은 Opus 4.6과 동일 ($5/$25 per MTok)
  • 비공개 모델 Mythos보다는 성능이 낮다고 Anthropic이 직접 인정

Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry에서도 사용 가능합니다.