Anthropic, 클로드 3.7 소넷(Claude 3.7 Sonnet)을 출시
(anthropic.com)안트로픽이 현재까지 가장 지능적인 모델인 클로드 3.7 소넷(Claude 3.7 Sonnet)을 출시했습니다. 이 모델은 시장 최초의 하이브리드 추론 모델로, 즉각적인 응답과 사용자에게 표시되는 단계별 사고 과정을 모두 제공할 수 있습니다.
주요 특징:
- 코딩과 프론트엔드 웹 개발에서 큰 성능 향상을 보임
- 새로운 명령줄 도구 '클로드 코드(Claude Code)' 도입 - 개발자가 터미널에서 직접 엔지니어링 작업을 클로드에 위임할 수 있음
- 모든 Claude 플랜(무료, Pro, Team, Enterprise)과 Anthropic API, AWS Bedrock, Google Cloud Vertex AI에서 사용 가능
- 확장된 사고 모드는 무료 등급을 제외한 모든 플랫폼에서 이용 가능
- 가격은 이전 모델과 동일: 입력 토큰 백만 개당 $3, 출력 토큰 백만 개당 $15(사고 토큰 포함)
성능 향상:
- SWE-bench Verified와 TAU-bench에서 최고 성능 달성
- Cursor, Cognition, Vercel, Replit, Canva 등의 초기 테스트에서 복잡한 코드베이스 처리, 고급 도구 사용, 코드 계획 및 변경, 전체 스택 업데이트에서 뛰어난 능력 입증
- 프로덕션 수준의 코드 생성과 오류 감소 성능 보여줌
- 수학, 물리학, 명령 이행 능력 향상
Claude Code:
- 코드 검색 및 읽기, 파일 편집, 테스트 작성 및 실행, GitHub에 코드 커밋 및 푸시, 명령줄 도구 사용 가능
- 테스트 주도 개발, 복잡한 문제 디버깅, 대규모 리팩토링에 특히 유용
- 일반적으로 45분 이상 걸리는 작업을 한 번에 완료하여 개발 시간 대폭 단축
- 현재 제한된 연구 미리보기로 제공
GitHub 통합:
- 이제 모든 Claude 플랜에서 GitHub 통합 기능 이용 가능
- 개인, 업무 및 오픈 소스 프로젝트에 대한 더 깊은 이해 기반
- 버그 수정, 기능 개발, 문서 작성 등에서 강력한 파트너 역할
- 사용자의 중요 GitHub 프로젝트 전반에 걸쳐 지원 제공
안전성 개선으로는 이전 모델에 비해 불필요한 거부 응답이 45% 감소했으며, 유해한 요청과 무해한 요청 사이의 더 미묘한 구분이 가능해졌습니다.
확장된 사고 모드(Thinking Mode - Extended)
- 모델이 답변 전에 자기 성찰을 통해 더 깊이 사고하는 기능
- 수학, 물리학, 명령 이행, 코딩 등 다양한 작업에서 성능 향상
- API 사용자는 모델이 생각하는 시간을 최대 128K 토큰까지 제어 가능
- 속도(비용)와 답변 품질 사이의 균형을 조절할 수 있는 유연성 제공
- 인간이 빠른 반응과 깊은 사고를 동일한 두뇌로 처리하듯, 별도의 모델 없이 하나의 모델에서 두 가지 모드 제공
OpenAI의 o1이나 DeepSeek의 R1 같은 별도 추론 모델과는 다른 접근 방식을 선택한것으로 보입니다. 단일 모델 내에서 두가지 모드를 통합한것으로 보입니다.
추가로, 직접 모델에 학습 데이터 컷오프 날짜를 질문하니 2024년 10월 말이라고 답변하는군요~!
Claude Code 를 설치해서 사용해보았는데, 두 프로젝트의 개요를 영상에서처럼 물어봤습니다.
Total cost: $0.1151
Total cost: $0.0855
약 0.2 달러를 사용하네요..?
영상 예시를 45분 이상 걸리는 작업이라고 하면 꽤나 비싼 작업이 되었을듯합니다.
엄청 비싸요 가성비 안나옴. 실사용에선 o3-mini가 차라리 나은 듯 한데, 코딩용으로 쓰려면 추론 단계가 짧고 중간토큰을 해결해야하니 그 용도로 봤을 때 최상인 듯 합니다. 가격도..