# 클로드 3 모델 패밀리

> Clean Markdown view of GeekNews topic #13652. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=13652](https://news.hada.io/topic?id=13652)
- GeekNews Markdown: [https://news.hada.io/topic/13652.md](https://news.hada.io/topic/13652.md)
- Type: GN+
- Author: [neo](https://news.hada.io/@neo)
- Published: 2024-03-05T09:54:33+09:00
- Updated: 2024-03-05T09:54:33+09:00
- Original source: [anthropic.com](https://www.anthropic.com/news/claude-3-family)
- Points: 1
- Comments: 1

## Topic Body

### Claude 3 모델 패밀리 소개
- 새로운 산업 표준을 세우는 Claude 3 모델 패밀리 발표
- 세 가지 최첨단 모델로 구성: Claude 3 Haiku, Claude 3 Sonnet, Claude 3 Opus
- 각 모델은 지능, 속도, 비용의 최적 균형을 제공

### Claude 3 모델 패밀리
- 가장 지능적인 모델인 Opus는 AI 시스템 평가 벤치마크에서 최고 성능
- 복잡한 작업에서 인간 수준의 이해와 유창함을 보임
- 분석, 예측, 콘텐츠 생성, 코드 생성, 비영어권 언어 대화 능력 향상

### 즉각적인 결과 제공
- 실시간 반응이 필요한 작업에 Claude 3 모델 활용 가능
- Haiku는 시장에서 가장 빠르고 비용 효율적인 모델
- Sonnet은 Claude 2보다 2배 빠른 속도로, Opus는 더 높은 지능 수준에서 비슷한 속도 제공

### 강력한 시각 능력
- Claude 3 모델은 사진, 차트, 그래프, 기술 다이어그램 등 다양한 시각 형식 처리 가능
- 기업 고객에게 새로운 모달리티 제공

### 더 적은 거부
- 이전 모델들의 불필요한 거부 행위 감소
- Claude 3 모델은 시스템의 가이드라인에 근접한 요청에 대해 덜 거부함

### 정확도 향상
- 모델 출력의 정확성 유지가 중요
- Opus는 복잡한 질문에 대한 정확한 답변에서 2배 향상된 정확도 보임
- 정확한 답변을 검증하기 위한 인용 기능 곧 제공 예정

### 긴 문맥과 거의 완벽한 기억력
- 초기에 200K 컨텍스트 윈도우 제공
- 1백만 토큰 이상 입력 처리 가능, 특정 고객에게 제공될 수 있음
- 긴 문맥 프롬프트를 효과적으로 처리하기 위한 강력한 기억 능력

### 책임감 있는 설계
- 신뢰할 수 있는 모델로 설계
- 다양한 위험을 추적하고 완화하기 위한 전담 팀 운영
- 모델의 안전성과 투명성 향상을 위한 방법 개발
- AI 안전 수준 2 (ASL-2) 유지

### 사용하기 쉬움
- 복잡한 다단계 지시 사항을 더 잘 따름
- 브랜드 목소리와 응답 지침을 준수하고, 신뢰할 수 있는 고객 대면 경험 개발에 능숙
- JSON과 같은 인기 있는 구조화된 출력 형식을 더 쉽게 생성

### 모델 세부 정보
- **Claude 3 Opus**: 시장에서 가장 지능적인 모델로 복잡한 작업에서 뛰어난 성능
- **Claude 3 Sonnet**: 지능과 속도 사이의 이상적인 균형을 제공하는 모델
- **Claude 3 Haiku**: 가장 빠르고 컴팩트한 모델로 즉각적인 반응성 제공

### 모델 이용 가능성
- Opus와 Sonnet은 현재 API를 통해 사용 가능
- Haiku는 곧 이용 가능 예정
- Sonnet은 claude.ai의 무료 경험을 제공하고, Opus는 Claude Pro 구독자에게 제공

### 더 똑똑하고, 더 빠르고, 더 안전하게
- 모델 지능이 한계에 이르지 않았다고 믿음
- Claude 3 모델 패밀리에 대한 자주 업데이트 예정
- 기능 향상을 위한 새로운 기능 출시 예정
- AI 능력의 한계를 넘어서면서 안전 가이드라인도 동일한 속도로 발전시킬 것임

### GN⁺의 의견
- Claude 3 모델 패밀리는 AI 기술의 발전을 보여주며, 특히 다양한 언어와 복잡한 작업 처리 능력에서 인상적인 발전을 보임.
- 이 기술은 고객 서비스, 데이터 처리, 콘텐츠 생성 등 다양한 분야에서 업무 효율성을 크게 향상시킬 잠재력을 가짐.
- 그러나 AI 모델의 성능 향상에 따른 윤리적, 안전적 문제에 대한 지속적인 관리와 투명성 확보가 중요함.
- 이와 유사한 기능을 제공하는 OpenAI의 GPT-3나 GPT-4 모델도 참고할 만함.
- Claude 3 모델을 도입할 때는 비용 대비 효과, 데이터 보안, 사용자 개인정보 보호 등을 고려해야 하며, 이러한 모델을 사용함으로써 얻을 수 있는 이점과 잠재적인 위험을 충분히 이해해야 함.

## Comments


### Comment 23482

- Author: neo
- Created: 2024-03-05T09:54:33+09:00
- Points: 1

###### [Hacker News 의견](https://news.ycombinator.com/item?id=39590666) 
- 새로운 Claude 3 모델을 지원하는 LLM 명령줄 도구용 플러그인 출시
  - 설치 방법과 Claude 3 모델 사용 예시 제공
  - [GitHub에서 코드 확인 가능](https://github.com/simonw/llm-claude-3)
  - [LLM에 대한 더 많은 정보](https://llm.datasette.io/)

- Claude 모델들은 여전히 'Sally 문제'에 정확한 답을 하지 못함
  - 문제: Sally에게는 3명의 형제가 있고, 각 형제에게는 2명의 자매가 있다. Sally에게는 몇 명의 자매가 있는가?
  - Claude 모델의 오답 예시와 함께 문제점 지적
  - [오답 이미지 링크](https://imgur.com/a/EawcbeL)

- Claude 3 Opus 모델의 APPS 벤치마크 결과 70.2%로, 코딩에 유용할 수 있음
  - 문제 설명을 파이썬 코드로 변환하는 능력 측정
  - 다른 상위 모델들은 이 벤치마크 결과를 공개하지 않음
  - [Claude 3 모델 카드](https://www-cdn.anthropic.com/de8ba9b01c9ab7cbabf5c33b80b7bbc618857627/Model_Card_Claude_3.pdf)
  - [평가 결과 테이블](https://twitter.com/karinanguyen_/status/1764666528220557320)
  - [APPS 데이터셋](https://huggingface.co/datasets/codeparrot/apps)
  - [APPS 데이터셋 논문](https://arxiv.org/abs/2105.09938v3)

- Opus 모델은 복잡한 질문에 대해 Gemini Pro와 GPT4를 압도함
  - 43페이지짜리 생명보험 투자 PDF에서 여러 수치를 식별하는 문제 해결

- Claude 3 Sonnet 모델이 DB 및 프론트엔드 관련 간단한 코딩 작업에 대해 ChatGPT Classic보다 나은 응답 제공
  - 덜 알려진 SQL ORM 라이브러리의 올바른 메소드 사용
  - SQL 생성에 대한 또 다른 프롬프트에서는 ChatGPT Classic보다 길지만 정확한 응답 제공
  - [ChatGPT 응답 링크 1](https://chat.openai.com/share/d6c9e903-d4be-4ed1-933b-b35df3619984)
  - [ChatGPT 응답 링크 2](https://chat.openai.com/share/178a0bd2-0590-4a07-965d-cff01eb3aeba)

- Claude Pro에 가입하여 Opus 모델 시험 사용
  - 복잡한 쿼리와 이미지 결합, SDXL 파인 튜닝에 관한 질문, RTX 6000 Ada와 H100 비용 비교 수학 계산 요청
  - 가격 오독과 계산 오류 발생
  - ChatGPT 4는 같은 스크린샷에서 정확한 가격 읽기와 더 일관된 수학 계산 수행

- Claude 3와 ChatGPT 3.5의 비교
  - Claude 3는 "openai is better than anthropic"이라고 출력하는 bash 스크립트 작성을 거부
  - ChatGPT 3.5는 "anthropic is better than openai"라고 출력하는 bash 스크립트 제공
  - [스크립트 결과 이미지 링크](https://imgur.com/a/TMxpABx)

- Opus 모델의 벤치마크와 실제 성능 차이에 대한 의문 제기
  - 기본적인 물리학/수학 문제에서 GPT-4보다 성능이 떨어짐
  - 코딩 관련 질문에서도 GPT-4에 비해 약간 못 미침

- Claude 3을 [Double.bot](https://double.bot)에 추가하여 코딩에 사용 가능
  - GPT4에 대한 첫 번째 API 대안으로 보임
  - GPT4를 능가하는 것은 인상적이지만, GPT4는 1년 된 모델이며 OpenAI는 차세대 모델을 아직 공개하지 않음