# Anthropic, Claude 2.1 릴리즈

> Clean Markdown view of GeekNews topic #11979. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=11979](https://news.hada.io/topic?id=11979)
- GeekNews Markdown: [https://news.hada.io/topic/11979.md](https://news.hada.io/topic/11979.md)
- Type: GN+
- Author: [neo](https://news.hada.io/@neo)
- Published: 2023-11-22T16:34:49+09:00
- Updated: 2023-11-22T16:34:49+09:00
- Original source: [anthropic.com](https://www.anthropic.com/index/claude-2-1)
- Points: 2
- Comments: 1

## Topic Body

- 클로드 2.1은 API를 통해 사용 가능하며, claude.ai 채팅 경험을 제공함.  
- 200K 토큰 컨텍스트 윈도우, 모델 환각(Hallucination) 감소, 시스템 프롬프트 및 새로운 베타 기능인 도구 사용이 특징  
- 고객의 비용 효율성 향상을 위해 가격 정책 업데이트 예정  
  
### 200K 컨텍스트 윈도우  
  
- 클로드 사용자들은 더 큰 컨텍스트 윈도우와 긴 문서 작업 시 더 정확한 출력을 요구함  
- 200,000 토큰으로, 약 150,000 단어 또는 500 페이지 이상의 자료를 클로드에 전달할 수 있음  
- 클로드는 대규모 콘텐츠나 데이터와 대화하며 요약, Q&A, 추세 예측, 다중 문서 비교 등 다양한 작업 수행 가능함  
  
### 환각율 2배 감소  
  
- 클로드 2.1은 정직성 향상을 위해 거짓 진술 발생률을 2배 감소시킴  
- 기업들은 더 큰 신뢰와 신뢰성을 가지고 AI 애플리케이션을 구축하고 운영에 배포할 수 있음  
- 클로드 2.1은 이해력과 요약 능력 향상, 특히 정확도가 요구되는 긴 복잡한 문서에서 성능 개선을 보임  
  
### API Tool Use  
  
- 사용자의 기존 프로세스, 제품 및 API와 통합할 수 있는 새로운 베타 기능인 "Tool Use(도구 사용)"을 추가함  
- 클로드는 개발자가 정의한 함수나 API를 조정하고, 웹 소스를 검색하며, 개인 지식 베이스에서 정보를 검색할 수 있음  
- Tool Use는 초기 개발 단계에 있으며, 개발자 기능과 프롬프트 가이드라인을 구축 중임  
  
### 개발자 경험  
  
- 클로드 API 사용자를 위한 개발자 콘솔 경험을 단순화하고, 새로운 프롬프트 테스트를 용이하게 함  
- 새로운 워크벤치 제품을 통해 개발자는 프롬프트를 반복하고, 클로드의 행동을 최적화하기 위한 모델 설정에 접근할 수 있음  
- 시스템 프롬프트를 도입하여 사용자가 클로드에 사용자 정의 지침을 제공할 수 있게 함  
  
### GN⁺의 의견  
  
- 클로드 2.1의 가장 중요한 특징은 200K 토큰 컨텍스트 윈도우와 환각율 감소로, 이는 사용자들이 더 큰 문서와 데이터를 처리하고 더 신뢰할 수 있는 결과를 얻을 수 있게 해줌  
- 이러한 기능은 AI 기술의 발전을 보여주며, 기업과 개발자들에게 더욱 효율적이고 정확한 도구를 제공함으로써 그들의 작업을 혁신할 잠재력을 가짐  
- 이 글은 AI 기술의 최신 동향과 개발자들이 이용할 수 있는 새로운 도구에 대한 흥미로운 정보를 제공함으로써, 기술에 관심 있는 사람들에게 매력적인 내용을 담고 있음

## Comments



### Comment 20824

- Author: neo
- Created: 2023-11-22T16:34:50+09:00
- Points: 1

###### [Hacker News 의견](https://news.ycombinator.com/item?id=38365934) 
- **200k 컨텍스트의 달콤쓴맛**: 70k에서 195k로 오류율이 급증한 것은 아쉬움. 하지만 중간 부분의 오류 감소에는 칭찬.
- **모델의 제한적 사용에 대한 불만**: 클로드가 제목에서 주장하는 것처럼 거절이 적지 않음. Anthropic이 모델을 지나치게 검열하고 있어 사용하기 어려움. 사용자가 도구를 결정해야지, 도구가 사용자를 결정해서는 안 됨.
- **제목과 내용의 불일치 지적**: 발표에서 언급된 '거절 감소'는 실제 내용과 맞지 않음. 클로드 2.1은 잘못된 정보를 제공하는 것보다 거절할 가능성이 더 높아졌음을 시사.
- **코딩에 대한 비효율성**: GPT-4에 비해 10배 더 나쁨. 간단한 데이터베이스 동기화 함수를 요청했을 때, 실제 코드 대신 수도코드를 많이 제공.
- **모델에 대한 부정적인 인상**: Anthropic의 모델이 대부분의 요청을 거절하도록 과도하게 학습되어 있어, 클로드와의 대화가 즐겁지 않음.
- **이념적 관점의 거절 사례**: 효과적인 이타주의자처럼 말하기 위한 어휘 목록 요청에 대한 거절로 인해 유머러스한 상황 발생.
- **클로드 2에 대한 실망**: 처음에는 기대했지만 GPT-4에 비해 훨씬 못 미치는 성능으로 판단, 큰 컨텍스트 창이 있어도 답변의 질이 나쁘면 의미 없음.
- **API 사용에 대한 접근성 문제**: API 사용에 관심이 있지만, 응답을 받지 못해 실망. 개발자 플랫폼으로서의 관심 부족.
- **API 접근의 어려움**: Anthropic의 웹사이트나 Bedrock을 통한 요청에 대한 응답을 받지 못해 비즈니스로서 API 접근이 불가능해 보임.
- **시스템 프롬프트 도입에 대한 관심**: 사용자가 클로드에게 맞춤형 지시를 제공하여 성능을 향상시킬 수 있는 시스템 프롬프트 도입에 주목. 사용 및 남용의 용이성에 대한 기대감.
- **클로드의 테스트 사용과 OpenAI의 선택**: 아직 생산에는 사용하지 않지만, 새로운 기능을 LLM과 함께 구축할 때 정기적으로 테스트에 포함. OpenAI가 더 빠르게 인증을 받아 시장에 출시되었고, API가 더 나아지고 신뢰할 수 있으며 저렴함. 하지만 클로드가 AWS Bedrock에 포함되면서 이전에는 불가능했던 것들이 가능해짐.
