Anthropic, Claude 2.1 릴리즈

(anthropic.com)

2P by GN⁺ 2023-11-22 | ★ favorite | 댓글 1개

클로드 2.1은 API를 통해 사용 가능하며, claude.ai 채팅 경험을 제공함.
200K 토큰 컨텍스트 윈도우, 모델 환각(Hallucination) 감소, 시스템 프롬프트 및 새로운 베타 기능인 도구 사용이 특징
고객의 비용 효율성 향상을 위해 가격 정책 업데이트 예정

200K 컨텍스트 윈도우

클로드 사용자들은 더 큰 컨텍스트 윈도우와 긴 문서 작업 시 더 정확한 출력을 요구함
200,000 토큰으로, 약 150,000 단어 또는 500 페이지 이상의 자료를 클로드에 전달할 수 있음
클로드는 대규모 콘텐츠나 데이터와 대화하며 요약, Q&A, 추세 예측, 다중 문서 비교 등 다양한 작업 수행 가능함

환각율 2배 감소

클로드 2.1은 정직성 향상을 위해 거짓 진술 발생률을 2배 감소시킴
기업들은 더 큰 신뢰와 신뢰성을 가지고 AI 애플리케이션을 구축하고 운영에 배포할 수 있음
클로드 2.1은 이해력과 요약 능력 향상, 특히 정확도가 요구되는 긴 복잡한 문서에서 성능 개선을 보임

API Tool Use

사용자의 기존 프로세스, 제품 및 API와 통합할 수 있는 새로운 베타 기능인 "Tool Use(도구 사용)"을 추가함
클로드는 개발자가 정의한 함수나 API를 조정하고, 웹 소스를 검색하며, 개인 지식 베이스에서 정보를 검색할 수 있음
Tool Use는 초기 개발 단계에 있으며, 개발자 기능과 프롬프트 가이드라인을 구축 중임

개발자 경험

클로드 API 사용자를 위한 개발자 콘솔 경험을 단순화하고, 새로운 프롬프트 테스트를 용이하게 함
새로운 워크벤치 제품을 통해 개발자는 프롬프트를 반복하고, 클로드의 행동을 최적화하기 위한 모델 설정에 접근할 수 있음
시스템 프롬프트를 도입하여 사용자가 클로드에 사용자 정의 지침을 제공할 수 있게 함

GN⁺의 의견

클로드 2.1의 가장 중요한 특징은 200K 토큰 컨텍스트 윈도우와 환각율 감소로, 이는 사용자들이 더 큰 문서와 데이터를 처리하고 더 신뢰할 수 있는 결과를 얻을 수 있게 해줌
이러한 기능은 AI 기술의 발전을 보여주며, 기업과 개발자들에게 더욱 효율적이고 정확한 도구를 제공함으로써 그들의 작업을 혁신할 잠재력을 가짐
이 글은 AI 기술의 최신 동향과 개발자들이 이용할 수 있는 새로운 도구에 대한 흥미로운 정보를 제공함으로써, 기술에 관심 있는 사람들에게 매력적인 내용을 담고 있음

GN⁺ 2023-11-22 [-]

Hacker News 의견

200k 컨텍스트의 달콤쓴맛: 70k에서 195k로 오류율이 급증한 것은 아쉬움. 하지만 중간 부분의 오류 감소에는 칭찬.
모델의 제한적 사용에 대한 불만: 클로드가 제목에서 주장하는 것처럼 거절이 적지 않음. Anthropic이 모델을 지나치게 검열하고 있어 사용하기 어려움. 사용자가 도구를 결정해야지, 도구가 사용자를 결정해서는 안 됨.
제목과 내용의 불일치 지적: 발표에서 언급된 '거절 감소'는 실제 내용과 맞지 않음. 클로드 2.1은 잘못된 정보를 제공하는 것보다 거절할 가능성이 더 높아졌음을 시사.
코딩에 대한 비효율성: GPT-4에 비해 10배 더 나쁨. 간단한 데이터베이스 동기화 함수를 요청했을 때, 실제 코드 대신 수도코드를 많이 제공.
모델에 대한 부정적인 인상: Anthropic의 모델이 대부분의 요청을 거절하도록 과도하게 학습되어 있어, 클로드와의 대화가 즐겁지 않음.
이념적 관점의 거절 사례: 효과적인 이타주의자처럼 말하기 위한 어휘 목록 요청에 대한 거절로 인해 유머러스한 상황 발생.
클로드 2에 대한 실망: 처음에는 기대했지만 GPT-4에 비해 훨씬 못 미치는 성능으로 판단, 큰 컨텍스트 창이 있어도 답변의 질이 나쁘면 의미 없음.
API 사용에 대한 접근성 문제: API 사용에 관심이 있지만, 응답을 받지 못해 실망. 개발자 플랫폼으로서의 관심 부족.
API 접근의 어려움: Anthropic의 웹사이트나 Bedrock을 통한 요청에 대한 응답을 받지 못해 비즈니스로서 API 접근이 불가능해 보임.
시스템 프롬프트 도입에 대한 관심: 사용자가 클로드에게 맞춤형 지시를 제공하여 성능을 향상시킬 수 있는 시스템 프롬프트 도입에 주목. 사용 및 남용의 용이성에 대한 기대감.
클로드의 테스트 사용과 OpenAI의 선택: 아직 생산에는 사용하지 않지만, 새로운 기능을 LLM과 함께 구축할 때 정기적으로 테스트에 포함. OpenAI가 더 빠르게 인증을 받아 시장에 출시되었고, API가 더 나아지고 신뢰할 수 있으며 저렴함. 하지만 클로드가 AWS Bedrock에 포함되면서 이전에는 불가능했던 것들이 가능해짐.

답변달기

Anthropic, Claude 2.1 릴리즈

200K 컨텍스트 윈도우

환각율 2배 감소

API Tool Use

개발자 경험

GN⁺의 의견

함께 보면 좋은 글 β

댓글과 토론

Hacker News 의견