7P by xguru 2023-08-11 | favorite | 댓글과 토론
  • 더 빠르고 저렴하면서도 높은 능력을 가진 버전으로, 일상 대화, 텍스트 분석, 요약, 문서 이해 등의 작업을 처리하도록 설계
    • Prompt: 1백만 토큰당 $1.63 , Completion: 1백만 토큰당 $5.51
    • Claude 2 모델 대비 약 1/6 ~ 1/8 수준의 가격
  • API로 이용 가능
  • 최신 Claude 2 모델의 강점을 통합하고 있으며, 수학, 코딩, 추론, 안전성 등의 분야에서 훨씬 개선되었음
  • 이전 모델보다 더 긴, 구조화된 응답을 생성하고, 서식 지시사항을 더 잘 따름
  • 인용 추출, 다국어 능력, 질문 응답 등도 개선 되었음
  • 수학과 코딩에서 Codex 58.7%의 점수를 얻어서 이전 1.1 모델의 52.8%에 비해 더 높은 점수를 얻음
  • GSM8K 벤치마크 86.7% (1.1은 80.9%)
  • 자동화된 레드팀 평가 결과, 안전성이 강화되었으며 Hallucination이 더 적고 탈옥에 더 저항력이 있음