11P by xguru 10달전 | favorite | 댓글과 토론
  • 향상된 답변 성능, 더 긴 답변, 공개 API로 접근 가능
  • 프롬프트에 10만개의 토큰까지 입력 가능
  • 코딩, 수학, 추론을 더 잘하게 됨
    • Codex HumamEval(파이썬 코딩테스트): 56% → 71.2%로 향상
    • GSM8k(수학 문제집 세트): 85.2% → 88%
    • Bar Exam: 73% → 76.5%
  • 탈옥으로부터 보호하는 다양한 안전 기술을 도입(Constitutional AI, Moral Self-Correction, Red Teaming Language Model)