9P by xguru 1달전 | favorite | 댓글과 토론
  • Grok-1.5는 개선된 추론 능력과 128,000 토큰의 컨텍스트 길이를 가짐
    • 코딩 및 수학 관련 작업에서 눈에 띄는 성능 향상
    • MATH 벤치마크에서 50.6%, GSM8K 벤치마크에서 90%, HumanEval 벤치마크에서 74.1%의 점수를 달성
    • 최대 128K 토큰의 긴 컨텍스트로 이전보다 최대 16배 긴 문서의 정보를 활용할 수 있음. 더 길고 복잡한 프롬프트를 처리하면서도 지시 사항을 따르는 능력을 유지함
  • 플랫폼에서 곧 초기 테스터와 기존 Grok 사용자들에게 제공될 예정
  • JAX, Rust, Kubernetes를 기반으로 한 맞춤형 분산 훈련 프레임워크에 구축됨
  • 곧 초기 테스터에게 제공될 예정이며, 사용자의 피드백을 통해 Grok을 개선하는 데 도움을 기대함
    • 점차적으로 더 넓은 사용자에게 제공하면서 향후 몇 일 동안 여러 새로운 기능을 소개할 예정임.