4P by xguru 8일전 | favorite | 댓글과 토론
  • Solar Pro는 단일 GPU에서 실행되도록 최적화된 가장 지능적인 LLM으로, Microsoft, Meta, Google과 같은 거대 기술 기업의 모델을 능가
  • 프리뷰 버전은 오픈 소스 모델로 제공되며 무료 API 액세스가 가능하여, 개발자와 기업이 11월 공식 출시에 앞서 모델을 테스트하고 피드백을 제공 가능
  • 이전 모델인 Solar Mini보다 두 배 이상 큰 220억 개의 파라미터를 지원
  • Upstage의 독점적인 Depth-Up Scaling(DUS) 방법과 고급 데이터 레시피 덕분에, Solar Pro는 모델 크기를 크게 줄이면서도 최첨단 성능을 제공
  • MMLU Pro 벤치마크에서 52.11의 정확도 점수를 달성, IFEval 벤치마크에서 84.37점
  • 이러한 결과는 Microsoft의 Phi 3 Medium, Meta의 Llama 3.1 8B, Mistral NeMo 12B, Google의 Gemma 2 27B 등 유사한 크기의 모델보다 뛰어남
  • Solar Pro 프리뷰는 11월 정식 출시 전까지 상용 애플리케이션을 포함한 오픈 소스 모델로서 무료 API 액세스와 함께 공개적으로 사용 가능
  • 프리뷰 버전은 영어 입력을 지원하며 4,096개의 토큰으로 구성된 컨텍스트 창을 제공