4P by xguru 1달전 | favorite | 댓글 1개
  • Qwen2 LLM을 기반으로 만들어진 Qwen2-Math는 오픈 소스 모델과 비공개 모델(예: GPT-4o)의 수학 능력을 크게 능가함
    • Qwen2-Math와 Qwen2-Math-Instruct-1.5B/7B/72B를 포함한 수학 특화 대형 언어 모델 시리즈
  • 최대 모델인 Qwen2-Math-72B-Instruct가 GPT-4o, Claude-3.5-Sonnet, Gemini-1.5-Pro, Llama-3.1-405B 등 최신 모델을 능가하는 것으로 나타남
  • 현재 모델은 영어만 지원. 곧 이중 언어(영어 및 중국어) 수학 모델을 출시할 예정