8P by xguru 12일전 | ★ favorite | 댓글과 토론
  • Qwen2.5-32B-Instruct(추론 모델)의 파생 모델로 수학, 코드, 과학 문제 해결 추론에 특화
  • 상업적/비상업적 연구 용도로 사용할 수 있음
  • 64,000 토큰의 컨텍스트 길이를 지원하며 1.5B, 7B, 14B, 32B 크기로 제공됨
  • LiveCodeBench, GPQA, MMLU-PRO 등 다양한 벤치마크에서 동급 최고 수준의 추론 성능을 기록
  • 복수 에이전트(GenSelect) 결합 추론 시, 기존 단일 모델보다 수학·코드·과학 벤치마크에서 더욱 뛰어난 성능을 달성
    • GenSelect : 여러 개의 모델 추론을 병렬로 실행한 뒤, 최적의 해법을 선택