1.5B 모델 공개

xguru · 2025-07-21T10:21:02+09:00

Qwen2.5-32B-Instruct(추론 모델)의 파생 모델로 수학, 코드, 과학 문제 해결 추론에 특화됨 상업적/비상업적 연구 용도로 사용할 수 있음 64,000 토큰의 컨텍스트 길이를 지원하며 1.5B, 7B, 14B, 32B 크기로 제공됨 LiveCodeBench, GPQA, MMLU-PRO 등 다양한 벤치마크에서 동급 최고 수준의 추론 성능을 기록 복수 에이전트(GenSelect) 결합 추론 시, 기존 단일 모델보다 수학·코드·과학 벤치마크에서 더욱 뛰어난 성능을 달성 GenSelect : 여러 개의 모델 추론을 병렬로 실행한 뒤, 최적의 해법을 선택

(huggingface.co)

8P by xguru 11달전 | ★ favorite | 댓글과 토론

Qwen2.5-32B-Instruct(추론 모델)의 파생 모델로 수학, 코드, 과학 문제 해결 추론에 특화됨
상업적/비상업적 연구 용도로 사용할 수 있음
64,000 토큰의 컨텍스트 길이를 지원하며 1.5B, 7B, 14B, 32B 크기로 제공됨
LiveCodeBench, GPQA, MMLU-PRO 등 다양한 벤치마크에서 동급 최고 수준의 추론 성능을 기록
복수 에이전트(GenSelect) 결합 추론 시, 기존 단일 모델보다 수학·코드·과학 벤치마크에서 더욱 뛰어난 성능을 달성
- GenSelect : 여러 개의 모델 추론을 병렬로 실행한 뒤, 최적의 해법을 선택

NVIDIA, OpenReasoning-Nemotron 32B/14B/7B/1.5B 모델 공개

함께 보면 좋은 글 β

댓글과 토론