Show GN: 한국 주식시장 뉴스 분석 및 투자 리서치를 위해 특화된 7B 파라미터 에이전트 LLM

(huggingface.co)

한국 증시(KOSPI+KOSDAQ) 특화 언어 모델 VELA를 공개합니다.

Qwen2.5-7B-Instruct를 베이스로 SFT + DPO 파이프라인으로 파인튜닝했습니다.

만든 이유
기존 금융 LLM은 한국 시장 용어에서 할루시네이션이 심하거나,
응답 중간에 중국어/영어로 전환되는 language leak 문제가 있었습니다.
VELA는 이 두 문제를 DPO로 집중 교정했습니다.

학습 데이터

출력 포맷

성능 (RTX 3060 12GB 기준)

포맷	속도	용량	Chinese Leak
Q4_K_M	36 tok/s	4.4GB	0/5 CLEAN
Q8_0	25 tok/s	7.6GB	0/5 CLEAN

주의: 실제 사용시엔 제대로된 뉴스 출처 및 데이터를 모델에게 제공해주셔야 합니다. 정확한 출처가 없는 경우 환각이 발생할 수 있습니다. https://github.com/unohee/vela-framework 와 함께 사용되도록 설계되어 있습니다.

지원 인터페이스
llama-cpp-python / Ollama / vLLM / Transformers / MLX

라이선스: Apache 2.0

실시간 시세는 외부 API로 공급하고, VELA는 그 위의 추론 레이어로 설계됐습니다.
투자 조언이 아닌 정보 제공 목적입니다.

대단하십니다 ^^

멋지네요! 7B 로도 안정적인가요?

모델 사이즈에 비해서 기본적인 업무들은 base 모델보다 확실히 낫습니다. 벤치마크도 같이 올려야겠네요!

함께 보면 좋은 글 β