Stability AI, 세계 최초의 오픈소스 RLHF LLM 챗봇 StableVicuna 공개
(stability.ai)- Vicuna v0 13B를 명령어 파인튜닝 및 RLHF 훈련
- 3개의 데이터셋을 이용하여 SFT(Supervised Fine-Tuning)
- OpenAssistant Conversations Dataset(OASST1)
- GPT4All Prompt Generations
- Alpaca
- HuggingFace에서 LLaMA모델에 대한 가중치 델타로 다운로드 가능(오리지널 LLaMA 데이터 필요)