Stability AI, 세계 최초의 오픈소스 RLHF LLM 챗봇 StableVicuna 공개

xguru · 2023-05-01T10:32:02+09:00

Vicuna v0 13B를 명령어 파인튜닝 및 RLHF 훈련 3개의 데이터셋을 이용하여 SFT(Supervised Fine-Tuning) OpenAssistant Conversations Dataset(OASST1) GPT4All Prompt Generations Alpaca HuggingFace에서 LLaMA모델에 대한 가중치 델타로 다운로드 가능(오리지널 LLaMA 데이터 필요)

(stability.ai)

16P by xguru 2023-05-01 | ★ favorite | 댓글과 토론

Vicuna v0 13B를 명령어 파인튜닝 및 RLHF 훈련
3개의 데이터셋을 이용하여 SFT(Supervised Fine-Tuning)
- OpenAssistant Conversations Dataset(OASST1)
- GPT4All Prompt Generations
- Alpaca
HuggingFace에서 LLaMA모델에 대한 가중치 델타로 다운로드 가능(오리지널 LLaMA 데이터 필요)

Stability AI, 세계 최초의 오픈소스 RLHF LLM 챗봇 StableVicuna 공개

함께 보면 좋은 글 β

댓글과 토론