16P by xguru 2023-05-01 | favorite | 댓글과 토론
  • Vicuna v0 13B를 명령어 파인튜닝 및 RLHF 훈련
  • 3개의 데이터셋을 이용하여 SFT(Supervised Fine-Tuning)
    • OpenAssistant Conversations Dataset(OASST1)
    • GPT4All Prompt Generations
    • Alpaca
  • HuggingFace에서 LLaMA모델에 대한 가중치 델타로 다운로드 가능(오리지널 LLaMA 데이터 필요)