10P by xguru 2023-08-21 | favorite | 댓글과 토론
  • LLM의 결과에 대해서 챗봇 UI 형태로 피드백 옵션을 추가 가능 (vote & rank 피드백)
    • DB에 자동으로 수집되어 RLHF 에 이용 가능
  • 모델들의 결과값을 비교하고, 결과간에 드래그 & 드롭으로 Rank 지정 가능
  • 모델에 Retrieval Augmented Generation (RAG) 을 손쉽게 통합 가능
  • 수집된 데이터로 Reinforcement Learning with Human Feedback (RLHF)를 간편하게 실행 가능