Lamini - LLM 훈련용 instruction 셋을 만들어주는 데이터 생성기
(github.com/lamini-ai)- 자신만의 instruction-following LLM을 파인튜닝 가능하게 해주는 오픈소스
- 71k instruction 데이터셋(CC-BY 라이센스로 상업용도 사용 가능)
- 데이터 생성기 코드 제공 (100개의 데이터 포인트만으로 70k+ 데이터 포인트 생성 가능)
- 이 100개의 데이터포인트 원형을 커스터마이징 해서 자신의 도메인에 맞게 조정 가능