ChatGPT로 저렴하게 학습데이터 구축하는 방법
(blog.hashscraper.com)- AI모델을 개발할 때 데이터셋의 양과 질이 모두 중요
- ChatGPT를 활용하면 저렴하게 데이터셋 구축이 가능하며, 라벨링 대행 업체를 이용하는 것 보다 시간을 단축할 수 있음
- 영어로 질의하면 비용절약(토큰 수 절약) 뿐만 아니라 성능도 우수함
- 일반적인 상황에서는 temperature를 0으로 낮춰 일관적인 답변을 받는것이 유리함
- role(user, assistant, system)에 적절한 행동 양식 지정
- 단순 계산으로 3달러면 약 1만 건의 감정 분석 데이터셋을 라벨링 (gpt-3.5-turbo 모델 기준)