6P by bamchi 2023-08-31 | favorite | 댓글과 토론
  • AI모델을 개발할 때 데이터셋의 양과 질이 모두 중요
  • ChatGPT를 활용하면 저렴하게 데이터셋 구축이 가능하며, 라벨링 대행 업체를 이용하는 것 보다 시간을 단축할 수 있음
  • 영어로 질의하면 비용절약(토큰 수 절약) 뿐만 아니라 성능도 우수함
  • 일반적인 상황에서는 temperature를 0으로 낮춰 일관적인 답변을 받는것이 유리함
  • role(user, assistant, system)에 적절한 행동 양식 지정
  • 단순 계산으로 3달러면 약 1만 건의 감정 분석 데이터셋을 라벨링 (gpt-3.5-turbo 모델 기준)