# ChatGPT로 저렴하게 학습데이터 구축하는 방법

> Clean Markdown view of GeekNews topic #10628. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=10628](https://news.hada.io/topic?id=10628)
- GeekNews Markdown: [https://news.hada.io/topic/10628.md](https://news.hada.io/topic/10628.md)
- Type: news
- Author: [bamchi](https://news.hada.io/@bamchi)
- Published: 2023-08-31T09:29:08+09:00
- Updated: 2023-08-31T09:29:08+09:00
- Original source: [blog.hashscraper.com](https://blog.hashscraper.com/breaking-through-instagram-data-collection-hell-3-methods/)
- Points: 6
- Comments: 0

## Topic Body

* AI모델을 개발할 때 데이터셋의 양과 질이 모두 중요  
* ChatGPT를 활용하면 저렴하게 데이터셋 구축이 가능하며, 라벨링 대행 업체를 이용하는 것 보다 시간을 단축할 수 있음  
* 영어로 질의하면 비용절약(토큰 수 절약) 뿐만 아니라 성능도 우수함  
* 일반적인 상황에서는 temperature를 0으로 낮춰 일관적인 답변을 받는것이 유리함  
* role(user, assistant, system)에 적절한 행동 양식 지정  
* 단순 계산으로 3달러면 약 1만 건의 감정 분석 데이터셋을 라벨링 (gpt-3.5-turbo 모델 기준)

## Comments



_No public comments on this page._
