- ChatGPT API를 사용하여 Hacker News (HN) 스레드에서 책 추천을 추출하는 기사
- 저자가 "book"이라는 단어를 제목에 포함하고 다른 페이지에 연결되지 않은 HN의 거의 200개의 이야기를 분석
- 저자가 GPT API를 사용하여 데이터를 분류하고 정보를 JSON 형식으로 출력
- 데이터는 Hacker News API에서 가져왔으며, 저자는 Chat Completions API를 호출하여 텍스트에서 책 제목, 저자, URL을 추출
- 상위 50개의 책 추천이 나열되었으며, Abelson과 Sussman의 "Structure and Interpretation of Computer Programs"이 가장 추천되었음
- API가 때때로 유효한 JSON을 반환하지 않는 경우, 특히 ChatGPT가 "thanks"라는 댓글에 응답하거나 질문할 때 발견
- 저자가 제목이 없는 응답을 버리도록 프롬프트를 설계, ChatGPT가 때때로 특정 책의 제목 없이 저자의 언급을 포함하기 때문
- 57k 댓글 처리는 GPT 3.5 터보 API를 사용하여 약 $40 비용 발생
- 저자가 온도가 0일 때도 GPT의 결과가 호출마다 다르며, 이전 GPT-3 모델에 비해 더 큰 변동성을 보임을 발견
- 저자가 GPT가 텍스트에서 링크를 식별할 수 있지만, URL 대신 잘린 링크 텍스트를 선택하는 것을 방지하기 위해 HTML 태그를 제거해야 함을 발견
- 저자가 ChatGPT에 의한 JSON 출력과 작업에 사용된 프롬프트의 예를 공유했음
- GPT에 의해 생성된 원시 데이터는 제목별로 정렬되어 추가 분석을 위해 공유되었음
- 저자가 학습 연습으로 표의 Amazon URL에 Amazon 제휴 링크를 추가했음