사람의 피드백과 함께 재귀적으로 책 요약하기
(openai.com)- OpenAI가 새로 발표한 논문
- AI모델 적용을 위해서는 머신러닝 모델이 사람의 의도대로 동작하는지를 확인해야함
ㅤ→ Alignment 문제
- Alignment 해결은 사람이 평가하기 어렵고 시간이 많이 걸림
- Scalable Alignment 기술을 테스트 하기 위해 책 전체를 요약하는 모델을 훈련시켰음
ㅤ→ 책을 섹션단위로 요약한 후에, 그 요약을 다시 상위레벨에서 요약하는 방식으로 최종 요약이 될때까지 요약해 나감
ㅤ→ 26449 단어 짜리 "이상한 나라의 앨리스"를 136단어로 요약
ㅤ→ GPT-3 에서 미세 조정한 것으로, 사람이 작성한 요약의 평균 품질과 비슷한 수준의 훌륭한 요약을 생성해냄