8P by xguru 2023-01-04 | favorite | 댓글과 토론
  • Tesla의 AI 헤드였던 Andrej Karpathy가 minGPT를 재작성한 코드
  • 읽기 쉽고 평범한 코드를 작성하는 것을 목표
    • 300줄 가량의 train.py
    • 300줄 가량의 model.py
  • OpenWebText 데이터 세트에서 GPT-2를 재현하는 작업중