Numpy 60라인으로 GPT 구현하기
(jaykmody.com)- Python, Numpy에 익숙하다는 전제하에 간단히 GPT를 구현하고, OpenAI가 공개한 GPT-2 모델을 로드하여 텍스트 생성해보는 튜토리얼
 
목차
- GPT란 무엇인가
 - 셋업 : Encoder, Hyperparameters, Parameters
 - Basic Layers : GeLU, Softmax, Layer Normalization, Linear
 - GPT Architecture
- Embeddings
 - Decoder Stack
 - Project to Vocab
 - Decoder Block
 - Position-wise Feed Forward Network
 - Multi-Head Causal Self Attention
 
 - 다 합치기
 - What's Next?
- GPU/TPU Support
 - Backpropagation
 - Batching
 - Inference Optimization
 - Training
 - Evaluation
 - Architecture Improvements