4P by xguru 2020-02-12 | favorite | 댓글과 토론

- PyTorch 위의 경량 래퍼
- 최소한의 코드 변경, 10배 이상 큰 모델, 5배 이상의 속도
- Zero Redundancy Optimizer (ZeRO)적용으로 학습시 사용하는 메모리 최소화(4x)