구글, 1.6조개 파라미터 AI NLP 모델 Switch Transformer를 오픈소스로 공개

(infoq.com)

3P by xguru 2021-02-19 | ★ favorite | 댓글과 토론

- 기존 T5(Text-to-Text Transfer Transformer) 모델 대비 7x의 학습속도 개선
- Switch Routing 이라는 변형 MoE(Mixture-of-Experts) 알고리듬으로, 입력되는 값별로 다른 파라미터를 적용
- 모델 학습을 위해 Mesh-Tensorflow 사용 (Model Parallelism)

구글, 1.6조개 파라미터 AI NLP 모델 Switch Transformer를 오픈소스로 공개

함께 보면 좋은 글 β

댓글과 토론