MTIA v1: Meta의 1세대 AI 추론 가속기
(ai.facebook.com)- GPU는 메타의 DLRM(딥러닝 추천 모델)을 실행하는데 최적이 아님
- 그래서 추천에 적합한 Meta Training and Inference Accelerator(MTIA) ASIC을 개발
- 차세대 추천 모델에 대한 요구사항을 염두에 두고 공동 설계하고, 이를 PyTorch에 통합하여 완전히 최적화된 랭킹시스템을 구축
- TSMC 7나노 공정, 800Mhz, 102.4 TOPS @ INT8, 51.2 TFLOPS @ FP16, 25W