5P by laeyoung 2022-04-05 | favorite | 댓글 3개
  • 540B 파라미터를 가진 모델로 GPT-3 (175B) 대비 3배 커짐
  • TPU v4를 이용해 학습을 진행함
  • 모델이 커짐으로써 더 다양한 Task들을 처리 할 수 있음 (수학문제, 설명, 코드 생성 등)

관련 글

구글에서는 이런 걸 로봇과 결합하여, 인공지능이 현실의 물리 세계 또한 배울 수 있도록 하려는 것 같습니다.
https://say-can.github.io/
https://arxiv.org/abs/2204.01691

AI Model이 크면 클수록 좋다, 라는 흐름이 계속 되는거 같습니다.