8P by kuroneko 2022-07-13 | favorite | 댓글 2개
  • BigScience에서 세계 최대 규모의 개방형 다국어 모델인 Bloom을 Hugging Face를 통해 공개.
  • 누구나 전체 크기 모델을 다운로드하고 사용 가능.
  • 1,760억 개의 매개변수를 가지고 있으며, 스페인어, 프랑스어, 아랍어 등 46개의 언어와 13개의 프로그래밍 언어를 포함함.
  • 프랑스 연구 기관인 CNRS와 GENCI로부터 자금을 지원받아 Jean Zay 슈퍼컴퓨터에서 117일(3월 11일 ~ 7월 6일)간 훈련.

안타깝게도 한국어는 포함되어있지 않습니다.

한국어가 화자 수 기준으로 46개에 포함되지 않을 규모의 언어는 결코 아닌데... 뭔가 다른 이유가 있겠네요