3P by xguru 2023-05-31 | favorite | 댓글 3개
  • 비젼, 오디오, 언어 모달리티를 모두 아우르는 General Represenation Model
  • 사전학습된 모델 없이도 통합된 작업들에 훌륭한 결과를 냄
  • 강력한 Emergent Zero-shot Retrieval로 훈련 데이터에서 페어링 되지 않은 모달리티를 얼라인 가능
  • Audio-to-Image, Audtio+Text-to-Image, Audio+Image-to-Image

앗, 지난 주에 올려주신 것과 동일한 것 같습니다. +_+
https://news.hada.io/topic?id=9249

헛 이런 제가 엉뚱한 걸 복사했네요 ㅠ 슬랙으로도 공유된거라 그냥 두겠습니다
(중요한거니 두번 보시는걸로.. ㅠㅠ)

넵, 감사합니다! 🙇🏼‍♂️
(덕분에 xguru님께서 직접 올리신다는걸 알게 되었네요! 🤣)