ImageBind - Meta의 멀티모달 AI모델
(imagebind.metademolab.com)- 슈퍼비젼 없이도 6가지 모달리티 데이터를 한번에 바인딩하여 다양한 정보의 종류를 더 잘 분석
- 이미지, 비디오, 오디오, 텍스트, 깊이, 열(Thermal), IMU(관성 측정 장치)
- 소리를 기반으로 이미지를 생성하거나, 오디오/비디오/이미지/깊이 데이터를 합쳐서 정보를 검색하는 작업이 가능
- 훌륭한 Zero-shot / Few-Shot 인식 성능