구글, AI 모델 Gemini 공개
(blog.google)- MMLU에서 90%를 받아 인간 전문가를 능가한 최초의 AI 모델 Gemini(제미나이)
- 멀티모달 AI 모델로 이미지/비디오/오디오 다중 모드 벤치마크에서도 GPT-4V 와 Whisper 를 능가
- 3가지 모델로 크기에 따른 최적화
- Ultra : 복잡한 작업을 위한 가장 크고 뛰어난 모델
- Pro : 광범위한 작업에 걸쳐 확장 가능
- Nano : 온디바이스 작업을 위한 가장 효율적인 모델
- Python, Java, C++, Go 등 세계에서 가장 널리 사용되는 프로그래밍 언어로 고품질 코드를 이해하고 설명하며 생성
- Gemini 를 이용한 Competitive Programming용 AlphaCode 2도 출시
- TPU v4 및 v5e를 사용하여 AI에 최적화된 인프라에서 Gemini 1.0을 대규모로 교육
- 더욱 안정적이고 확장 가능하며 효율적
- Responsibility 와 Safety에 중점을 둠
- 포괄적인 안전성 평가를 수행
- Gemini Pro 는 Google Bard에서 바로 사용 가능
- 영어로 170개국에서 사용가능하며, 다른 모달리티와 새로운 언어를 곧 지원 예정
- Gemini Nano 를 Pixel 8 Pro에 도입할 것
- 몇달내로 검색, 광고, 크롬 및 Duet AI에도 Gemini를 적용할 것
- 12월 13일 부터 개발자와 기업고객들은 Google AI Studio 및 Google Cloud Vertex AI를 통해서 Gemini API 이용가능(Pro만)
- Gemini Ultra 도 곧 사용 가능
- 신뢰할 수 있는 외부 기관의 레드팀 검증을 포함한 광범위한 신뢰 및 안전 점검을 완료하고 있으며, 광범위한 공개를 앞두고 미세 조정과 사람 피드백을 통한 강화 학습(RLHF)을 통해 모델을 더욱 정교하게 다듬는 중
- 일부 고객, 개발자, 파트너, 안전 및 책임 전문가에게 Gemini Ultra를 제공하여 초기 실험과 피드백을 받은 후 내년 초에 개발자와 기업 고객에게 공개할 예정
- 내년 초에는 Gemini Ultra를 시작으로 최고의 모델과 기능을 이용할 수 있는 새로운 최첨단 AI 환경인 바드 어드밴스드(Bard Advanced)도 출시할 예정
영상 보고 '바드가 그렇게 별로인데 그걸 벌써 다 뛰어넘었다고?' 라고 생각했는데요.
연출된 영상이라고 하네요. 이러면 사기 아닌가요..
https://www.tomshardware.com/news/google-gemini-ai-video-staged
그런 트윗이 기억나네요, '혹자는 구글이 AI에서 뒤쳐지고 있다고 생각하지만, 그들은 그들만의 another level에 있는거야'.
오늘 구글 주식 많이 올랐네요.
nano는 Pixel 8 Pro에서 사용가능하다고 합니다.... 만
https://blog.google/products/pixel/pixel-feature-drop-december-2023/
적용범위에는 한국어가 지원안되는 Voice Recorder와 beta 에 별도로 opt-in 해야하는 gboard 밖에 없네요.
가장 흥미로운 영상은 Hands-on with Gemini: Interacting with multimodal AI 입니다.
6분 정도니까 꼭 한번 보시기 바랍니다. 멀티모달 AI가 발전하면 우리가 영화에서 보던 자비스가 실현되겠네요.