16P by xguru 5달전 | favorite | 댓글 7개
  • MMLU에서 90%를 받아 인간 전문가를 능가한 최초의 AI 모델 Gemini(제미나이)
  • 멀티모달 AI 모델로 이미지/비디오/오디오 다중 모드 벤치마크에서도 GPT-4V 와 Whisper 를 능가
  • 3가지 모델로 크기에 따른 최적화
    • Ultra : 복잡한 작업을 위한 가장 크고 뛰어난 모델
    • Pro : 광범위한 작업에 걸쳐 확장 가능
    • Nano : 온디바이스 작업을 위한 가장 효율적인 모델
  • Python, Java, C++, Go 등 세계에서 가장 널리 사용되는 프로그래밍 언어로 고품질 코드를 이해하고 설명하며 생성
  • Gemini 를 이용한 Competitive Programming용 AlphaCode 2도 출시
  • TPU v4 및 v5e를 사용하여 AI에 최적화된 인프라에서 Gemini 1.0을 대규모로 교육
    • 더욱 안정적이고 확장 가능하며 효율적
  • Responsibility 와 Safety에 중점을 둠
    • 포괄적인 안전성 평가를 수행
  • Gemini Pro 는 Google Bard에서 바로 사용 가능
    • 영어로 170개국에서 사용가능하며, 다른 모달리티와 새로운 언어를 곧 지원 예정
  • Gemini Nano 를 Pixel 8 Pro에 도입할 것
  • 몇달내로 검색, 광고, 크롬 및 Duet AI에도 Gemini를 적용할 것
  • 12월 13일 부터 개발자와 기업고객들은 Google AI Studio 및 Google Cloud Vertex AI를 통해서 Gemini API 이용가능(Pro만)
  • Gemini Ultra 도 곧 사용 가능
    • 신뢰할 수 있는 외부 기관의 레드팀 검증을 포함한 광범위한 신뢰 및 안전 점검을 완료하고 있으며, 광범위한 공개를 앞두고 미세 조정과 사람 피드백을 통한 강화 학습(RLHF)을 통해 모델을 더욱 정교하게 다듬는 중
    • 일부 고객, 개발자, 파트너, 안전 및 책임 전문가에게 Gemini Ultra를 제공하여 초기 실험과 피드백을 받은 후 내년 초에 개발자와 기업 고객에게 공개할 예정
    • 내년 초에는 Gemini Ultra를 시작으로 최고의 모델과 기능을 이용할 수 있는 새로운 최첨단 AI 환경인 바드 어드밴스드(Bard Advanced)도 출시할 예정

nano는 Pixel 8 Pro에서 사용가능하다고 합니다.... 만
https://blog.google/products/pixel/pixel-feature-drop-december-2023/

적용범위에는 한국어가 지원안되는 Voice Recorder와 beta 에 별도로 opt-in 해야하는 gboard 밖에 없네요.

그래서 한국엔 Pixel 안 파는거 아닌가요..? ㅎㅎ
저 픽셀 1 아직 가지고 있는데 ㅠ

드디어 나왔네요. 구글 제품에 전반적으로 적용 되면 어떤 모습일지 기대되네요

영상 보고 '바드가 그렇게 별로인데 그걸 벌써 다 뛰어넘었다고?' 라고 생각했는데요.

연출된 영상이라고 하네요. 이러면 사기 아닌가요..
https://www.tomshardware.com/news/google-gemini-ai-video-staged

그런 트윗이 기억나네요, '혹자는 구글이 AI에서 뒤쳐지고 있다고 생각하지만, 그들은 그들만의 another level에 있는거야'.

오늘 구글 주식 많이 올랐네요.

가장 흥미로운 영상은 Hands-on with Gemini: Interacting with multimodal AI 입니다.
6분 정도니까 꼭 한번 보시기 바랍니다. 멀티모달 AI가 발전하면 우리가 영화에서 보던 자비스가 실현되겠네요.

GPT-4 Vision도 놀라웠는데, 진짜 자비스의 시대가 올 것 같네요... +_+