GN⁺: Gemini 2.0 전 세계 사용자에게 공개
(blog.google)-
Gemini 2.0의 일반 공개
- 2024년 I/O에서 처음 소개된 Flash 시리즈 모델은 대량의 고빈도 작업에 최적화된 강력한 모델로, 개발자들 사이에서 인기를 끌고 있음
- 2.0 Flash는 이제 더 많은 사용자에게 일반적으로 제공되며, 주요 벤치마크에서 성능이 향상되었음
- 이미지 생성 및 음성 변환 기능도 곧 추가될 예정임
-
2.0 Pro 실험적 모델: 최고의 코딩 성능과 복잡한 프롬프트 처리
- Gemini 2.0 Pro는 코딩 성능과 복잡한 프롬프트 처리 능력이 가장 뛰어난 모델로, 세계 지식에 대한 이해와 추론 능력이 향상되었음
- 2백만 토큰의 가장 큰 컨텍스트 윈도우를 제공하여 방대한 정보를 종합적으로 분석하고 이해할 수 있음
- Google AI Studio와 Vertex AI에서 개발자에게 실험적 모델로 제공되며, Gemini Advanced 사용자도 이용 가능함
-
2.0 Flash-Lite: 가장 비용 효율적인 모델
- 1.5 Flash의 가격과 속도에 대한 긍정적인 피드백을 바탕으로, 2.0 Flash-Lite는 동일한 속도와 비용으로 더 나은 품질을 제공함
- 대부분의 벤치마크에서 1.5 Flash를 능가하며, 1백만 토큰의 컨텍스트 윈도우와 멀티모달 입력을 지원함
- Google AI Studio와 Vertex AI에서 공개 미리보기로 제공됨
-
책임과 안전 작업
- Gemini 모델 패밀리가 더욱 강력해짐에 따라 안전하고 보안적인 사용을 위한 강력한 조치를 계속 투자하고 있음
- 새로운 강화 학습 기법을 사용하여 Gemini 자체가 응답을 비판하도록 하여 더 정확하고 목표 지향적인 피드백을 제공함
- 자동화된 레드 팀을 활용하여 간접 프롬프트 주입과 같은 사이버 보안 공격의 위험을 평가하고 있음
Hacker News 의견
-
Gemini 모델에 대한 명확한 정보 부족으로 혼란스러움. Google Workspace 구독에 포함된 Gemini Advanced에 대한 정보가 부족함.
- "Gemini Advanced"라는 이름만 있고, 모델 선택 옵션이 없음.
- Google AI Studio는 LLM 래퍼 앱 구축에 중점을 두고 있지만, 단순히 질문에 답변을 원하는 사용자에게는 적합하지 않음.
- 검색을 통해 얻은 정보는 불확실하며, Gemini Advanced가 Workspace 구독에 포함된다는 정보가 있음.
- gemini.google.com 페이지에는 모델에 대한 정보가 전혀 없으며, 설정 옵션은 다크 모드 변경만 가능함.
-
Google AI Studio와 Vertex AI를 통해 Gemini API에 접근 가능함.
- Gemini 2.0, 2.0 Pro, 2.0 Pro Experimental, Gemini 2.0 Flash, Gemini 2.0 Flash Lite 등 다양한 모델이 존재함.
- 벤치마크는 자체 모델과만 비교됨.
-
음성 채팅 시 정치적 주제에 대한 제한이 있음.
- 사용자가 요리 계획을 이야기할 때, 정치적 주제로 오해받아 대화가 제한됨.
-
AI 모델의 이름이 혼란스러움.
- Flash, Flash-Lite 등 명명 규칙이 이해하기 어려움.
- Google 모델의 품질이 다른 주요 업체에 비해 낮다는 의견이 있음.
-
PDF 파싱에 있어 가격 대비 성능이 뛰어남.
- Gemini Flash-Lite는 비용 효율적이며, Lite 버전의 벤치마크를 기대함.
-
AI Studio에서 새로운 모델을 실험해볼 수 있음.
- 라이브 모드를 통해 실시간 대화 가능하며, 카메라를 통해 세상을 볼 수 있음.
-
Gemini 2.0 Flash-Lite의 가격이 OpenAI의 GPT-4o mini보다 저렴함.
- 텍스트/이미지 입력과 오디오 입력에 대한 가격이 상대적으로 저렴함.
-
Gemini Pro 2.0 모델이 인상적임.
- 연구, 분석, 글쓰기 등 일반적인 인지 작업에 적합함.
- AI Studio를 통해 사용하기를 추천하며, Gemini 앱은 필터가 많아 논란이 될 수 있는 주제에 대한 답변이 제한적임.
-
Gemini 2.0 Flash 모델이 멀티모달 작업에 뛰어남.
- 문서 작업과 객체 탐지에 적합하며, 가격 대비 성능이 우수함.
- Qwen2.5 VL 72B와 7B 모델이 문서 이미지 작업에 더 나은 성능을 보임.
-
Gemini 2.0 Pro Experimental 모델이 주목받고 있음.
- 복잡한 프롬프트 처리와 코딩 성능이 뛰어나며, 200만 토큰의 컨텍스트 윈도우를 제공함.