- Gemini 2.0 Flash가 더 많은 사람들에게 일반 공개됨
- Google AI Studio와 Vertex AI의 Gemini API를 통해 프로덕션 환경에 적용 가능해짐
- 수백만 토큰의 컨텍스트 윈도우를 활용한 대용량 멀티모달 추론이 특징임
- 텍스트뿐 아니라 이미지, 음성 등 다양한 형식의 입력을 지원하도록 준비 중임
- Gemini 2.0 Flash Pricing:
- 텍스트/이미지/비디오 입력 비용: 백만 토큰당 $0.10
- 오디오 입력 비용: 백만 토큰당 $0.70 (2025년 2월 20일부터 적용될 예정)
- 텍스트 출력 비용: 백만 토큰당 $0.40
- 컨텍스트 캐싱 비용(향후 지원 예정):
- 텍스트/이미지/비디오 기준 백만 토큰당 $0.025
- 오디오 기준 백만 토큰당 $0.175
2.0 Pro 실험적 버전: 복잡한 프롬프트와 코딩 성능에 특화된 모델
- 기존 모델보다 향상된 코딩 성능과 복잡한 지식 추론 능력을 보유함
- 최대 200만 토큰의 컨텍스트 윈도우를 제공하여 대규모 데이터를 심층 분석 가능함
- Google 검색, 코드 실행 같은 외부 툴 연동 기능도 포함함
- Google AI Studio, Vertex AI에서 실험적으로 제공 중이며 Gemini 앱에서는 Advanced 사용자가 선택 가능함
2.0 Flash-Lite: 비용 대비 성능이 가장 뛰어난 모델
- 1.5 Flash 대비 품질이 향상되었지만 동일한 속도와 비용을 유지함
- 최대 100만 토큰의 컨텍스트 윈도우와 멀티모달 입력 지원
- 예: 4만 개 이미지에 대한 캡션 생성 작업을 1달러 미만으로 처리 가능함
- 현재 Google AI Studio, Vertex AI에서 퍼블릭 프리뷰로 제공 중임
- Gemini 2.0 Flash-Lite Pricing:
- 텍스트/이미지/비디오 입력 비용: 백만 토큰당 $0.075
- 오디오 입력 비용: 백만 토큰당 $0.075
- 텍스트 출력 비용: 백만 토큰당 $0.30
- 컨텍스트 캐싱 비용(향후 지원 예정):
- 텍스트/이미지/비디오 기준 백만 토큰당 $0.01875