Gemini Flash

(deepmind.google)

Gemini Flash는 경량, 빠른 속도, 비용 효율성을 특징으로 하며, 다중 모드 추론과 최대 백만 토큰의 긴 컨텍스트 창을 제공함.

성능

컨텍스트 창: 기본적으로 백만 토큰의 컨텍스트 창을 제공하여, 1시간의 비디오, 11시간의 오디오, 30,000줄 이상의 코드베이스 또는 700,000단어 이상을 처리할 수 있음.

일반: MMLU 벤치마크에서 57개 과목(과학, 인문학 등)의 질문을 다룸.
- Gemini 1.0 Pro: 71.8%
- Gemini 1.0 Ultra: 83.7%
- Gemini 1.5 Pro (2024년 2월): 81.9%
- Gemini 1.5 Flash: 78.9%
코드: Python 코드 생성, HumanEval과 유사한 데이터셋 사용.
- Gemini 1.0 Pro: 69.6%
- Gemini 1.0 Ultra: 74.9%
- Gemini 1.5 Pro (2024년 2월): 77.7%
- Gemini 1.5 Flash: 77.2%
수학: 도전적인 수학 문제(대수학, 기하학, 미적분 등).
- Gemini 1.0 Pro: 32.6%
- Gemini 1.0 Ultra: 53.2%
- Gemini 1.5 Pro (2024년 2월): 58.5%
- Gemini 1.5 Flash: 54.9%
추론: 생물학, 물리학, 화학 전문가가 작성한 질문 데이터셋.
- Gemini 1.0 Pro: 27.9%
- Gemini 1.0 Ultra: 35.7%
- Gemini 1.5 Pro (2024년 2월): 41.5%
- Gemini 1.5 Flash: 39.5%
다국어: WMT23 언어 번역.
- Gemini 1.0 Pro: 71.7
- Gemini 1.0 Ultra: 74.4
- Gemini 1.5 Pro (2024년 2월): 75.2
- Gemini 1.5 Flash: 74.1
이미지: 대학 수준의 다학문적 추론 문제.
- Gemini 1.0 Pro: 47.9%
- Gemini 1.0 Ultra: 59.4%
- Gemini 1.5 Pro (2024년 2월): 58.5%
- Gemini 1.5 Flash: 56.1%
오디오: 55개 언어의 자동 음성 인식(단어 오류율 기준, 낮을수록 좋음).
- Gemini 1.0 Pro: 6.4
- Gemini 1.0 Ultra: 6.0
- Gemini 1.5 Pro (2024년 2월): 6.6
- Gemini 1.5 Flash: 9.8
비디오: 비디오 질문 응답.
- Gemini 1.0 Pro: 55.7%
- Gemini 1.0 Ultra: 61.5%
- Gemini 1.5 Pro (2024년 2월): 63.2%
- Gemini 1.5 Flash: 63.5%

긴 컨텍스트 창: Gemini Flash의 백만 토큰 컨텍스트 창은 대규모 데이터 처리에 매우 유용함. 이는 특히 비디오, 오디오, 대규모 코드베이스를 다루는 프로젝트에 큰 도움이 됨.
비용 효율성: Gemini Flash는 더 큰 모델과 비교해도 품질이 비슷하면서도 비용이 적게 듦. 이는 예산이 제한된 프로젝트나 스타트업에 매우 유리함.
다양한 벤치마크: 다양한 벤치마크에서 Gemini Flash의 성능을 확인할 수 있음. 이는 모델의 다재다능함을 보여줌.
개발자 친화적: Google AI Studio와 Vertex AI를 통해 쉽게 통합할 수 있어 개발자들에게 매우 편리함.
경쟁 제품: OpenAI의 GPT-4와 같은 다른 모델들과 비교해볼 때, Gemini Flash는 속도와 비용 면에서 경쟁력이 있음.