Gemini 2.5 Pro 프리뷰 공개 - 코드 성능이 더 강력해진 구글의 AI 모델
(developers.googleblog.com)- Google이 Gemini 2.5 Pro Preview(I/O Edition) 을 정식 I/O 행사보다 앞서 조기 출시, 개발자 피드백 반영과 성능 개선 목적
- 프론트엔드와 UI 개발에서 특히 강력한 성능을 발휘하며, 코드 변환, 편집, 추상화 판단 능력이 향상됨
- VideoMME 벤치마크 84.8% 성능 기반으로, 동영상 기반 학습 앱 자동 생성이 가능해짐
- 디자인 추론을 통해 스타일 맞춤형 UI 생성 및 기능 추가도 쉽게 구현 가능함
- 기존 3월 25일 버전은 자동으로 5월 6일 버전으로 업데이트되며, 추가 작업 없이 향상된 모델 사용 가능
프론트엔드 개발에서의 우수한 성능
- Gemini 2.5 Pro는 WebDev Arena 리더보드 1위를 기록함
- aesthetically pleasing한 UI와 기능적 완성도를 기준으로 인간 선호도 평가에서 최상위 성능을 입증함
- Cognition, Replit과의 협업을 통해 에이전트형 프로그래밍의 가능성을 넓혀가는 중임
코드 이해력과 추론력의 조합
-
영상 → 코드 기능
- VideoMME 벤치마크 84.8% 성능으로 SOTA 수준의 영상 이해력 확보
- YouTube 동영상을 기반으로 한 인터랙티브 학습 앱 자동 생성 가능
- 이전 버전보다 전체 UI와 상호작용 수준이 향상된 결과물 제공
-
기능 개발 자동화
- 기존에는 디자이너 파일을 열어 색상, 폰트, 마진 등을 수동으로 CSS화해야 했음
- Gemini 2.5 Pro는 스타일 맞춤형 컴포넌트 자동 생성 가능
- 예: Gemini 95 앱과 스타일 통일된 비디오 플레이어 기능 추가 자동화 가능
-
아이디어 → 앱 구현 속도 향상
- dictation starter app 사례처럼, 기능 + 미적 완성도를 동시에 고려한 앱 생성 가능
- 파형 애니메이션, 반응형 디자인, 마우스오버 효과 등 세밀한 UI 요소 자동 생성
- 사용자가 직접 디자인하지 않아도 기본적으로 미적 감각 있는 결과물 생성
개발자 피드백 반영 및 사용 방법
- 기존 버전 대비 함수 호출 오류율 감소, 호출 트리거 개선이 이루어짐
- 기존 03-25 버전은 자동으로 05-06 버전을 가리킴 → 별도 업데이트 없이 적용됨
- Google AI Studio 및 Vertex AI에서 바로 사용 가능
- 모델 카드도 최신 정보로 갱신됨
- 최신 버전으로 자동 업데이트되며, 가격 변동 없이 제공됨
사용처 및 기대
- Replit, Cursor, Cognition 등에서 차세대 코딩 에이전트로 도입 검토 또는 적용 중
- 개인 개발자부터 기업까지 에이전트형 개발 흐름 확산에 기여할 전망
Hacker News 의견
-
과거에 프로그래밍을 위해 이러한 모델을 사용할 때 가장 큰 불만은 존재하지 않는 API를 상상하는 경향이었음. Gemini 2.5 모델, 특히 프로와 플래시 버전은 다른 모델보다 이러한 문제가 덜 발생함
- 여전히 상당한 제한이 있으며, 현재 모델이 사람처럼 추상화와 아키텍처를 접근하는 것은 불가능함
- 그러나 Gemini 모델이 일상적인 프로그래밍에서 검색과 Stack Overflow를 대체할 수 있게 되었음
-
Gemini 2.5 Pro가 WebDev Arena 리더보드에서 1위를 차지함
- WebDev Arena를 React/Tailwind Arena로 이름을 바꾸는 것이 합리적일 것 같음
- 시스템 프롬프트가 이러한 기술을 요구하며, 바닐라 JS나 다른 프레임워크를 요청할 때 전체 도구가 작동하지 않음
- 웹 개발의 좁은 정의로 모델이 경쟁하는 것은 문제가 있음
-
Gemini 2.5에 코드를 요청할 때 너무 많은 주석이 출력됨
- 섹션 주석, 단계 주석, 블록 주석, 인라인 주석 등 과도한 양의 주석이 포함됨
-
Gemini 2.5는 에이전트 작업에 뛰어나지만, 코드 편집을 위한 완벽한 차이를 생성하는 데는 여전히 어려움이 있음
- 구형 Gemini 2.5가 92%의 정확도로 적절한 차이를 생성함
- 이 비율이 95-98%로 증가할 것으로 예상됨
-
Google 관계자에게 질문: Gemini-2.5-pro-exp(무료 버전)도 업데이트되었는지, 아니면 사라질 것인지 궁금함
- 블로그 게시물에 따르면 이전 버전(03-25)이 최신 버전(05-06)을 가리키고 있으며, 개선된 모델을 사용하기 위해 추가 조치가 필요하지 않음
- Gemini-2.5-pro-preview-03-25가 이제 05-06을 사용하는지, Gemini-2.5-pro-exp-03-25에도 동일하게 적용되는지 궁금함
-
실험적 03-25와 실험적 05-06의 벤치마크를 비교할 때, 새로운 버전이 LiveCodeBench를 제외한 모든 항목에서 약간 낮은 점수를 받음
-
Gemini를 거의 모든 것에 사용하지만, 모델 카드가 o3-mini와만 비교됨
- 알려진 벤치마크에서 o3가 여전히 앞서 있음
-
Gemini 2.5 pro는 훌륭하지만, UI가 여전히 사용하기 어려운 스크롤 문제를 가지고 있음
- AI 출력이 완료된 후 몇 분 동안 대기하는 것이 좋음
- 개발 도구에서
ms-code-block
요소를 찾아$0.textContext
를 기록하는 것도 신뢰할 수 있음
-
Gemini 2.5 pro는 훌륭하지만, 비용이 매우 비싸고 불투명한 비용 통찰력을 제공함
- 최근 많은 사람들이 예상치 못한 청구서를 받았으며, 일부는 정상적인 사용으로 $500의 비용이 발생함
- 나도 피해를 입어 도구에서 API 키를 제거함
-
이 모델은 12개의 벤치마크 중 10개에서 03-25보다 성능이 떨어짐
- 코딩에 대한 훈련을 계속하면서 모든 것이 악화되었고, 매몰 비용 때문에 이를 숨기려 했을 것임
-
왜 "새로운 프리뷰" 대신 버전 번호를 사용할 수 없는지 궁금함
- 예를 들어, Gemini Pro 2.5.1로 부르면 좋을 것임