Gemini 2.5 Pro 프리뷰 공개 - 코드 성능이 더 강력해진 구글의 AI 모델

(developers.googleblog.com)

8P by GN⁺ 2025-05-07 | ★ favorite | 댓글 1개

Google이 Gemini 2.5 Pro Preview(I/O Edition) 을 정식 I/O 행사보다 앞서 조기 출시, 개발자 피드백 반영과 성능 개선 목적
프론트엔드와 UI 개발에서 특히 강력한 성능을 발휘하며, 코드 변환, 편집, 추상화 판단 능력이 향상됨
VideoMME 벤치마크 84.8% 성능 기반으로, 동영상 기반 학습 앱 자동 생성이 가능해짐
디자인 추론을 통해 스타일 맞춤형 UI 생성 및 기능 추가도 쉽게 구현 가능함
기존 3월 25일 버전은 자동으로 5월 6일 버전으로 업데이트되며, 추가 작업 없이 향상된 모델 사용 가능

프론트엔드 개발에서의 우수한 성능

Gemini 2.5 Pro는 WebDev Arena 리더보드 1위를 기록함
aesthetically pleasing한 UI와 기능적 완성도를 기준으로 인간 선호도 평가에서 최상위 성능을 입증함
Cognition, Replit과의 협업을 통해 에이전트형 프로그래밍의 가능성을 넓혀가는 중임

코드 이해력과 추론력의 조합

영상 → 코드 기능
- VideoMME 벤치마크 84.8% 성능으로 SOTA 수준의 영상 이해력 확보
- YouTube 동영상을 기반으로 한 인터랙티브 학습 앱 자동 생성 가능
- 이전 버전보다 전체 UI와 상호작용 수준이 향상된 결과물 제공
기능 개발 자동화
- 기존에는 디자이너 파일을 열어 색상, 폰트, 마진 등을 수동으로 CSS화해야 했음
- Gemini 2.5 Pro는 스타일 맞춤형 컴포넌트 자동 생성 가능
- 예: Gemini 95 앱과 스타일 통일된 비디오 플레이어 기능 추가 자동화 가능
아이디어 → 앱 구현 속도 향상
- dictation starter app 사례처럼, 기능 + 미적 완성도를 동시에 고려한 앱 생성 가능
- 파형 애니메이션, 반응형 디자인, 마우스오버 효과 등 세밀한 UI 요소 자동 생성
- 사용자가 직접 디자인하지 않아도 기본적으로 미적 감각 있는 결과물 생성

개발자 피드백 반영 및 사용 방법

기존 버전 대비 함수 호출 오류율 감소, 호출 트리거 개선이 이루어짐
기존 03-25 버전은 자동으로 05-06 버전을 가리킴 → 별도 업데이트 없이 적용됨
Google AI Studio 및 Vertex AI에서 바로 사용 가능
모델 카드도 최신 정보로 갱신됨
최신 버전으로 자동 업데이트되며, 가격 변동 없이 제공됨

사용처 및 기대

Replit, Cursor, Cognition 등에서 차세대 코딩 에이전트로 도입 검토 또는 적용 중
개인 개발자부터 기업까지 에이전트형 개발 흐름 확산에 기여할 전망

GeekNews Weekly에 포함된 글입니다. 에디터 코멘트 보기

GN⁺ 2025-05-07 [-]

Hacker News 의견

과거에 프로그래밍을 위해 이러한 모델을 사용할 때 가장 큰 불만은 존재하지 않는 API를 상상하는 경향이었음. Gemini 2.5 모델, 특히 프로와 플래시 버전은 다른 모델보다 이러한 문제가 덜 발생함
- 여전히 상당한 제한이 있으며, 현재 모델이 사람처럼 추상화와 아키텍처를 접근하는 것은 불가능함
- 그러나 Gemini 모델이 일상적인 프로그래밍에서 검색과 Stack Overflow를 대체할 수 있게 되었음
Gemini 2.5 Pro가 WebDev Arena 리더보드에서 1위를 차지함
- WebDev Arena를 React/Tailwind Arena로 이름을 바꾸는 것이 합리적일 것 같음
- 시스템 프롬프트가 이러한 기술을 요구하며, 바닐라 JS나 다른 프레임워크를 요청할 때 전체 도구가 작동하지 않음
- 웹 개발의 좁은 정의로 모델이 경쟁하는 것은 문제가 있음
Gemini 2.5에 코드를 요청할 때 너무 많은 주석이 출력됨
- 섹션 주석, 단계 주석, 블록 주석, 인라인 주석 등 과도한 양의 주석이 포함됨
Gemini 2.5는 에이전트 작업에 뛰어나지만, 코드 편집을 위한 완벽한 차이를 생성하는 데는 여전히 어려움이 있음
- 구형 Gemini 2.5가 92%의 정확도로 적절한 차이를 생성함
- 이 비율이 95-98%로 증가할 것으로 예상됨
Google 관계자에게 질문: Gemini-2.5-pro-exp(무료 버전)도 업데이트되었는지, 아니면 사라질 것인지 궁금함
- 블로그 게시물에 따르면 이전 버전(03-25)이 최신 버전(05-06)을 가리키고 있으며, 개선된 모델을 사용하기 위해 추가 조치가 필요하지 않음
- Gemini-2.5-pro-preview-03-25가 이제 05-06을 사용하는지, Gemini-2.5-pro-exp-03-25에도 동일하게 적용되는지 궁금함
실험적 03-25와 실험적 05-06의 벤치마크를 비교할 때, 새로운 버전이 LiveCodeBench를 제외한 모든 항목에서 약간 낮은 점수를 받음
Gemini를 거의 모든 것에 사용하지만, 모델 카드가 o3-mini와만 비교됨
- 알려진 벤치마크에서 o3가 여전히 앞서 있음
Gemini 2.5 pro는 훌륭하지만, UI가 여전히 사용하기 어려운 스크롤 문제를 가지고 있음
- AI 출력이 완료된 후 몇 분 동안 대기하는 것이 좋음
- 개발 도구에서 ms-code-block 요소를 찾아 $0.textContext를 기록하는 것도 신뢰할 수 있음
Gemini 2.5 pro는 훌륭하지만, 비용이 매우 비싸고 불투명한 비용 통찰력을 제공함
- 최근 많은 사람들이 예상치 못한 청구서를 받았으며, 일부는 정상적인 사용으로 $500의 비용이 발생함
- 나도 피해를 입어 도구에서 API 키를 제거함
이 모델은 12개의 벤치마크 중 10개에서 03-25보다 성능이 떨어짐
- 코딩에 대한 훈련을 계속하면서 모든 것이 악화되었고, 매몰 비용 때문에 이를 숨기려 했을 것임
왜 "새로운 프리뷰" 대신 버전 번호를 사용할 수 없는지 궁금함
- 예를 들어, Gemini Pro 2.5.1로 부르면 좋을 것임

답변달기

Gemini 2.5 Pro 프리뷰 공개 - 코드 성능이 더 강력해진 구글의 AI 모델

프론트엔드 개발에서의 우수한 성능

코드 이해력과 추론력의 조합

영상 → 코드 기능

기능 개발 자동화

아이디어 → 앱 구현 속도 향상

개발자 피드백 반영 및 사용 방법

사용처 및 기대

함께 보면 좋은 글 β

댓글과 토론

Hacker News 의견