7P by GN⁺ 2일전 | ★ favorite | 댓글 1개
  • Google이 Gemini 2.5 Pro Preview(I/O Edition)정식 I/O 행사보다 앞서 조기 출시, 개발자 피드백 반영과 성능 개선 목적
  • 프론트엔드와 UI 개발에서 특히 강력한 성능을 발휘하며, 코드 변환, 편집, 추상화 판단 능력이 향상됨
  • VideoMME 벤치마크 84.8% 성능 기반으로, 동영상 기반 학습 앱 자동 생성이 가능해짐
  • 디자인 추론을 통해 스타일 맞춤형 UI 생성 및 기능 추가도 쉽게 구현 가능함
  • 기존 3월 25일 버전은 자동으로 5월 6일 버전으로 업데이트되며, 추가 작업 없이 향상된 모델 사용 가능

프론트엔드 개발에서의 우수한 성능

  • Gemini 2.5 Pro는 WebDev Arena 리더보드 1위를 기록함
  • aesthetically pleasing한 UI와 기능적 완성도를 기준으로 인간 선호도 평가에서 최상위 성능을 입증함
  • Cognition, Replit과의 협업을 통해 에이전트형 프로그래밍의 가능성을 넓혀가는 중임

코드 이해력과 추론력의 조합

  • 영상 → 코드 기능

    • VideoMME 벤치마크 84.8% 성능으로 SOTA 수준의 영상 이해력 확보
    • YouTube 동영상을 기반으로 한 인터랙티브 학습 앱 자동 생성 가능
    • 이전 버전보다 전체 UI와 상호작용 수준이 향상된 결과물 제공
  • 기능 개발 자동화

    • 기존에는 디자이너 파일을 열어 색상, 폰트, 마진 등을 수동으로 CSS화해야 했음
    • Gemini 2.5 Pro는 스타일 맞춤형 컴포넌트 자동 생성 가능
    • 예: Gemini 95 앱과 스타일 통일된 비디오 플레이어 기능 추가 자동화 가능
  • 아이디어 → 앱 구현 속도 향상

    • dictation starter app 사례처럼, 기능 + 미적 완성도를 동시에 고려한 앱 생성 가능
    • 파형 애니메이션, 반응형 디자인, 마우스오버 효과 등 세밀한 UI 요소 자동 생성
    • 사용자가 직접 디자인하지 않아도 기본적으로 미적 감각 있는 결과물 생성

개발자 피드백 반영 및 사용 방법

  • 기존 버전 대비 함수 호출 오류율 감소, 호출 트리거 개선이 이루어짐
  • 기존 03-25 버전은 자동으로 05-06 버전을 가리킴 → 별도 업데이트 없이 적용됨
  • Google AI StudioVertex AI에서 바로 사용 가능
  • 모델 카드도 최신 정보로 갱신됨
  • 최신 버전으로 자동 업데이트되며, 가격 변동 없이 제공됨

사용처 및 기대

  • Replit, Cursor, Cognition 등에서 차세대 코딩 에이전트로 도입 검토 또는 적용 중
  • 개인 개발자부터 기업까지 에이전트형 개발 흐름 확산에 기여할 전망
Hacker News 의견
  • 과거에 프로그래밍을 위해 이러한 모델을 사용할 때 가장 큰 불만은 존재하지 않는 API를 상상하는 경향이었음. Gemini 2.5 모델, 특히 프로와 플래시 버전은 다른 모델보다 이러한 문제가 덜 발생함

    • 여전히 상당한 제한이 있으며, 현재 모델이 사람처럼 추상화와 아키텍처를 접근하는 것은 불가능함
    • 그러나 Gemini 모델이 일상적인 프로그래밍에서 검색과 Stack Overflow를 대체할 수 있게 되었음
  • Gemini 2.5 Pro가 WebDev Arena 리더보드에서 1위를 차지함

    • WebDev Arena를 React/Tailwind Arena로 이름을 바꾸는 것이 합리적일 것 같음
    • 시스템 프롬프트가 이러한 기술을 요구하며, 바닐라 JS나 다른 프레임워크를 요청할 때 전체 도구가 작동하지 않음
    • 웹 개발의 좁은 정의로 모델이 경쟁하는 것은 문제가 있음
  • Gemini 2.5에 코드를 요청할 때 너무 많은 주석이 출력됨

    • 섹션 주석, 단계 주석, 블록 주석, 인라인 주석 등 과도한 양의 주석이 포함됨
  • Gemini 2.5는 에이전트 작업에 뛰어나지만, 코드 편집을 위한 완벽한 차이를 생성하는 데는 여전히 어려움이 있음

    • 구형 Gemini 2.5가 92%의 정확도로 적절한 차이를 생성함
    • 이 비율이 95-98%로 증가할 것으로 예상됨
  • Google 관계자에게 질문: Gemini-2.5-pro-exp(무료 버전)도 업데이트되었는지, 아니면 사라질 것인지 궁금함

    • 블로그 게시물에 따르면 이전 버전(03-25)이 최신 버전(05-06)을 가리키고 있으며, 개선된 모델을 사용하기 위해 추가 조치가 필요하지 않음
    • Gemini-2.5-pro-preview-03-25가 이제 05-06을 사용하는지, Gemini-2.5-pro-exp-03-25에도 동일하게 적용되는지 궁금함
  • 실험적 03-25와 실험적 05-06의 벤치마크를 비교할 때, 새로운 버전이 LiveCodeBench를 제외한 모든 항목에서 약간 낮은 점수를 받음

  • Gemini를 거의 모든 것에 사용하지만, 모델 카드가 o3-mini와만 비교됨

    • 알려진 벤치마크에서 o3가 여전히 앞서 있음
  • Gemini 2.5 pro는 훌륭하지만, UI가 여전히 사용하기 어려운 스크롤 문제를 가지고 있음

    • AI 출력이 완료된 후 몇 분 동안 대기하는 것이 좋음
    • 개발 도구에서 ms-code-block 요소를 찾아 $0.textContext를 기록하는 것도 신뢰할 수 있음
  • Gemini 2.5 pro는 훌륭하지만, 비용이 매우 비싸고 불투명한 비용 통찰력을 제공함

    • 최근 많은 사람들이 예상치 못한 청구서를 받았으며, 일부는 정상적인 사용으로 $500의 비용이 발생함
    • 나도 피해를 입어 도구에서 API 키를 제거함
  • 이 모델은 12개의 벤치마크 중 10개에서 03-25보다 성능이 떨어짐

    • 코딩에 대한 훈련을 계속하면서 모든 것이 악화되었고, 매몰 비용 때문에 이를 숨기려 했을 것임
  • 왜 "새로운 프리뷰" 대신 버전 번호를 사용할 수 없는지 궁금함

    • 예를 들어, Gemini Pro 2.5.1로 부르면 좋을 것임