Google I/O 2026에서 발표한 모든 것
(io.google)- 핵심 축은 Gemini 3.5 Flash, Gemini Omni Flash, Antigravity 2.0, Google AI Studio, Gemma 4, Android 17, Chrome/Web, Firebase, Google Play, AI 시대 개발자 역량
- Google은 모델 발표만이 아니라, 에이전트가 실제 제품, 브라우저, 클라우드, 모바일 앱, 데이터, 문서, 테스트 환경에 접근하는 개발 흐름을 전면에 둠
- 개발 도구는 코드를 대신 쓰는 수준을 넘어 계획, 실행, 검증, 디버깅, 배포, 평가, 여러 에이전트 조율까지 확장됨
- Android, Flutter, Chrome, Firebase, Google Play 모두 Gemini와 에이전트 도구를 기존 개발 흐름 안에 넣는 방식으로 확장됨
- 코드 작성보다 검증 비용, 문맥 제공, 도구 접근 권한, 런타임 관찰, 테스트 인프라, 조직의 문서화와 시스템 설계가 더 큰 병목으로 떠오름
세션 1 - Google keynote
- 매달 850만 명 이상이 Google 모델로 앱과 경험을 만들고 있음
- Google의 모델 API는 분당 약 190억 토큰을 처리함
- AI Search 사용량:
- AI Overviews는 월 25억 명 이상이 사용함
- AI Mode는 월 10억 명 이상이 사용함
- Gemini app의 월간 활성 사용자는 지난해 I/O의 4억 명에서 9억 명 이상으로 증가함
- Nano Banana 모델로 생성된 이미지는 500억 장 이상임
- Gemini 3.5 Flash는 제품과 API 전반에서 사용 가능하며, 빠른 실행과 비용 효율을 핵심 특징으로 둠
- Gemini Omni Flash는 Omni 계열의 첫 모델로, 멀티모달 입력과 출력을 더 넓게 다루는 방향을 가짐
- Antigravity 2.0은 전 세계에서 사용할 수 있는 독립형 데스크톱 앱이며, 에이전트 대화, 프로젝트, 작업 관리를 한 화면에서 다룸
- Antigravity 대규모 데모:
- 93개 하위 에이전트, 15,000회 이상 모델 요청, 26억 토큰으로 빈 프로젝트에서 작동하는 운영체제 핵심을 만듦
- Gemini 3.5 Flash의 성능과 비용 효율을 이용해 1,000달러 미만 API 크레딧으로 실행함
세션 2 - Developer keynote
- Google은 개발자를 위해 모델, 에이전트 도구, 사용자 플랫폼, 인프라를 함께 묶는 흐름을 제시함
- Managed agents가 Gemini API에 들어가며, Antigravity와 같은 에이전트 하네스를 API 형태로 사용할 수 있음
- Google Antigravity 2.0은 에이전트 중심 데스크톱 앱으로, 개발 작업을 여러 에이전트가 맡아 처리하는 구조를 가짐
- Antigravity SDK로 에이전트 흐름을 직접 맞춤화하고 배포할 수 있음
- Google AI Studio에서는 새 사용자가 신용카드 없이 Cloud Run으로 바로 배포할 수 있음
- Google Workspace 연동으로 AI Studio가 Workspace 데이터를 앱 생성 흐름 안에서 사용할 수 있게 됨
- Google AI Studio에서 아이디어를 바로 Android 앱으로 만드는 흐름이 가능해짐
- Gemma 4:
- Apache 2 라이선스로 제공됨
- 첫 달 1억 다운로드를 달성함
- Gemma 전체 다운로드는 5억 건 이상으로 증가함
- Chrome DevTools for Agents는 Antigravity와 20개 이상의 코딩 에이전트에서 사용할 수 있음
- Gemma 4를 LoRA로 미세 조정해 CI 파이프라인에서 바로 쓸 bash 명령 응답을 만들고, 로컬 노트북에 배포함
세션 3 - Agent-first workflows from prompt to production
- AI Studio에서 만든 앱을 Cloud Run과 Firebase로 배포한 뒤, 운영 단계의 디버깅과 분석까지 에이전트 흐름으로 연결함
- 50개 이상 관리형 MCP 서버를 통해 에이전트가 Google Cloud 도구와 데이터에 접근함
- Developer Knowledge MCP는 Google 문서 기반 최신 정보를 에이전트 도구에 넣어 오래된 문서 문제를 줄임
- 최신 문서 스냅샷은 대략 8-12시간 단위로 에이전트 도구에 들어감
- Data Agent Kit과 BigQuery MCP를 사용해 Firestore, BigQuery, 로그 데이터를 분석하고 대시보드를 만듦
- Antigravity는 앱 오류를 조사하고, 관련 파일을 찾아 수정하고, GitHub 커밋까지 이어갈 수 있음
- Cloud Run에 배포된 remediation agent와 CI agent가 Eventarc, Pub/Sub, Gemini와 연결되어 오류를 조사하고 수정함
- 여러 에이전트가 A2A(agent-to-agent) 방식으로 서로 작업을 주고받음
- 에이전트 개발은 시제품 생성에서 끝나지 않고 배포, 모니터링, 데이터 분석, 자동 복구까지 확장됨
세션 4 - What’s new in Android
- Android 17은 앱의 과도한 메모리 사용이 사용자 경험을 망치지 않도록 메모리 제한과 관련 도구를 추가함
- Android 17은 excessive memory, cold start, excessive CPU 같은 조건을 자동 분석 대상으로 삼음
- Android 17 대상 앱은 로컬 네트워크 장치를 찾고 연결하려면 ACCESS_LOCAL_NETWORK 권한이 필요함
- Google은 Android UI를 Jetpack Compose로 만드는 방향을 강화함
- Compose 1.10과 Compose 1.11에는 성능, hybrid UI, 새 API 개선이 포함됨
- AppFunctions와 Gemini 연동은 비공개 프리뷰 단계이며, 앱이 Gemini의 오케스트레이션 대상이 될 수 있음
- ML Kit Prompt API 개발자 프리뷰로 일부 새 기능을 테스트할 수 있음
- Android 17은 Eclipsa Video, HE-AAC 음성 품질 개선, CameraX와 Media3 기반 카메라·미디어 개선을 제공함
- 대화면 앱은 Navigation 3와 Compose Adaptive 라이브러리를 써서 기존 모바일 제약을 덜 따르는 방향으로 이동함
- Wear OS용 Compose 1.6은 Navigation 3와 절전 상태 콘텐츠 관리를 돕는 mode manager를 지원함
세션 5 - What’s new in Chrome
- Chrome은 웹사이트가 에이전트와 에이전트형 도구를 쓰는 사용자에게 잘 작동하도록 만드는 데 초점을 둠
- 모델의 기본 지식에만 의존하지 않고, 최신 Baseline과 웹 기능을 개발 도구에 연결하려 함
- 지난해 이후 55개 기능이 Baseline Widely Available 상태가 됨
- 발표 시점 기준 52개 기능이 Baseline Newly Available 상태임
- Chrome은 4주마다 업데이트되므로, 코딩 에이전트가 최신 웹 기능을 모르면 낡은 구현을 만들기 쉬움
- Chrome의 Prompt API는 Chrome 148에서 제공됨
- Navigation API, View Transitions, HTML-in-Canvas, declarative partial updates가 개발 흐름 안에 들어감
- Chrome 확장 개발자는 설치, 서비스 워커, side panel, popup을 자동으로 검사하고 디버그할 수 있게 됨
- Chrome은 웹 성능, identity, security 등 고수준 skill과 100개 이상의 공통 사용 사례 가이드를 에이전트에 제공하는 방향으로 확장됨
- 최신 웹 기능과 브라우저 지원 정보를 에이전트에게 넣어야, 오래된 호환성 패턴 반복을 줄일 수 있음
세션 6 - What’s new in Google AI
- Gemini 모델 계열은 텍스트, 이미지, 오디오, 비디오, 코드 입력과 여러 출력 형태를 다루는 멀티모달 모델 계열임
- Gemini 3.5 Pro와 Flash 역할:
- Gemini 3.5 Pro는 복잡한 문제 풀이에 초점을 둠
- Gemini 3.5 Flash는 성능, 속도, 비용 균형을 맡음
- AI Studio의 Build 기능은 3.5 Flash를 기본 모델로 사용함
- Nano Banana 2는 AI Studio에서 직접 써볼 수 있음
- Gemini Omni Flash는 입력에서 비디오를 포함한 출력을 만들 수 있는 모델임
- Gemini Live와 Live API는 음성 기반 상호작용을 지원함
- Interactions API는 AI Studio 안에서 에이전트와 상호작용하기 위한 기능임
- Gemma 4 접근성:
- AI Studio playground에서 시험할 수 있음
- Gemini API에서 일부 무료 호출도 가능함
- 256,000 토큰 문맥 창을 갖고 Hugging Face에서 찾을 수 있음
- Gemini Robotics 1.6, Genie 3, Antigravity 2.0, 오픈 모델과 독점 모델을 섞어 비용을 줄이는 전략도 함께 나옴
세션 7 - Build next-gen AI experiences with Google AI Studio and Google Antigravity
- Google AI Studio는 모델 playground를 넘어, 아이디어를 앱으로 만들고 배포하는 공간으로 넓어짐
- 모델, 에이전트, 앱 생성, Workspace 연동, Cloud Run 배포가 한 흐름 안에 들어감
- AI Studio의 앱 섹션은 곧 제공될 예정이며, 앱 생성과 배포를 더 직접적으로 다룸
- AI Studio에서 만든 코드를 Antigravity로 한 번에 내보내는 기능이 추가됨
- Antigravity 2.0은 코드 작성뿐 아니라 여러 작업을 에이전트로 조율하는 mission control 역할을 맡음
- Antigravity 2.0은 task list, implementation plan, 변경 파일 검토를 핵심 흐름으로 둠
- 코드 리뷰와 변경 검토를 Antigravity 2.0 안에서 직접 처리할 수 있음
- 브라우저 테스트, 계획, 다중 파일 기능 작성, end-to-end 검증 같은 무거운 작업을 에이전트에게 맡기는 구조임
- Google AI Studio로 약 20분 안에 새 비즈니스 앱을 만들고, Antigravity로 더 발전시킴
- Google AI Studio는 “prompt to app”의 빠른 출발점이고, Antigravity는 앱을 실제 개발 작업으로 키우는 도구임
세션 8 - Unlock modern web capabilities in your AI coding workflows
- 코딩 에이전트가 최신 웹 기능을 모르면 오래된 브라우저 호환성 기준으로 코드를 만들기 쉬움
- Chrome은 지난 1년 동안 50개 새 기능을 출시했지만, 모델 지식 컷오프 때문에 많은 기능이 모델에게 닿지 않음
- Interest Invokers API 예시에서는 에이전트가 예전 속성명인
interesttarget을 쓰는 문제가 나타남 - Modern Web Guidance는 에이전트가 최신 웹 기능과 권장 구현을 찾도록 돕는 지식 패키지임
- 에이전트가 답변하기 전에 로컬 패키지 안에서 의미 기반 검색을 수행함
- 가이드 규모와 구조:
- 현재 100개 이상의 가이드가 있음
- 기능별 skill을 모두 상위 도구로 노출하지 않고 필요할 때 찾아 쓰는 구조임
- 가이드는 이상적인 최신 구현과 fallback 권장안을 함께 제공함
- 브라우저 지원 요구사항이 없으면 에이전트는 Baseline Widely Available을 기본 가정으로 삼음
AGENTS.md에 “Chrome 144 이상만 지원” 같은 조건을 적으면, 에이전트가 불필요한 fallback을 피할 수 있음- Chrome 팀은 Gemini 3.1, Claude Opus 4.7, GPT 5.5 같은 모델을 대상으로 매일 평가를 돌림
세션 9 - What’s new in Firebase
- Firebase는 사람과 에이전트가 모두 앱을 만들고 확장할 수 있는 agent-native platform으로 이동함
- Firebase Data Connect는 SQL 기반 앱 개발을 지원하는 Firebase SQL Connect로 진화함
- Firebase SQL Connect의 custom resolver로 Cloud Functions와 BigQuery 같은 Google Cloud 서비스를 연결할 수 있음
- Firestore는 geo search, native full text search, semantic match를 지원함
- Firebase AI Logic은 최신 모델을 지원하고, Maps grounding으로 위치 인식 AI 기능을 만들 수 있음
- Nano Banana 이미지 생성 제어 기능도 Firebase AI Logic에서 사용할 수 있음
- Firebase AI Logic은 iOS, Chrome, Android에서 로컬·하이브리드 추론을 지원하고, 로컬 모델이 없을 때 cloud-hosted model로 fallback함
- Dart support for Cloud Functions in Firebase가 experimental preview로 제공됨
- AI Studio는 Google Workspace와 연결되어 Sheets, Docs, Gmail, Calendar 데이터를 앱에서 쓸 수 있음
- Firebase agent skills는 Android, iOS, web, Flutter에서 사용할 수 있고, Crashlytics 지원도 확장됨
세션 10 - What’s new in Google Play
- Play Billing은 65개 이상 시장에서 300개 이상 로컬 결제 수단을 지원함
- Google Play에는 8억 9천만 명 이상의 구매 준비 사용자가 있음
- Google Play Billing과 대체 결제를 함께 제공할 수 있는 선택지가 확대되고, 낮은 서비스 수수료도 예고됨
- 앱 발견은 Gemini app, Android, 웹으로 확장되어 사용자가 Gemini 안에서 앱과 게임을 찾을 수 있음
- Gemini는 정적인 링크 목록 대신 앱의 실제 기능과 store listing 정보를 활용해 앱을 제안함
- 일부 주제에서는 Gemini와 Play 사용자가 45만 개 이상의 영화와 TV 콘텐츠를 탐색할 수 있음
- Play Console에서는 Eclipsa Video나 Google Sheets 같은 구조화 파일을 올리면 Gemini가 listing을 미리 채움
- Gemini가 bulk price changes, import skills, metadata configuration 같은 Play Console 작업을 도울 예정임
- in-app subscription management API로 앱 안에서 사용자가 구독 플랜을 쉽게 바꿀 수 있음
- 지난해 Google Play Billing은 34억 달러의 시도된 사기와 1억 3천만 달러의 abusive refunds를 막음
세션 11 - Defining the agentic AI era
- Gemini, Search, Gemini app, Google DeepMind가 같은 방향에서 에이전트형 AI를 다룸
- Gemini 3.5 Flash는 Search 안에서도 사용할 수 있음
- Search는 빠른 답변과 더 긴 agentic task 사이의 균형을 찾아야 함
- Gemini Spark는 사용자가 맡겨둔 일을 뒤에서 처리하는 always-on agent 역할을 맡음
- 모델은 단순 채팅 답변을 넘어 Google 제품 전체와 외부 생태계 위에서 작동해야 함
- Python에서 Go로 번역한 내부 도구:
- 테스트가 있는 기존 프로그램을 다른 언어로 번역하는 작업은 모델에게 더 명확한 문제임
- 일부 내부 도구는 하룻밤 만에 10-20배 빨라짐
- 새로운 agentic world에 맞게 Google 내부 소프트웨어 인프라도 더 빠르게 바뀔 수 있음
- 하드웨어, 모델 규모, 제품 적용, 피드백 루프가 함께 맞물려야 Gemini가 Google 제품 전체에 들어갈 수 있음
- 질문의 초점은 “모델이 무엇을 할 수 있나”에서 “모델을 제품과 업무 흐름에 어떻게 배치하나”로 옮겨감
세션 12 - What’s new in Android development tools
- Android 개발 도구는 사람 개발자뿐 아니라 코드베이스에 배치되는 AI agent까지 고려해 설계됨
- Android Studio Otter는 Gemini Enterprise와 Google One 계정을 지원함
- Android Studio는 로컬 모델과 원격 모델을 가져와 쓸 수 있음
- Android Bench는 Android 개발 작업에 어떤 모델을 쓸지 판단하는 기준 역할을 함
- Compose Preview에서 바로 UI 변환을 요청해 에이전트가 더 나은 문맥으로 작업하게 할 수 있음
- prompt만으로 adaptive Android app을 만드는 agent-based new project wizard를 사용할 수 있음
- Android Studio에는 adaptive API 통합, XML에서 Compose 변환 같은 작업을 돕는 약 10개 skill이 포함됨
- 새 Android CLI는 LLM 워크플로를 지원하며, 새 프로젝트 생성에서 다른 Gradle LLM 도구보다 토큰 사용을 70% 이상 줄임
- Antigravity CLI, Android CLI, Android skill을 묶어 Antigravity에서도 Android 앱 개발을 시작할 수 있음
- Android Studio Quail과 Android 17 기기에서는 네트워크를 바꾸거나 노트북을 재시작해도 기기 연결이 유지됨
세션 13 - What’s new in Flutter
- Flutter 3.44와 Dart 3.12가 함께 나옴
- Flutter 프로젝트에는 올해 1,700명 이상의 contributor가 참여함
- 매달 150만 명 이상의 개발자가 Flutter로 빌드함
- Flutter 3.44에서는 Android API 34 이상 Vulkan 지원 기기에서 새 rendering mode를 시도할 수 있음
- Toyota 2026 RAV4의 infotainment system에 Flutter가 사용됨
- Dart 기반 Cloud Functions for Firebase는 AOT 컴파일 덕분에 cold start가 10ms까지 낮게 나오는 사례가 있음
- Firebase AI Logic에는 서버 prompt template이 추가되어, 앱 안에 prompt를 직접 넣지 않아도 됨
- Firebase Agent Skills for Flutter가 full-stack Flutter와 Firebase 앱 구축 지침을 에이전트에 제공함
- LiteRT-LM 지원이
flutter_gemma패키지에 곧 들어올 예정임 - Flutter desktop에는 Canonical이 lead maintainer이자 strategic steward로 참여함
세션 14 - What’s new in the Gemma open model family
- Gemma 4는 Gemma 계열의 가장 강력한 공개 모델로 자리 잡음
- 2B부터 31B까지 여러 크기로 제공되어, 모바일, 노트북, 클라우드에서 쓸 수 있음
- Gemma는 2024년에 1B부터 27B까지 이어지는 모델 계열로 시작함
- Gemma 4는 open weight 모델이며, 오픈소스 생태계와 호환됨
- MTP와 speculative decoding을 통해 decode speed를 최대 3배 높일 수 있음
- Android 생태계에는 Gemma 4 day-zero implementation이 준비됨
- Android API를 통해 휴대폰에서 작은 Gemma 모델을 직접 실행하거나, Gemini API 접근이 어려운 환경에서 로컬 Gemma 모델로 Android 앱을 코딩할 수 있음
- Cloud Run 위의 ADK(agent development kit)와 Gemma 31B를 사용해 데이터베이스를 이해하고 답을 찾는 에이전트를 만듦
- Gemma 4는 Transformers.js, Ollama, LM Studio의 OpenAI 호환 인터페이스를 통해 브라우저나 로컬 환경에서 실행할 수 있음
- 기업용 클라우드, 로컬 머신, 브라우저, 모바일이 모두 Gemma 실행 환경이 됨
세션 15 - What’s new in Web UI
- 2026년 Web UI 업데이트는 주요 기능을 Baseline 상태와 함께 다룸
- 모든 기능에 Baseline Widely Available, Newly Available, Limited Available 같은 호환성 표시가 붙음
- contrast-color API로 CSS에서 대비가 맞는 색을 더 쉽게 선택할 수 있음
- Chrome 146의
meta name="text-scale"기능은 시스템 글자 크기 설정에 대응함 - Android와 iOS 사용자 모두에서 30% 이상이 기본 글자 크기를 바꿈
- Chrome 134부터 dialog element가 popover의 declarative light dismiss 같은 기능을 받아들임
- two-phase View Transitions는 Chrome Canary에서 시험할 수 있음
- scroll-driven animations는 2023년에 Chrome에 들어왔고, Interop 2026을 통해 상호운용성을 높임
- HTML-in-Canvas API는 Canvas 안에 실제 DOM 콘텐츠를 넣을 수 있게 함
- Chrome 149에서는 gap decorations와 shape outside의 새 사용 방식이 추가됨
세션 16 - Adaptive development for the expanding Android ecosystem
- Android는 더 이상 휴대폰만의 생태계가 아니며, 5억 8천만 개 이상의 대화면 활성 기기가 adaptive app 투자 효과를 받음
- foldable 사용자는 adaptive app에서 더 높은 가치의 사용자군으로 분류됨
- Android 17에서는 target SDK 37 대상에서 orientation과 resizability opt-out이 제거되는 방향으로 바뀜
- Android Studio Quail Canary의 Desktop emulator가 데스크톱 형태의 Android 앱 테스트를 지원함
- Android 17의 Continue On API로 사용자가 한 기기에서 하던 일을 두 번째 기기에서 이어갈 수 있음
- Google은 Android 앱을 Compose-first로 만드는 흐름을 강화함
- Compose 1.11은 trackpad 지원을 mouse와 pointer 수준으로 개선하고, non-touch input testing API를 추가함
- Compose에는 state-based styling을 위한 experimental API가 추가됨
- Connected Displays는 Android Feature Drop을 통해 공개 제공됨
- Compose, Navigation 3, Compose Adaptive 라이브러리가 foldable, desktop, car, TV, XR 같은 여러 화면에 대응함
세션 17 - Building the quantum-AI future with Hartmut Neven and James Manyika
- 양자 컴퓨팅과 AI가 서로를 가속하는 흐름이 핵심 주제임
- Hartmut Neven은 2012년 Google의 Quantum AI 팀을 시작함
- superposition과 qubit이 양자 컴퓨팅의 기반이 됨
- 105 qubit 칩에서 가능한 bit string 수는 2의 105제곱임
- 양자 컴퓨터가 유용하게 풀 수 있는 알고리듬과 문제는 현재 커뮤니티에서 70개 이상 식별됨
- 앞으로 그 수가 10배 이상 늘어날 수 있음
- quantum error correction은 superposition 상태를 유지하는 데 필요한 핵심 기술임
- Google은 2022년에 quantum error correction으로 실제 기계의 오류를 줄이는 데 성공함
- Quantum Echoes는 NMR이나 MRI에서 나오는 데이터를 학습하는 방식과 연결됨
- Google은 post-quantum cryptography 전환을 2029년까지 더 강한 방식으로 진행해야 한다는 관점을 내놓음
세션 18 - Scale AI with Google’s TPU software stack
- TPU 위에서 모델을 학습, 미세 조정, 추론하는 오픈소스 소프트웨어 스택을 다룸
- 모델 개발 흐름은 pre-training, post-training, serving/inference로 나뉨
- Kaggle과 Colab의 무료 TPU로 post-training과 inference를 해볼 수 있음
- vLLM on TPU 데모는 Gemma 4 31B 모델을 TPU에서 실행하고, 음식 이미지를 보고 영양 정보를 요약함
- Gemma 4는 이미지를 받아 내용을 파악하고 요약하는 작업에 적합한 멀티모달 모델임
- vLLM TPU inference에 MTP를 넣어 여러 작업에서 약 3배 속도 향상을 얻음
- Tunix는 post-training용 경량 프레임워크임
- 큰 모델 대신 4B 모델을 미세 조정해 같은 작업을 수행하게 만들고, 단일 Trillium 칩에서 실행함
- MaxText, Tunix, vLLM, JAX, PyTorch, TPU가 모델 생애주기별 도구로 배치됨
세션 19 - Supercharge your AI coding workflow with Chrome DevTools for agents
- Chrome DevTools for agents는 코딩 에이전트가 DevTools를 통해 브라우저 런타임을 직접 관찰하게 하는 도구임
- 사람 개발자가 DevTools로 학습하고 디버깅하듯, 코딩 에이전트도 같은 폐쇄형 피드백 루프를 가져야 함
- 에이전트는 실제 Chrome 인스턴스를 열고, 페이지를 탐색하고, 폼을 채우고, console log와 network request를 수집할 수 있음
- source map 접근을 통해 런타임 문제에서 관련 소스 파일로 이동할 수 있음
- 도구는 NPM package로 제공되며, MCP server와 CLI가 함께 들어 있음
- 제공 skill 6개:
- troubleshooting, Chrome DevTools, Chrome DevTools CLI skill은 일반 사용법과 개념을 도움
- accessibility debugging, memory leak debugging, optimized LCP skill은 전문 영역 지식을 에이전트에 넣음
- 구현 기반은 Puppeteer이며, 에이전트는 Puppeteer를 직접 쓰기보다 도구 래퍼를 사용함
- 기본적으로 별도 익명 브라우저 프로필을 사용하고, Chrome password manager에는 접근하지 않음
- CyberAgent는 DevTools for agents로 32개 컴포넌트의 236개 Storybook story를 1시간 안에 감사함
세션 20 - A new era of discovery: AI and the frontiers of science with Demis Hassabis
- Demis Hassabis는 DeepMind의 원래 목표를 “solve intelligence”로 잡음
- AI가 과학 발견, 제품, 연구 도구를 바꾸는 흐름이 핵심 주제임
- AlphaFold는 단백질 구조라는 50년 난제를 푼 사례로 다시 쓰임
- Gemini for Science는 기조연설에서 발표된 과학용 모델 흐름과 연결됨
- Demis Hassabis는 현재를 “singularity의 foothills”에 선 시기로 표현하고, intelligence가 해결되는 시점을 2030년 전후 1년 정도로 봄
- Genie 계열 모델은 Waymo가 현실에서 보기 어려운 1 in a billion 상황을 테스트하는 데 쓰임
- Isomorphic Labs의 drug discovery 진전은 AI가 과학을 가속하는 사례로 쓰임
- Gemini app은 월 9억 명 사용자를 갖고, AI Mode in Search도 중요한 제품 표면이 됨
- AI는 제품 기능을 넘어 과학과 연구 문제 해결 도구로 쓰임
세션 21 - A fireside chat on the evolution of the developer craft
- AI 시대 개발자 일은 코드 작성에서 시스템 설계, 문서화, 오케스트레이션으로 이동함
- 새 도구와 모델이 계속 나오지만 모든 트렌드를 즉시 따라갈 필요는 없고, 의도적으로 학습할 도구를 골라야 함
- 에이전트를 팀에 들이는 일은 주니어 엔지니어를 여럿 들이는 것과 비슷해서, 내부 문서와 설계 결정 기록이 더 중요해짐
- 좋은 agentic workflow를 만들려면 한 에이전트의 책임, 여러 에이전트의 대화 방식, 사람의 감독 위치를 정해야 함
- 여러 코딩 도구의 UX가 비슷해지고 있어, 한 도구에서 익힌 패턴이 다른 도구에도 옮겨갈 수 있음
- 에이전트와 일할 때는 경로 통제 일부를 내려놓고, 결과와 설계 의도를 조율해야 함
- technical debt, cognitive debt, intent debt는 AI로 더 빨리 좋아지거나 더 빨리 나빠질 수 있음
- 20개 에이전트를 동시에 돌리는 것은 사람의 인지 용량을 넘을 수 있으므로, 의도적으로 관리해야 함
- 좋은 prompt 습관은 검색어 조각이 아니라 완전한 목표와 맥락을 담는 방식으로 바뀜
- “모든 코드를 직접 쓰는가”보다 “에이전트가 일할 수 있는 문맥과 검증 체계를 갖췄는가”가 더 중요해짐
세션 22 - Build core skills to thrive as an AI-era developer
- AI 시대에도 기본 소프트웨어 엔지니어링 역량은 더 중요해짐
- AI는 force multiplier가 될 수 있지만, 출력물을 평가하고 통합하고 유지하려면 깊은 전문성이 필요함
- 에이전트가 자율적으로 일할수록 intent를 더 일찍 명확히 하는 shift-left가 필요함
- System Design은 환경, 사람, 에이전트, 도구, 문화까지 포함하는 개념으로 넓어짐
- 팀은 에이전트를 out-of-box로 쓰기보다 agent role, profile, recipe, rule, skill을 직접 만들고 유지해야 함
- Specs, agent rules, skills는 시스템의 what과 why를 에이전트에 전달하는 source of truth가 됨
- realistic eval을 만들려면 AI, 소프트웨어 엔지니어링, 사용자, 비즈니스 역량이 함께 필요함
- agent trace를 분석해 도구 사용성, agent skill, 시스템 설계를 개선하는 피드백 루프를 만들어야 함
- 사람 엔지니어는 개별 에이전트의 conductor에서 여러 비동기 에이전트 팀의 orchestrator로 이동함
- 악의적 행위자의 관점에서 시스템을 보려면 red team agent를 명시적으로 둘 수 있음
세션 23 - Software engineering at the tipping point
- AI가 코드 작성 속도를 높이면 개발 생태계 전체가 software ecology 차원의 압력을 받음
- Google은 Android와 Chrome을 포함한 모든 코드가 공유 monorepo에 있고, trunk에 커밋되는 구조임
- Google은 오래전부터 한 개발자가 수백만 줄의 코드를 변경할 수 있는 내부 도구를 써왔음
- 지금의 개발 생태계가 10배 속도를 감당하지 못할 가능성이 큼
- 에이전트가 더 많은 컴파일, 테스트, 커밋, 토큰 사용을 만들면 인프라 비용과 병목이 커짐
- 에이전트는 작성하기 쉬운 코드를 만들 수 있지만, 사람에게 유지보수하기 쉬운 코드를 만들지는 않을 수 있음
- 재사용과 격리를 강제하는 component reuse와 component isolation agentic skill이 필요함
- API와 데이터 접근은 에이전트에게 사실상 공개된 것처럼 단단히 보호해야 함
- “agents will find things you probably didn't want them to”라는 문장이 권한 설계의 위험을 드러냄
- 2030년의 개발 생태계에서 지금 방식은 2001년 CD-ROM 시절처럼 낡아 보일 수 있음
세션 24 - Vibe once, run anywhere with Google Antigravity and Flutter
- Antigravity와 Flutter를 함께 쓰면 한 번 만든 아이디어를 여러 플랫폼으로 확장할 수 있음
- Gemini 3 출시 시점부터 모델 능력이 크게 올라갔고, Antigravity는 그 능력을 초기부터 지원함
- Antigravity는 계획, 실행, 검증이 촘촘히 이어지는 feedback loop를 핵심으로 함
- Antigravity는 task list와 implementation plan을 만들고, 실행 중 screenshot과 video를 남기며, 완료 뒤 구현과 이유를 담은 보고서를 작성함
- 검증 단계에서는 앱 실행, screenshot 촬영, Chrome 버튼 클릭, 테스트 실행이 이어짐
- Flutter에서는 Dart의 강한 타입과 analysis server가 함수 시그니처, 클래스 형태 같은 객관적 오류 신호를 LLM에 제공함
- Flutter는 같은 픽셀과 기능을 여러 화면에 제공하는 cross-platform UI toolkit임
- Flutter의 stateful hot reload는 실행 중 앱을 1초 미만에 다시 빌드하는 개발 경험을 제공함
- 에이전트가 코드를 많이 만들수록, 사람은 설계 목표와 제품 방향을 잡고 에이전트 출력물을 검토해야 함
- Antigravity가 에이전트 실행 루프를 제공하고, Flutter가 여러 플랫폼에 일관된 결과를 제공해 “vibe once, run anywhere” 흐름을 만듦
댓글과 토론
Hacker News 의견들
-
기조연설이 개인적으로는 가장 지루했음
화장실 가려고 멈춰놓고는 보고 있었다는 사실도 잊어버렸고, Google이 사용자에게 I/O와 기조연설이 어떤 의미인지 놓치고 있는 듯함
차라리 지난주 Android 행사처럼 Gemini 전용 행사를 따로 하는 편이 나았고, 모든 제품에 AI를 밀어 넣는 데 집중하느라 제품군의 경계도 흐려지고 있음
Google Home은 엉망이고 기본 기능도 계속 실패하는데, Google Home VP의 발표는 매번 Gemini 이야기뿐임. 기기가 오프라인으로 빠지는 빈도를 줄이는 데도 몇 년이 걸렸음
세션들도 “X의 새 기능”과 “AI 이것저것”을 섞어놓은 수준이라 밋밋해 보임- 이건 Google의 구조적 문제에서 나온 결과임: 출시는 보상받지만 유지보수는 보상받지 않고, 새로 뜨는 팀은 검증된 팀보다 훨씬 많은 자원을 받음
세 단어로 줄이면 “새것이 더 낫다”임
그래서 Google Home이 나빠지는 것임. 충분히 잘 작동하던 상태를 유지한다고 승진하는 사람은 없고, 그 플랫폼에 뭔가 새 기능을 출시한 뒤 골라낸 통계로 “영향”을 증명해야 승진함
기조연설이 온통 AI였던 이유도 같음. AI가 지금 자원이 쏟아지는 뜨거운 난장판이고, 모든 제품에 AI를 넣으면 수많은 사람이 새 기능을 출시하고 “영향”을 보여줄 기회를 얻음
I/O가 개발자 행사이긴 하지만 Wall St.가 안 보고 있다고 생각하면 순진함. I/O 시작 전 당일 주가는 10달러 빠졌지만 기조연설 중 5달러 올랐고, 유지되진 않았어도 기조연설이 주가에 영향을 준 건 분명함. Sundar도 이걸 알고 있음 - 100억~300억 달러에서 1600억 달러 투자로 늘리고, 그 돈이 전부 연산과 연구에 들어간다고 했음
사회 전체가 전 세계적으로 추가하는 연산량을 직접 겪는 것만으로도 엄청난 시대임
Gemini 품질은 또 좋아졌고 장시간 실행되는 에이전트도 나왔음. “컴퓨터로 뭔가 하는” 많은 사람에게 타격이 갈 것임
이게 실제 운영 환경에 들어오면 동료 1~2명을 해고하고 그 급여를 토큰으로 받는 편을 선호할지도 모르겠음. 누군가 나에 대해서도 같은 생각을 하는 건 시간문제임
이 모든 게 전혀 밋밋하지 않은데, 어떻게 이렇게 극단적으로 반대되는 관점이 나오는지 모르겠음
- 이건 Google의 구조적 문제에서 나온 결과임: 출시는 보상받지만 유지보수는 보상받지 않고, 새로 뜨는 팀은 검증된 팀보다 훨씬 많은 자원을 받음
-
안무처럼 짜인 밋밋한 발표와 화면 밖 프롬프트를 읽는 듯한 모습들을 보니, 예전 Steve Jobs 발표가 훨씬 더 대단하게 느껴짐
실제로 그러는지는 확실치 않지만 그렇게 보이고, Steve는 제품 발표를 정말 잘했음. 최소한 사람들이 그를 따라 하려고라도 했으면 좋겠음- 그가 실제로 그 제품들을 사용했고 믿고 있었다는 점이 도움이 됐음
- Steve Wozniak을 따라 하는 사람이 나오면 더 즐거울 것 같음
- 실제로 시도한 사람들은 많음. 몇 년 전 Surface Laptop을 발표하던 Sinofsky나 수많은 창업자들이 그랬음
Steve는 기조연설과 기술 시연에 절대적으로 타고난 사람이었고, 어떤 사람들은 그냥 그런 재능을 갖고 태어나는 것 같음 - 이번 발표에서 “Gemini가 나를 위해 할 일 목록을 만들어줬다”는 게 놀랍다고 계속 말하던 순간이 진짜 있었음
- 이건 AI 극대화가 모든 곳으로 번지는 모습임. “멋진 컨퍼런스 발표를 만들어줘”라고 하면 대략 이런 게 나옴
대규모 AI식 저질화라서 보고 있기 씁쓸함
-
로컬 Gemma 모델과 Flutter에는 뭐가 준비돼 있는지 궁금함
Gemma 4 2B를 내려받거나 Android의 내장 AICore, Apple의 Foundation Models를 쓰는 완전 로컬 앱을 만들고 있음
요즘 로컬 모델은 웹 검색과 도구 호출까지 포함해 꽤 좋아져서, 많은 사용 사례에서는 클라우드 모델이 필요 없을 정도임- 내일 Gemma 기조연설이 있는 걸로 알고 있음
- Gemma 4가 최근에 나왔으니 딱히 뭔가를 기대하진 않음
-
데스크톱 Firefox에서 Join the livestream 버튼이 작동하지 않았고, Chrome에서는 문제없었음
- Chrome에서도 안 돼서 YouTube에서 스트림을 찾아야 했음: https://www.youtube.com/watch?v=wYSncx9zLIU
- Firefox에서도 같은 문제가 있었음
- uBlock을 꺼야 했음. Firefox에는 설치돼 있고 Chrome에는 없는 상태일 수도 있음
-
3.5 Pro보다 3.5 Flash가 먼저 출시되는 게 흥미로움
역사적으로 Gemini에서는 Flash가 Pro에서 증류된 모델이라 반대 순서였던 것 같은데, 벤치마크에서 앞설 때까지 조금 더 훈련시키는 걸까?- 3.5 Flash는 Pro보다 실행 비용도 더 낮을 가능성이 큼. 다른 곳들처럼 이 회사도 연산 자원이 부족한 상태일지도 모름
- 발표에서 나온 주장들이 사실이라면, 몇 달 전 써본 3.5-flash-preview보다 상당히 좋아졌어야 함
당시에는 200줄짜리 Python 스크립트도 큰 실수 없이 수정하지 못했고, 함수 호출 인자 순서를 망가뜨리는 식의 오류를 냈음 - Flash가 자신이 증류된 Pro를 이긴다는 건 놀랍다기보다 수상함. 증류는 보통 뭔가를 잃게 만듦
더 작은 모델이 에이전트 평가에서 이긴다면, 그 평가는 애초에 에이전트 품질을 측정하지 않았다고 보는 쪽이 더 그럴듯함
모델 선택보다 빌더에게는 그게 더 큰 문제임
-
예전처럼 우리가 기기를 완전히 소유하고 통제하던 좋은 시절이 기억남. 그걸 다시 원함
- 그게 언제였음? 전화기가 유선이던 시절?
- 젊은 편은 아니지만, 우리가 기기를 통제했다는 그 타락 이전의 시대가 왜 매력적인지 잘 모르겠음
기술 쪽은 분명히 지금이 훨씬 나음. 요즘 Linux는 훌륭하고, 셀프 호스팅도 저렴하고 시작하기 쉬움
자기 기기를 통제한다는 측면에서 지금이 정확히 어떻게 더 나빠졌다는 건지 모르겠음
-
분위기가 완전히 어긋나 있음. 예전 I/O가 Android 중심이고 모두가 낙관으로 가득했던 시절이 그리움
- I/O의 Wikipedia 문서만 봐도 얼마나 슬퍼졌는지 잘 드러남: https://en.wikipedia.org/wiki/Google_I/O
“Apple WWDC와 출시 행사에 대한 Google식 답”에서 “모든 곳에 동시에 AI”로 바뀌었음
2008년부터 2020년 사이 Google이 내놓은 멋진 것들을 보면 정말 아쉬움
분명히 Google만의 문제는 아님. 대형 컨퍼런스 전반이 이렇게 변하고 있음. AI뿐임. CES는 아닐 수도 있지만 그래도 그렇음 - 공정하게 말하면 이건 Google 잘못만은 아닌 것 같음. 2009년쯤에는 모바일에서 가능성이 캄브리아기 대폭발처럼 터지던 시기였고, 요즘 기술은 그냥 충분히 괜찮은 상태임
- 예전에는 흥미로웠지만 지금은 그냥 AI 헛소리뿐이고, Android도 사실상 거의 바뀌지 않음
- I/O의 Wikipedia 문서만 봐도 얼마나 슬퍼졌는지 잘 드러남: https://en.wikipedia.org/wiki/Google_I/O
-
2009년에 Google Wave를 출시한 뒤로 Google I/O가 가장 좋아하는 기술 행사였고, 그때 완전히 빠져들었음
- Google Wave는 시대를 앞서갔음. 의미 있는 Slack 경쟁자가 될 수도 있었음
- 그 출시가 기억남. 연결 문제가 나는 동안 무대에서 안타깝게 애쓰던 Lars도 떠오름
몇 년 뒤 Google Glass 스카이다이빙도 있었고, 재미있는 시절이었음
-
시연 내용이 “이웃을 알아가는 대신 AI 에이전트가 동네 블록 파티를 계획하게 하라”였음
- Gemini의 AI Mode에 “Google I/O에서 일반 대중에게 잘 받아들여질 에이전트 워크플로 시연은 뭐가 좋을까”라고 넣어도, 지금 보여주는 것보다 더 나은 사용 사례가 나올 것임
- 결국 항공편이나 식당 예약 같은 게 되어야 함. 매년 이런 걸 시연하지만 제대로 작동한 적이 없음
-
Spark는 클라우드 호스팅 openclaw라는 뜻인가?
- 거의 그런 셈임