2P by GN⁺ 8시간전 | ★ favorite | 댓글 1개
  • Google의 비동기 AI 코딩 에이전트인 Jules가 베타를 종료하고 정식 출시됨
  • Gemini 2.5 Pro가 적용되어 더욱 고도화된 코드 생성과 작업 계획 수립이 가능해짐
  • 베타 기간 동안 개발자들이 수만 건의 작업을 수행하며 14만 건 이상의 코드 개선을 공유
  • 사용자 피드백을 바탕으로 UI 개선, 버그 수정, 이전 설정 재사용, GitHub Issues 통합, 멀티모달 지원 등 신규 기능 추가
  • Gemini 2.5 Pro의 고급 사고 능력을 활용해 더 정교한 코딩 계획과 높은 품질의 코드 생성 가능
  • 새로운 구독 티어 도입: Introductory(기본 체험), Pro(5배 한도), Ultra(20배 한도), 대학생은 1년 무료 Pro 제공

Jules 공식 런칭 및 주요 개선 사항

  • Google의 비동기 코딩 에이전트 Jules가 베타 테스트를 마치고 공식 출시됨
  • Jules는 Gemini 2.5 Pro의 고급 사고(Advanced Thinking) 기능을 활용, 작업 전 코딩 계획(Plan) 을 수립하여 더 높은 품질의 코드 생성 가능
  • 베타 동안 수천 명의 개발자가 수만 건의 작업을 수행하며 14만 건 이상의 코드 개선 결과를 공유함

사용자 경험 및 피드백 반영

  • 개발자 피드백을 토대로 사용자 인터페이스(UI)를 재설계하고 수백 개의 버그를 해결함
  • 이전 설정 재사용 기능 도입으로 반복 작업의 실행 속도가 빨라짐
  • GitHub Issues 연동을 통한 개발 워크플로우 통합
  • 멀티모달 입력 지원으로 다양한 데이터 형식 처리 가능

구독 구간 및 이용 방식

  • Jules는 구조화된 구독 구간(Introductory, AI Pro, Ultra)으로 제공되며, 사용 목적에 맞춰 선택 가능함
    • Introductory: 기본 사용자를 위한 안내 및 체험 중심
    • Google AI Pro: 기본 한도의 5배, 일상적인 코딩에 적합
    • Google AI Ultra: 기본 한도의 20배, 대규모 멀티 에이전트 워크플로우에 최적
  • Google AI Pro 및 Ultra 구독자에게 오늘부터 점진적으로 적용되며, 대학생은 1년 무료 AI Pro 혜택 제공

Jules는 jules.google 을 통해 바로 시작할 수 있음

Hacker News 의견
  • 왜 Google의 구독 모델이 이렇게 복잡해졌는지 궁금함, "Google AI Ultra"를 보면 Jules, Gemini App, Notebook 등이 다 포함되어 있지만, Gemini CLI를 사용하려면 GCP에서 별도 구독과 과금 계정 생성, Google Code Assist를 구매해야 하는 등 번거로움이 있음, 그런데 이렇게 하면 Gemini App은 또 제공되지 않음, 그리고 이상하게도 Google AI 구독하면 YouTube Premium까지 함께 오는데, 왜 연계되어 있는지 전혀 모르겠음

    • Google 내부에 AI 제품을 제공하는 두 그룹이 따로 있는 듯함, 회사에서 직접 사용 중인데 Workspaces 구독에는 Gemini, Veo 3, Jules 등이 다 포함되어 있고, 구독 하나로 제한적이나마 무제한 사용 가능함, 메인 진입점은 gemini.google.com임, 반면 API 사용이 필요하면 별도로 GCP를 이용해야 하고, 여기서는 Veo3 등 더 고급 모델과 추가 기능을 사용할 수 있지만 사용량에 따라 과금됨, 접근성은 GCP Vertex AI임, 두 조직은 꽤 분리되어 있고 상대방이 뭘 하는지 잘 모르는 것 같음

    • 예전에 Google for Domains로 Workspace를 만든 유저라면 정말 고생길임, 아무 것도 제대로 동작하지 않음

    • AI가 코딩해주는 동안 YouTube로 영상 보는 게 가능한 상황임

    • Google의 핵심 사업은 광고 판매와 그 시장 지배력 유지(Analytics, Chrome, Chromebook, Android, Google SSO 등)임, 개발자 대상 제품들은 Google 내 여러 진영의 부수적인 사업으로, 절대 주력이나 우선순위가 될 수 없음

    • Ultra 구독에 포함된 일부 항목과 다르게, YouTube Premium은 가족 공유가 안 됨, 결국 두 개를 각각 써야 하고 Google에서는 이러지 말라고 여러 번 알림을 줌

  • 최근 Jules를 사이드 프로젝트(React Native 앱) 개발에 사용해봤는데, 출퇴근 도중 산책하면서 새로운 아이디어나 기능을 고민, 계획하고 GitHub 앱으로 코드 수정도 하고, 몇 가지 작업을 Jules에 맡김, 저녁에 퇴근해서 보면 PR이 생성되어 있음, 코드 품질이 완벽하진 않지만 대부분 실행만은 돼서 바로 테스트해보고 직접 고칠 수 있어 빠르게 반복이 가능함, 다음 할 일은 모든 PR에 자동 빌드 추가하여 퇴근길에도 각 브랜치를 핸드폰에서 바로 확인하는 것임

    • React Native에서도 비슷한지 모르겠지만 Vercel로 배포하고 Neon을 DB로 쓸 때, 어느 브랜치/커밋/PR이든 바로 라이브 사이트로 미리보기를 할 수 있는 점이 매우 편리함, 파이썬 생태계에서 왔을 때 이런 커밋-배포 도구 체인이 탐색적/실험적 코딩에 마찰을 줄여줌, 무엇을 만들지 결정하는 기준이 실제로 만들어보고 나서 정하는 쪽으로 바뀌는 것임, 물론 이 방식은 LLM이 한번에 끝낼 수 있을 만큼 간단한 기능일 때만 매끄럽게 동작함

    • 비동기 탐색형 코딩이 요즘 트렌드임, GitHub Copilot Coding Agent(GitHub Copilot의 VSCode 플러그인이 아닌 별도의 Agent)도 추천함

    • 예전에 관리 안 하던 GitHub 레포에 연결해서 사소한 일들―의존성 업데이트, 코드 리팩토링, 작은 기능 추가, 스타일 변경 등―을 맡겨봤음, 이런 케이스에는 제법 잘 동작함, 다만 중요한 개발을 맡기진 않을 듯함

    • 바로 이런 이유로 superconductor.dev를 만들었음, 각 agent별로 라이브 앱 미리보기가 지원됨, Claude Code, Gemini, Codex, Amp도 지원함, 관심 있으면 회원가입시 HN 언급해주면 우선적으로 초대해줄 것임

  • Jules 프리뷰 기간 동안 여러 번 사용해 봤는데, 지금까지 써본 클라우드 코딩 어시스턴트 중에 가장 별로였음, 실험적으로 잠깐 운영하다 버린 줄 알았고 실제 제품으로 출시될 줄은 예상 못 했음, 예전에 GH Copilot Spaces가 그랬다가 Copilot Agent로 넘어간 것과 비슷함, Jules는 자기 멋대로 하고, 일을 미리 "끝마쳤다"고 하고 후속 질문을 하면 횡설수설만 함, 환경도 유지가 안 되고 가끔 아예 동작 안 할 때도 있었음, 실제로 병합까지 한 PR은 거의 한 번뿐임, 나머지는 다 엎어버리고 다른 agent에게 재할당함, 내 개인 랭킹은 Claude Code(gh action 활용)>ChatGPT Codex>GitHub Copilot Agent>Jules 순임, 최근 새롭게 3개월 체험 기회를 줘서 오늘 또 써볼 예정이지만 변함없으면 앞으로 Jules에는 돈이나 시간을 쓰지 않을 것임, Codex나 GitHub Agent 추천함, 혹평인 점 양해 바람

    • 오늘 다시 한 번 공정하게 Jules를 시도해봤는데 여전히 별로임

      • 계획을 제시해서 피드백 주고 승인도 했는데 몇 분 뒤 보니 "계획을 승인하면 진행하겠다"고 또 입력만 기다림, 이미 승인했다고 다시 입력해야 겨우 시작함
      • 환경 설정에서 bun 설치되어 있는데 Jules가 bun 명령어를 못 찾고 계속 설치만 반복, 피드백을 주고 나면 다시 bun이 사라짐, 모든 명령마다 install_bun.sh를 다시 실행함
      • 시킨 작업은 했지만 테스트가 깨지니 "우리 변경과는 무관하다"며 무시, "모두 고쳐달라"고 해도 결국 해결 못 함, 똑같은 설정에서 Codex, Copilot Agent, Claude Code는 잘 동작하는데 Jules만 문제임
      • 직접 맡아보려 했지만, 작업을 "완료"하지 않아서 브랜치가 생성 안 됨, 브랜치 푸시 요청하면 또 한참 멈춰서 테스트/린트를 반복하다가 결국엔 브랜치가 생성됨
      • 별 것 아닌 변경에 엄청 오래 걸렸고, 피드백 반복마다 시간 소모가 너무 큼, bun 문제나 테스트 실행 장애도 이유를 모르겠음, 앞으로 계속 발전하길 바라긴 하지만 당장은 다른 3개 agent만 사용할 계획임
    • 비슷한 경험임, 개인적으로는 rate limit이 관대한 Codex를 Claude보다 더 높게 평가함, Jules는 너무 산만하고 git pull request만 만드는 방식도 마음에 들지 않음, Codex처럼 git patch를 바로 복사해서 내가 원하는 대로 수정 후 커밋하는 옵션이 훨씬 유용함

    • 아직 직접 써보진 않았는데 비동기 agent 방식이 로컬에서 Claude Code 돌리는 것만큼 유용할지 의문임, 계속 개입해서 제대로 작동하는지 확인해야 해서, 비동기 agent는 코드 pull, 빌드/런/테스트 전체 순환이 필요해 번거로울 것 같음, 반면 로컬로 뜨거운 환경에서 바로바로 확인하는 게 훨씬 효율적임

    • 본문에 GH Copilot Spaces와 비슷하게 본 것도 맞다고 생각함, 아마 Google은 이게 미래의 판을 노리고 있다고 봄, 지금 AI가 완벽히 다루지 못해도, 큰 변화가 올 때까지 기다렸다가 기능을 구현하면 너무 늦으니 미리 만들어두고 AI의 발전을 기다리는 식, 개인적으론 LLM이 이걸 완전히 해결할 수 있을지 의심스럽지만, 언제나 LLM 이후가 남아 있을 것임

  • 무료 플랜 기준 하루 작업 제한이 60회에서 15회로 줄어듦, 나처럼 수정이 많아서 오히려 한도를 채워본 적이 없었음, Jules 팀과 직접 소통하려면 discord.gg/googlelabs에서 문의 가능함

    • 내 경우엔 작업 한도 100개로 올라갔음, Google Pro 유저인지 무료인지에 따라 다름, 매주말 여러 작업해도 10회를 넘은 적이 거의 없음, 무료라면 15개면 충분함, 개인적으로 100회 한도도 아마 평생 다 쓸 일 없을 듯함
  • "Rust로 기본적인 raytracer 작성"이란 프롬프트로 한두 달 전과 지금 다시 Jules에 시도했음, 예전엔 코드가 적어도 컴파일은 됐던 것 같은데, 브랜치에 푸시를 아예 안 하고 아무리 요청해도 못하게 됨, 코드가 실제 돌아가는지 조차 확인 불가함, 이번엔 두 개의 main.rs를 서로 다른 디렉토리에 만들고 코드를 무작위로 나눠 배치함, 문제를 설명했더니 파일시스템 전체를 이리저리 탐색하다가 결국 포기함

    • 커밋 푸시 관련 인터랙션 모델은 정말 이해할 수 없을 정도로 혼란스러움

    • 이건 zero shot 도구가 아님, 왜 모두 zero shot으로 시도하는지 모르겠음

  • Codex와 경쟁 구도가 생긴 것은 반가움, Codex, Jules 같은 클라우드 비동기 agent가 Claude Code/Aider/Cursor처럼 로컬에 통합되는 방식보다 낫다고 생각함, 이들은 내 로컬 환경과 완전히 분리되어 있어 훨씬 안전함, 게다가 명령만 보내고 내 PC에서 다른 일을 하다 나중에 PR을 확인하는 방식이 sandbox 직접 구성이나 git worktree 쓰는 것보다 낫다고 느낌

    • Codex, Jules는 CC, Cursor와 완전히 다른 접근임, 소프트웨어에서 Cathedral vs Bazaar 논쟁처럼, 1) Cathedral(대성당) 방식은 통제된 환경, 손쉬운 배포, 제한된 upside 등, OpenAI는 여기에 해당함, 2) Bazaar(시장) 방식은 agent를 유저 환경으로, 수많은 앱/변수와 직접 상호 작용하며 도전 난이도가 훨씬 높지만, payoff도 훨씬 큼, 환경 설정 문제 등은 일시적이고 해결 가능한 이슈임

    • 완전히 분리하면 안전하지만, 속도도 느리고 비용도 더 큼, 가끔 CC가 이상할 때 즉시 중단시킬 수 있지만 비동기 방식은 몇 시간 뒤 돌아와서 대참사를 마주하기도 하며 그만큼 token을 많이 소모 가능함

    • 기존 코드베이스에서 PR 기반 제안은 개발자 입장에서 가장 이질감 없는 도입 방식임, 이미 코드리뷰 방식에 익숙하므로, 다만 기존 인간 위주 워크플로를 agent 대량 제안에 강제로 적용하면 곧 한계에 부딪힘, 더 많은 제안을 효율적으로 리뷰하는 자동화된 워크플로가 필요함, 그래서 커맨드라인 기반 Claude, Aider 같은 방식이야말로 async/병렬 agent의 확장성을 가장 잘 활용할 수 있다고 봄, 여기 aider/claude용 보조 라이브러리도 만들어둠, 그리고 이런 dev 환경까지 모두 오픈소스가 유지되어야 MS, OpenAI 등 인프라 종속에서 벗어날 수 있음, CLI로 리뷰하는 팁도 사례별 문서로 정리 중임

    • 참고로 Claude code도 GitHub actions와 연동해서 async 작업 가능함, Claude code slash 명령으로 자동 셋업도 지원함

    • 클라우드 기반 async agent와 로컬 활성화형(Claude Code, Cursor, Aider) 방식을 둘 다 섞는 게 가장 생산적인 셋업일 듯함, Codex UI처럼 반복적이고 단순한 작업만 맡기고 나머지는 내 로컬에서 처리하고 싶음, Codex 구동 머신이 느려서 컴파일, 리빌드, 디펜던시 캐싱이 계속 반복되는 점이 아쉬움, UI/도구/상태를 내 로컬에서 관리하고 LLM 추론만 원격으로 처리했으면 훨씬 빠른 워크플로가 나올 것임

  • Jules로 사이드 프로젝트 진행해 봤더니 GH Copilot(Claude Sonnet), Gemini CLI, Claude Code에 비해 코드 품질이 현저히 떨어졌음, 특히 monorepo에서 디렉토리 이동 관련 논리가 계속 꼬임, 이미 backend 폴더에 있는데 cd 명령어를 반복적으로 실행하고, 논리를 변경해서 제대로 파악을 못함

    • 최근 Jules는 Gemini 2.5 Pro의 고도화된 plan 작성 능력을 활용한다고 홍보하니 한 번 더 시도해볼 만함

    • 첫 사용이었는데 데이터 계층 전체 개편을 굉장히 잘 처리해줘서 예상보다 만족스러움, Copilot 때도 감탄했지만 오래 쓰다보면 AI가 점점 느려지고 혼동스러워져서 오히려 시간 낭비되는 경우도 있음, 지금 AI 코딩 에이전트의 단면임

    • 사이드 프로젝트에 컬러풀 터미널 출력 추가하는 작은 변경을 맡겨봤더니 PR 결과가 훌륭했음, LLM 코딩 agent는 어떤 작업엔 강점을 보이고 어떤 데선 약점을 보여 결과가 랜덤인 듯함, 그래도 프롬프트 한 줄로 PR이 나와서 실패해도 부담이 작고, 재요청도 간편함

  • "비동기형 코딩 agent" 개념과 용어가 마음에 듦, 랜체인에서 오픈소스 async agent 소개 글, 그리고 Copilot 관련 coding agent 사례도 참고로 발견함, 이런 흐름이 고착화되길 바람

    • Simon(위 댓글 작성자)이 쓰는 단어라면 표준이 될 것 같음
  • 2025년에는 Claude Code만이 진정한 agent임, 그래도 Gemini는 긴 컨텍스트 처리에서는 강력함, 참고: Reddit 토론 링크

    • 동의함, Google이 벤치마크 성과도 좋고 World Models Genie 3 같은 모델도 발표하지만, Gemini CLI의 추천/변경은 너무 틀에 박혀 있음, 실제 필요한 기능 구현보다는 탭과 공백 같은 코딩 스타일에만 집착하는, 마치 OCD 코더 같은 느낌임, 예시로 최근 프로젝트에서 하루 토큰 한도를 ESLint 설정, 불필요한 코드 모듈화 등 사소한 작업에 다 써버렸음, 반면 Claude Code는 내 요구를 더 잘 반영해 실제 사용자용 기능 개발에 도움이 됨, 프롬프트 설계 탓일 수 있지만, Claude Code가 내도를 더 잘 이해하는 듯함

    • 내 생각도 동일함, PR 검토 워크플로가 가운데 끼는 걸 원치 않음, Claude Code의 킬러 기능은 이상한 방향으로 갈 때 인스턴트로 제어하고, 중간중간 내가 직접 코딩하며 개입이 쉬운 구조임, 실제로 주니어가 풀 피처를 질문없이 맡겼다가 막힐 때만 체크하게 두면 안 되는 것과 비슷함

    • Sourcegraph Amp도 꽤 괜찮고, Claude code만큼의 완성도나 기능은 없지만, 코드리뷰에선 'oracle' 툴로 o3 호출해 도움 받을 때가 많음

  • 가격 정보가 왜 이렇게 숨겨진 건지 모르겠음, Grok에 물어봐야만 겨우 찾을 수 있음, Google 사이트는 약관에 동의해야만 요금제 개요라도 확인 가능함, 참고로 플랜/가격은 gemini.google/subscriptions에서 볼 수 있음(로그인해야 할 수도 있음)

    • "> Highest task limits"라고 표기하거나, Claude나 Cursor처럼 이용 조건을 사후에 바꿀 수 있게 하는 건 법적으로 금지해야 한다고 생각함

    • grok을 써야 했다는게 무슨 의미인지 궁금함, 다른 모델로도 시도했지만 실패했는지, 혹은 grok을 곧잘 쓰는 건지 추가 설명 부탁함