Gemini CLI GitHub Actions 공개

(blog.google)

5P by GN⁺ 4달전 | ★ favorite | 댓글 1개

Google이 Gemini CLI를 기반으로, GitHub 저장소에서 팀 협업을 지원하는 Gemini CLI GitHub Actions를 발표
- Gemini CLI는 터미널에서 AI 기능을 활용할 수 있는 오픈소스 AI 에이전트
- 이번 GitHub Actions 버전은 팀 단위 협업 환경에 맞춰 설계되어 Repo에 상주하는 AI 동료라고 생각하면 됨
이 도구는 무료/오픈소스로 제공되며, 현재 베타 버전으로 전 세계에서 사용 가능
GitHub 저장소에서 발생하는 이벤트(새 이슈, PR 생성 등)에 따라 자동으로 비동기 실행되고, 프로젝트의 전체 컨텍스트를 이해해 작업을 자동 처리함
3개의 강력한 오픈소스 워크플로우 제공
- 지능형 이슈 분류(Intelligent issue triage)
  - 새로운 이슈를 분석해 자동으로 라벨링 및 우선순위 지정
  - 개발자가 중요한 작업에 집중할 수 있도록 지원
- 신속한 PR 리뷰(Accelerated pull request reviews)
  - 코드 변경 사항에 대해 즉각적이고 심층적인 피드백 제공
  - 코드 품질, 스타일, 정확성을 검토해 리뷰어의 부담을 줄임
- 온디맨드 협업(On-demand collaboration)
  - 이슈나 PR에서 @gemini-cli를 멘션해 작업을 위임 가능
  - 예: "이 버그에 대한 테스트 작성", "위 제안사항 구현", "대안 솔루션 브레인스토밍", "명확히 정의된 버그 수정"
이 워크플로우들을 런치패드로 생각하고, 오픈소스이므로 자신만의 워크플로우 구성 가능
반복적이고 시간이 많이 드는 작업을 자동화하여 개발 생산성을 향상하고, 코드 리뷰와 이슈 관리의 효율성을 높여 팀 협업 속도 개선 가능

▲

GN⁺ 4달전 [-]

Hacker News 의견

이게 CLI인지, GitHub Action인지, 아니면 GitHub Application인지 구분이 안 되는 혼란스러운 상황임
Jules가 원래 '코딩 에이전트'로 불렸던 건데, 지금은 또 다른 도구가 그 역할을 대신하는 건지, 아니면 Google의 자기잠식 사례인 건지 혼란스러움
이 회사가 좀 더 명확한 비전을 가진 리더십을 가져야 할 때라고 느낌
13년 동안 Android 코드를 작성하고, Google과 협업했으며, Google 개발자 커뮤니티와 컨퍼런스에서 리더 역할도 했고, 많은 GDE들과 소통하고, Gemini API도 제품에서 활용하는 입장임에도 도통 뭔지 이해하기 힘듦
일반 고객 입장에서는 도저히 이해가 어려울 것 같음
Gemini API 연결용 SDK도 2개나 되고, 문서도 온통 흩어져 있어서 특정 기능을 하려면 구글링하고 코드 레포까지 뒤져야 함
원하는 기능은 대부분 rate limit 걸리거나 비공개 테스터에게만 열림
코딩 에이전트도 3개나 됨
Google 계정과 폰에 접근 권한도 있는데 Gemini 앱이 쓸모없음
Google Cloud에서 서비스 계정 추가 같은 기본 작업도 UX가 헷갈려서 힘듦
유일하게 쓸 만한 건 AI studio임. 다양한 모델 실험이 가능하고 Gemini API 키 발급 DX도 좋아짐
솔직히 이번 출시 축하는 건 좀 어렵고, 그냥 '중간 정도'의 새로운 상품 수준임
- 연구 문화와 소프트웨어 문화 사이에 명확한 경계가 필요하다고 느낌
  연구 환경에선 여러 팀이 동시에 다양한 실험을 하는 혼란이 오히려 긍정적으로 작용하지만,
  고객이 직접 만나는 소프트웨어와 제품은 다른 접근이 필요함
- Google은 여러 '인큐베이팅' 공간을 만들어 놓고, 이 중 일부가 성공하면 기존 제품들과 자연스럽게 어우러지지 못해서 사용자들에게 혼란을 주는 것 같음
  NotebookLLM 같은 사례도 있음
  하지만 개인적으로는 이렇게 다양한 실험이 더 낫다고 생각함
  NotebookLLM 팀도 자율적으로 일하는 분위기같이 보였음
- Google 계정과 폰 정보 접근이 있는데 Gemini 앱이 아무것도 못한다는 지점이 가장 웃김
  앱을 열면 "Hello, Vasco"라고 인사하지만, 정작 "내 이름이 뭐야?"라고 물으면 "사용자 정보를 알 수 없다"고 대답함
  왜 그런지 알고는 있지만, 너무 웃긴 상황임
- Jules는 VM에서 비동기적으로, 코드의 별도 체크아웃에서 동작함
  Gemini CLI는 로컬에서 사용자와 동기적으로 동작함(단, YOLO 모드 예외)
  두 가지는 완전히 다른 방식임
- Google Workspace의 경우 또 상황이 달라짐
  조직 전체에서 Gemini CLI 활성화하려면 기쁨과 슬픔이 공존하는 활동임
  자세한 설명
Google이 코딩 AI 경쟁을 해야 할 필요성을 느끼는 건 이해하지만 이상한 점이 많음
- Gemini는 미팅 일정 같은 간단한 캘린더 예약도 못함
- Google Docs에서 협업 수정이 안 되고 삽입만 가능함
- Docs나 Sheets와 관리하는 중앙관리포인트(MCP)도 없음
- 시트 수식 도움은 오히려 Google Search보다 못함
  이런 고유한 영역이 많은데도 AI로 두각을 못 나타내는 게 아쉬움
  예전에 Gmail에서 문자열 "remarkable"로 정확 검색하려는데, "amazing"과 같은 연관 단어까지 결과로 나옴
  모든 제품의 검색이 퇴보해서 답답한 시점임
- 실제로 내가 Android 폰에서 배송 예약 이메일을 보고, 전원버튼을 꾹 누르면 Gemini가 팝업됨
  화면 컨텍스트를 불러와 "이걸 내 캘린더에 넣어줘"라고 말하면 일정이 추가됨
  완벽하게 동작하는 건 아니지만(예: 여러 날에 걸치거나 위치가 이상하면 빠질 때 있음), 점점 좋아지는 중임
  Google Workspace 고객이면 Gemini 웹 앱과 캘린더, 드라이브 연동도 지원함
  문서 요약 등 다양한 작업도 가능
  '일정 만들기 불가'는 사실 아닌 셈임
- Google이 Gemini를 문서에 풀지 않는 건 Apple이 AI를 아이폰에 풀지 않는 이유와 비슷하다고 생각함
  신뢰성이 아직 절대적이지 않아서 99.99% 대중에게 내놓을 수준이 아님
  테크 얼리어답터만 잘 쓰고, 일반인은 추천하고 싶지 않은 시스템임
- 정말 다양한 소소하고 유용한 활용법이 많은데, 마케팅이 아쉬움
  예를 들어, 장보기 목록을 사진 찍어서 Gemini에게 붙여넣기 가능한 형식으로 바꿔달라고 했더니 Google Keep에 그대로 옮기기만 하고 카테고리 분류는 못함
  조금만 더 팀에서 우선순위 두고 다듬어주면 훨씬 쓸모 있을 것 같음
  OpenAI는 TikTok에서 다양한 기능을 마케팅하는데, 30대 이하 젊은 층은 Gemini의 존재 자체를 모르는 사람이 많음
  실제로 Gemini가 ChatGPT보다 실용성이 높다고 느끼는데, 마케팅이 아예 부족함
- Google Docs 지원이 워낙 제한적이어서 기대가 안 생김
- 검색은 임베딩 기반으로만 바뀌어 제대로 동작하지 않는다는 인식임
  실제로는 임베딩, 텍스트 매칭, 퀄리티 벡터 등을 혼합한 하이브리드 검색이 필요한데, 이걸 확장성 있게 빠르게 만들기 쉽지 않음
  혹시 이런 시스템이 있다면 알려주면 좋겠음
서비스가 실제로 뭔지 파악하려면 엄청나게 많은 시간이 소요됨
홍보 문구와 장황한 설명, 불필요한 용어를 걷어내야 진짜 모습이 드러남
내 이해로는 이건 GitHub Action임
GitHub workflow YAML 파일에 넣어서, Gemini CLI를 실행하고 프롬프트, 레포 컨텍스트, 이슈나 PR diff 같은 이벤트 데이터를 전달해 응답이나 작업을 수행하게 해주는 래퍼임
토큰 또는 앱을 통해 GitHub API로 레포 데이터 읽기/쓰기(라벨 추가, 코멘트, 코드 제안 등) 가능
Gemini LLM HTTPS API 엔드포인트로 표준 호출 방식 사용
- Boris Cherny와 Catherine Wu가 Latent Space 팟캐스트에서 AI 기반 CLI의 의미론적 린팅에 대해 이야기한 영상이 있음
  관련 유튜브 인터뷰
  아직 AI 기반 CLI를 CI/CD에서 적극적으로 써본 적은 없지만, semantically pass/fail하는 작업에는 매우 흥미가 큼
- 문서에서 "채팅 인터페이스에서 이걸 써라"라고 되어 있는데, 채팅 인터페이스가 뭔지 궁금함
Gemini 플랜(예: Google One, Workspace 등)이 웹 기반 제품에만 적용되고, API 기반(예: Gemini CLI)은 제외됨
개발자용 월 구독 하나만 내면 CLI, github action, Gemini chat, Jules 등을 다 쓸 수 있게 해주면 정말 혁신일 것 같음
Claude처럼 단일 맥스 구독 방식을 간절히 원함
- 구독 구조 자체를 이해하려면 AI가 필요함
- Gemini 무료 티어가 정말 헷갈림
  여러 에이전트로 사용해봤는데 5~6번 요청만 해도 rate limit에 걸림
  반면 웹 앱은 무제한 사용 가능한 느낌임
  "관대한 무료 할당량"이 있으니 시도해보라고 하는데, 정작 짧은 시간 내에 멈춰버림
  단순한 테스트엔 적합하지만, 실제 실무에서 쓰려면 부족함
홍보 슬라이드의 이미지 텍스트 중
'@mini-cli' 태그로 작업을 위임하면, 버그 작성부터 수정까지 다양한 작업이 가능하다는 설명이 너무 웃김
- 아직도 저 문구가 고쳐지지 않은 게 놀라움
  어쩌면 정말 솔직한 표현일지도 모름
이걸 'gemini cli'로 칭하는 게 정말 맞는지 의문임
대부분 GitHub을 통해 사용하면 더이상 CLI가 아니지 않은지
차라리 Claude Code처럼 'gemini github action'이나 'run gemini' 등 더 직관적인 네이밍이 낫지 않을까 싶음
- 아마도 Gemini CLI 팀이 개발해서, 팀의 공로를 인정받으려거나 너무 범용 제품처럼 보이지 않게 내부 압력 때문에 이런 네이밍이 된 것 같음
- 실제로 github action VM 안에서 gemini-cli를 설치하고, 이슈/PR의 코멘트를 프롬프트로 gemini-cli에 전달하는 구조임
- 나도 네이밍에 대해 같은 고민을 했음
  이 부분은 정말 실망스러운 부분이라 생각함
- 완전히 로컬에서 쓰는 Gemini-CLI에 add-on 형식임
작년에 실제로 GitHub PR을 위한 바운티 플랫폼을 개발했음
인센티브 때문에 품질 낮은 PR이 많이 들어왔고, AI로 초안 작성도 쉽게 될 수 있어서 이 컨셉이 사실상 무의미해진 경험임
핵심적인 오픈소스 관리 고민이 ‘리뷰어/메인테이너의 한정된 리소스’로 이동했다고 느낌
그래서 주요 에이전트로부터 PR을 자동 생성해서, 리뷰와 승인/수정 과정을 최적화하는 프레임워크를 실험 중임
여기에 관련 케이스 스터디를 정리하고 있음
꽤 많은 설정이 필요해서, 이미 모든 사용자가 쉽게 쓸 수 있는 GitHub Copilot Agent와 비교하면 설득력이 매우 떨어짐
Gemini assistant가 기존 툴들보다 월등히 나아야 겨우 조금이라도 사용자 유입이 가능할 수준임
- 기존 어시스턴트 중 월등히 좋은 게 뭐냐면 Claude를 뜻하는 건지 묻고 싶음
  Gemini도 비슷하면 되는데, 단지 구독만 명확하고 합리적이면 충분함
이게 진짜 무료라는 게 오히려 의심스러움
학습 데이터 제공이 대가일 수도 있는데, opt-out(선택 거부)도 옵션이 없어서 개인/내부 레포에서는 조심스럽게 써야 한다고 생각함
Copilot Agent로 좋은 결과를 많이 얻고 있음
가끔 PR을 닫고 이슈를 다듬거나 로컬에서 cursor로 작업해야 하지만, 작업 스타트 자체가 워낙 빨라져서 전반적으로 만족감이 높음

답변달기