# Gemma Gem - 브라우저에서 Google Gemma 4 모델을 완전 온디바이스로 실행하는 Chrome 확장

> Clean Markdown view of GeekNews topic #28645. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=28645](https://news.hada.io/topic?id=28645)
- GeekNews Markdown: [https://news.hada.io/topic/28645.md](https://news.hada.io/topic/28645.md)
- Type: news
- Author: [xguru](https://news.hada.io/@xguru)
- Published: 2026-04-18T09:31:02+09:00
- Updated: 2026-04-18T09:31:02+09:00
- Original source: [github.com/kessler](https://github.com/kessler/gemma-gem)
- Points: 3
- Comments: 0

## Topic Body

- Google의 **Gemma 4 모델**을 **WebGPU** 기반으로 완전 온디바이스 실행해서 브라우저 안에 상주하는 **개인 AI 어시스턴트**로 활용  
- **API 키·클라우드·외부 데이터 전송 없음** - 모든 추론이 로컬에서 처리되며 데이터가 기기를 벗어나지 않음  
- 방문 중인 페이지 읽기, 버튼 클릭, 폼 입력, JavaScript 실행, 사이트에 대한 질의응답 수행하는 **에이전트형 동작** 지원  
- **Gemma 4 E2B(~500MB)** / **E4B(~1.5GB)** 두 모델 중 선택 가능하며 첫 실행 후 캐시되어 재사용  
- **q4f16 양자화**, **128K 컨텍스트** 지원 (`onnx-community/gemma-4-E2B-it-ONNX`, `onnx-community/gemma-4-E4B-it-ONNX`)  
- 6가지 내장 도구 제공  
    - `read_page_content`: 페이지 텍스트/HTML 또는 CSS selector 기준 읽기  
    - `take_screenshot`: 보이는 페이지를 PNG로 캡처  
    - `click_element` / `type_text` / `scroll_page`: CSS selector 기반 DOM 조작  
    - `run_javascript`: 페이지 컨텍스트에서 **DOM 전체 접근 가능한 JS 실행**  
- **Offscreen Document + Service Worker + Content Script** 3계층 구조  
    - Offscreen document가 `@huggingface/transformers` + WebGPU로 모델 호스팅 및 **에이전트 루프** 실행  
    - Service worker는 메시지 라우팅과 스크린샷·JS 실행 담당  
    - Content script는 gem 아이콘과 shadow DOM 채팅 오버레이 주입  
- 설정에서 **모델 전환**, **Thinking 토글**, **도구 호출 루프 상한**, **대화 기록 초기화**, **사이트별 비활성화** 지원  
- `agent/` 디렉터리는 **의존성 제로**, `ModelBackend`·`ToolExecutor` 인터페이스 기반으로 독립 라이브러리화 가능  
- **WebGPU 지원 Chrome** 필요 / **Apache-2.0** 라이선스 / TypeScript 기반 구현

## Comments



_No public comments on this page._
