Gemma Gem - 브라우저에서 Google Gemma 4 모델을 완전 온디바이스로 실행하는 Chrome 확장
(github.com/kessler)- Google의 Gemma 4 모델을 WebGPU 기반으로 완전 온디바이스 실행해서 브라우저 안에 상주하는 개인 AI 어시스턴트로 활용
- API 키·클라우드·외부 데이터 전송 없음 - 모든 추론이 로컬에서 처리되며 데이터가 기기를 벗어나지 않음
- 방문 중인 페이지 읽기, 버튼 클릭, 폼 입력, JavaScript 실행, 사이트에 대한 질의응답 수행하는 에이전트형 동작 지원
- Gemma 4 E2B(~500MB) / E4B(~1.5GB) 두 모델 중 선택 가능하며 첫 실행 후 캐시되어 재사용
- q4f16 양자화, 128K 컨텍스트 지원 (
onnx-community/gemma-4-E2B-it-ONNX,onnx-community/gemma-4-E4B-it-ONNX) - 6가지 내장 도구 제공
read_page_content: 페이지 텍스트/HTML 또는 CSS selector 기준 읽기take_screenshot: 보이는 페이지를 PNG로 캡처click_element/type_text/scroll_page: CSS selector 기반 DOM 조작run_javascript: 페이지 컨텍스트에서 DOM 전체 접근 가능한 JS 실행
- Offscreen Document + Service Worker + Content Script 3계층 구조
- Offscreen document가
@huggingface/transformers+ WebGPU로 모델 호스팅 및 에이전트 루프 실행 - Service worker는 메시지 라우팅과 스크린샷·JS 실행 담당
- Content script는 gem 아이콘과 shadow DOM 채팅 오버레이 주입
- Offscreen document가
- 설정에서 모델 전환, Thinking 토글, 도구 호출 루프 상한, 대화 기록 초기화, 사이트별 비활성화 지원
agent/디렉터리는 의존성 제로,ModelBackend·ToolExecutor인터페이스 기반으로 독립 라이브러리화 가능- WebGPU 지원 Chrome 필요 / Apache-2.0 라이선스 / TypeScript 기반 구현
GeekNews Weekly에 포함된 글입니다.
에디터 코멘트 보기