# SuperGemma4 - 구글 Gemma 4 26B의 비검열/속도개선/양자화 모델

> Clean Markdown view of GeekNews topic #28584. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=28584](https://news.hada.io/topic?id=28584)
- GeekNews Markdown: [https://news.hada.io/topic/28584.md](https://news.hada.io/topic/28584.md)
- Type: news
- Author: [xguru](https://news.hada.io/@xguru)
- Published: 2026-04-16T11:31:02+09:00
- Updated: 2026-04-16T11:31:02+09:00
- Original source: [huggingface.co](https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2)
- Points: 41
- Comments: 8

## Summary

Gemma 4 26B를 애플 실리콘 MLX에 맞게 **4비트 양자화하고 비검열 처리**한 커뮤니티 모델입니다. 13GB 크기로 원본 대비 퀵벤치 점수가 91.4→**95.8**로 올라갔고, 코드 생성(**98.6점**), 한국어 프롬프트(**95.0점**) 모두 원본보다 안정적이라는 점이 눈에 띕니다. Ollama용 GGUF 버전도 있고, `mlx_lm.server` 한 줄로 OpenAI 호환 서버가 뜨니 **로컬 에이전트 파이프라인에 바로 투입**하기 좋습니다.

## Topic Body

- **Gemma 4 26B IT**를 기반으로 애플 실리콘 MLX 최적화/4비트 양자화한 텍스트 전용 모델로, 약 **13GB** 크기  
- 원본보다 **똑똑**하고, **동일 머신에서 더 빠르며**, **코드·도구 사용·한국어에서 안정적인 비검열 모델**  
- 텍스트 전용 플래그십으로, 멀티모달이 아닌 **빠른 텍스트 처리**에 초점  
- 퀵벤치 **95.8점**(원본 91.4)으로 개선 및 **8.7% 빠른 생성 속도**(46.2 tok/s), 체감상 응답 대기 시간 확연히 줄어듦  
- **비검열(uncensored)** 특성을 핵심 속성으로 유지하면서도 코드, 도구 사용, 한국어 프롬프트에서 안정적 출력을 냄  
  - 코드 생성 점수 **98.6**(+6.3)으로, 로컬에서 Python 함수 작성·리팩토링 시킬 때 원본보다 훨씬 정확한 결과를 보임  
  - **한국어 프롬프트 점수 95.0**(+4.3)으로, 한국어로 질문해도 깨지지 않고 바로 쓸 수 있음   
  - 한국어 및 **에이전트 스타일 프롬프트** 처리 성능이 원본보다 우수  
  - 비검열 모델이라 **콘텐츠 필터에 막히는 답변 제로**, 그러면서도 출력이 불안정하거나 깨지지 않음  
- 브라우저 자동화·도구 호출·계획 수립 등 **로컬 에이전트 워크로드/파이프라인**에 바로 투입 가능  
- 실행하기:  
  - `mlx_lm.server --model Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2 --port 8080`  
  - OpenAI 호환 서빙 자동 지원, 별도 템플릿 설정 불필요(오히려 `--chat-template`에 경로 넣으면 응답 손상)  
- MLX 4-bit, BF16·U32 텐서, **Safetensors** 포맷

## Comments


### Comment 55702

- Author: kohs100
- Created: 2026-04-17T15:46:25+09:00
- Points: 1

허깅페이스에 올라와있는 31b 헤레틱 사용중이었는데 이것도 써봐야겠네요

### Comment 55618

- Author: jjangdww
- Created: 2026-04-16T21:55:14+09:00
- Points: 1

저도 한번 시도해봐야겠네요  
좋은정보 감사합니다.

### Comment 55584

- Author: asdfg
- Created: 2026-04-16T13:49:15+09:00
- Points: 1

이거 원본인 gemma4랑 라이선스가 다르네요

### Comment 55586

- Author: fanotify
- Created: 2026-04-16T14:07:41+09:00
- Points: 1
- Parent comment: 55584
- Depth: 1

그러게요 Apache 2.0이 아니네요

### Comment 55708

- Author: caniel
- Created: 2026-04-17T16:28:50+09:00
- Points: 1
- Parent comment: 55586
- Depth: 2

라이선스 탭에는 Gemma 4로 링크가 걸려있는데, 어디서 확인할 수 있나요?

### Comment 55576

- Author: adieuxmonth
- Created: 2026-04-16T13:18:45+09:00
- Points: 1

대박 ㄷㄷ

### Comment 55569

- Author: xguru
- Created: 2026-04-16T11:53:03+09:00
- Points: 1

Ollama 에도 있습니다   
https://ollama.com/0xIbra/supergemma4-26b-uncensored-gguf-v2  
  
좀 더 큰 31b 모델도   
https://huggingface.co/Jiunsong/SuperGemma4-31b-abliterated-mlx-4bit  
https://huggingface.co/Jiunsong/SuperGemma4-31b-abliterated-GGUF

### Comment 55565

- Author: sea715
- Created: 2026-04-16T11:31:32+09:00
- Points: 1

허헣 국내 커뮤니티에서 만든 모델이라 신기하네요