# Show GN: Garu: 브라우저에서 돌아가는 1.7MB 한국어 형태소 분석기 (F1 95.3%, WASM)

> Clean Markdown view of GeekNews topic #28002. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=28002](https://news.hada.io/topic?id=28002)
- GeekNews Markdown: [https://news.hada.io/topic/28002.md](https://news.hada.io/topic/28002.md)
- Type: show
- Author: [dydwls140](https://news.hada.io/@dydwls140)
- Published: 2026-03-30T11:26:58+09:00
- Updated: 2026-03-30T11:26:58+09:00
- Original source: [github.com/ongjin](https://github.com/ongjin/garu)
- Points: 12
- Comments: 1

## Summary

서버 없이 **브라우저에서 형태소 분석**이 가능하다는 점이 핵심입니다. 한국어 NLP에서 클라이언트 사이드 처리가 어려웠던 이유가 모델 크기와 의존성 때문이었는데, Garu는 이를 **WASM + 룩업 기반 구조**로 정면 돌파했습니다. 프라이버시가 중요한 입력 폼, 오프라인 앱, 또는 엣지 환경에서 텍스트 전처리가 필요한 개발자에게 특히 유용합니다. 모델을 npm으로 바로 불러올 수 있어, 마치 **.wasm 버전의 MeCab-ko**를 다루는 듯한 개발 경험을 제공합니다.

## Topic Body

브라우저에서 서버 없이 실행되는 한국어 형태소 분석기를 만들었습니다.  
  
기존 형태소 분석기(Kiwi ~40MB, MeCab-ko ~50MB)는 서버 환경을 전제로 설계되어 있어서, 클라이언트 사이드에서 형태소 분석이 필요한 경우 선택지가 없었습니다.  
  
Garu는 코드북 + Viterbi 기반의 비신경망 아키텍처로, 1.7MB 모델과 93KB WASM 엔진만으로 브라우저에서 직접 실행됩니다.   
  
- 모델 크기: 1.7MB (gzip ~950KB, 네트워크 전송 약 1MB)  
- 정확도: F1 95.3% (NIKL 모두의 말뭉치 기준)  
- 비교: Kiwi 87.9% / MeCab-ko ~85%  
- 신경망 없음: 학습 파라미터 0개, 순수 룩업 + Viterbi 디코딩  
- npm install garu-ko 로 서버/브라우저 모두 사용 가능  
  
BiLSTM 지식 증류, 자소 단위 시퀀스 라벨링 등 두 번의 실패를 거쳐 코드북 + 비터비라는 비신경망 아키텍처에 도달했습니다. 76.1%에서 95.3%까지의 최적화 과정(NIKL 골드 데이터 직접 학습, 스마트 어절 캐시, 문맥 기반 후처리 규칙 등)을 기술 논문에 정리했습니다.  
  
GitHub: https://github.com/ongjin/garu  
기술 논문: https://github.com/ongjin/garu/blob/main/docs/paper.md  
npm: https://www.npmjs.com/package/garu-ko

## Comments


### Comment 54118

- Author: moderator
- Created: 2026-03-30T11:30:15+09:00
- Points: 1

Show GN으로 이동하였습니다.  
참고로 moderator가 분류를 조정한 글은 홈 화면 노출이 제한될 수 있으니, 등록 전에 카테고리를 한 번 더 확인 부탁드립니다.