# Kiwi : 지능형 한국어 형태소 분석기(Korean Intelligent Word Identifier)

> Clean Markdown view of GeekNews topic #18020. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=18020](https://news.hada.io/topic?id=18020)
- GeekNews Markdown: [https://news.hada.io/topic/18020.md](https://news.hada.io/topic/18020.md)
- Type: news
- Author: [rycont](https://news.hada.io/@rycont)
- Published: 2024-11-30T08:24:27+09:00
- Updated: 2024-11-30T08:24:27+09:00
- Original source: [github.com/bab2min](https://github.com/bab2min/Kiwi)
- Points: 38
- Comments: 0

## Summary

Kiwi는 빠른 속도와 범용적인 성능을 목표로 하는 한국어 형태소 분석기 라이브러리로, 경량 언어모델을 내장하여 모호성이 있는 경우에도 정확한 분석을 제공합니다. 이 라이브러리는 C++로 구현되었으며, 다양한 프로그래밍 언어와 브라우저에서 사용할 수 있도록 지원됩니다. 또한, Kiwi를 활용한 한국어 언어모델 훈련 과정이 GitHub에 공개되어 있습니다.

## Topic Body

- Kiwi : 지능형 한국어 형태소 분석기(Korean Intelligent Word Identifier)  
- 빠른 속도와 범용적인 성능을 지향하는 한국어 형태소 분석기 라이브러리  
- 경량 언어모델이 내장되어, 모호성이 있는 경우에도 제법 정확하게 형태소를 분석해냄  
- C++로 구현됨. 개발자가 C++의 팬.  
  - 라이브러리는 파이썬, 자바스크립트, C#, Java, R, Go로 제공됨  
  - wasm으로 컴파일되어 브라우저에서 구동할 수 있음  
- 모델은 소형(16MB), 중형(40MB), 대형(90MB)까지 세가지 크기로 제공됨  
- 개발 과정이 블로그에 상세히 공개되어 있음  
  - https://bab2min.tistory.com/560  
- Kiwi를 토크나이저로 활용한 한국어 언어모델 훈련도 인상적  
  - https://github.com/bab2min/kiwi-farm

## Comments



_No public comments on this page._
