오픈소스 HWP/HWPX 처리 도구 목록
(ko.wikipedia.org)위키피디아는 무언가를 소개하고 광고하는 광고판은 아닙니다. 하지만 단기간에 라이브러리가 쏟아져 나왔다는 것은 시대를 정의할 수 있는 하나의 현상으로 볼 수도 있을 것 같았습니다.
그래서 지금의 이 현상을 문서로 기록하고, 지금까지 나온 HWP/HWPX 오픈소스 도구를 정리하여 미디어위키에 올려보았습니다.
오픈소스 HWP/HWPX 처리 도구 목록
HWP(한글 워드프로세서)와 그 후속 포맷인 HWPX는 한국 공공기관과 교육 현장에서 광범위하게 사용되는 문서 형식이다. 한컴오피스 한글이 사실상의 표준으로 자리 잡은 탓에, 오랫동안 이 포맷을 프로그래밍 방식으로 다루려면 Windows 환경에 한컴오피스가 설치되어 있어야 한다는 제약이 따랐다.
2010년대 초반, 김호동이 ruby-hwp, libhwp, evince-hwp 등을 혼자 개발하며 HWP 오픈소스 생태계의 첫 기반을 닦았다. 그러나 2013년, libhwp 사건으로 인해 오픈소스 개발에 환멸을 느끼고 건강 악화까지 겹쳐 모든 프로젝트를 중단하고 떠났다.[1][2] 이후 한동안 이 분야의 오픈소스 활동은 산발적으로만 이어졌다.
2024년을 전후로 상황이 달라졌다. 생성형 AI의 확산과 함께 HWP/HWPX 문서를 AI 파이프라인에 투입하거나 자동화 도구로 처리하려는 수요가 급증했다. 이에 따라 한컴오피스 없이 동작하는 오픈소스 도구들이 단기간에 다수 등장했으며, Python·Rust·TypeScript 등 다양한 언어로 구현된 라이브러리, CLI, MCP 서버, 웹 에디터에 이르기까지 그 형태도 다양해졌다.
아래 표는 현재 공개된 주요 HWP/HWPX 오픈소스 도구를 정리한 것이다.
(정리된 표는 미디어위키 링크를 참고하실 수 있습니다.)
김호동 님께
2013년, 한 개발자가 혼자서 ruby-hwp, libhwp, evince-hwp 등 한글 파일을 오픈소스로 다루는 거의 모든 기반을 닦으셨습니다. libhwp 사건으로 인해 오픈소스 개발에 환멸을 느끼고 건강 악화까지 겹쳐 프로젝트를 닫고 떠났습니다. 이 문서에 나열된 도구들이 존재할 수 있었던 건, 호동님께서 먼저 가능성을 보고 길을 열어주셨기 때문입니다. 이 문서는 그 선구적인 작업에 경의를 표하고자 만들었습니다.