26P by shuggie | ★ favorite | 댓글 10개

위키피디아는 무언가를 소개하고 광고하는 광고판은 아닙니다. 하지만 단기간에 라이브러리가 쏟아져 나왔다는 것은 시대를 정의할 수 있는 하나의 현상으로 볼 수도 있을 것 같았습니다.

그래서 지금의 이 현상을 문서로 기록하고, 지금까지 나온 HWP/HWPX 오픈소스 도구를 정리하여 미디어위키에 올려보았습니다.


오픈소스 HWP/HWPX 처리 도구 목록

HWP(한글 워드프로세서)와 그 후속 포맷인 HWPX는 한국 공공기관과 교육 현장에서 광범위하게 사용되는 문서 형식이다. 한컴오피스 한글이 사실상의 표준으로 자리 잡은 탓에, 오랫동안 이 포맷을 프로그래밍 방식으로 다루려면 Windows 환경에 한컴오피스가 설치되어 있어야 한다는 제약이 따랐다.

2010년대 초반, 김호동이 ruby-hwp, libhwp, evince-hwp 등을 혼자 개발하며 HWP 오픈소스 생태계의 첫 기반을 닦았다. 그러나 2013년, libhwp 사건으로 인해 오픈소스 개발에 환멸을 느끼고 건강 악화까지 겹쳐 모든 프로젝트를 중단하고 떠났다.[1][2] 이후 한동안 이 분야의 오픈소스 활동은 산발적으로만 이어졌다.

2024년을 전후로 상황이 달라졌다. 생성형 AI의 확산과 함께 HWP/HWPX 문서를 AI 파이프라인에 투입하거나 자동화 도구로 처리하려는 수요가 급증했다. 이에 따라 한컴오피스 없이 동작하는 오픈소스 도구들이 단기간에 다수 등장했으며, Python·Rust·TypeScript 등 다양한 언어로 구현된 라이브러리, CLI, MCP 서버, 웹 에디터에 이르기까지 그 형태도 다양해졌다.

아래 표는 현재 공개된 주요 HWP/HWPX 오픈소스 도구를 정리한 것이다.


(정리된 표는 미디어위키 링크를 참고하실 수 있습니다.)


김호동 님께

2013년, 한 개발자가 혼자서 ruby-hwp, libhwp, evince-hwp 등 한글 파일을 오픈소스로 다루는 거의 모든 기반을 닦으셨습니다. libhwp 사건으로 인해 오픈소스 개발에 환멸을 느끼고 건강 악화까지 겹쳐 프로젝트를 닫고 떠났습니다. 이 문서에 나열된 도구들이 존재할 수 있었던 건, 호동님께서 먼저 가능성을 보고 길을 열어주셨기 때문입니다. 이 문서는 그 선구적인 작업에 경의를 표하고자 만들었습니다.

댓글과 토론

위키 문서가 왜 사라졌을까요?

찾아보니 김호동님 2019년에도 스트레스 엄청 받으신 것 같네요. 글 읽어보니 진상 및 양아치 같은 사람들이 너무 많았네요. (지금도 있겠죠?)
https://hamonikr.org/Free_Board/63139

다른 쪽 얘기도 들어봐야 된다고 봅니다.

많이 알려져 있는데요. 2011년, 2013년, 2016년, 2019년, 같은 사람에게 비슷한 일이 일어납니다. 이 분은 계속해서 프로젝트 중단 심지어 오픈소스 중단을 선언하고 프로젝트에 버그리포트를 했던 사람들에게 비난을 하고, 얼마 지난 후 다시 시작하기를 여러차례 반복합니다. 본인 검색을 열심히 하시는지 온갖 게시판과 위키를 가리지 않고 관련 얘기가 있는 곳마다 키워질을 합니다. (여기에도 이 댓글을 보고 들어오실 수도 있습니다.)

개발자니까 말을 믿어주고 이해해 주는 게 맞을까요?

댓글 감사드립니다. 그런 일들이 있었군요. 제가 본 것이 전부가 아니겠네요. 다른 시각의 정보 주셔서 다시 한번 감사드립니다.

기존코드가 남아있으니 어떤 구현인지는 직접 확인이 가능합니다.
https://gitlab.com/sebuls/libhwp

와 2020년도에 봤었을 때는 hwp를 다룰 수 있는 라이브러리가 많지 않았는데 최근에 폭발적으로 늘어났군요

libhwp가 결정적인 이유라기 보다는 쓰레기집단이 더 문제였는데요. 주어없습니다 보고 열받으면 그건 너가