MegaParse - 모든 유형의 문서를 위한 파서
(github.com/QuivrHQ)- LLM를 이용하여 다양한 문서를 손쉽게 처리할 수 있는 강력하고 유연한 오픈소스 파서
- OpenAI 또는 Anthropic API 키 필요
- 텍스트, PDF, 파워포인트, 워드 문서를 포함한 다양한 문서 형식을 지원하며, 정보 손실 없이 데이터를 유지하는 것을 목표로 함
- 높은 속도와 효율성을 중심으로 설계
- 파일 지원 : 텍스트, PDF, 파워포인트, 엑셀, CSV, 워드 문서 지원
- 콘텐츠 지원 : 테이블, TOC(목차), 헤더, 푸터, 이미지
- 완전 무료 및 오픈소스로 자유롭게 사용 가능