Documind - PDF 문서를 구조화된 데이터로 전환하는 오픈소스 AI 도구
(github.com/DocumindHQ)- PDF 변환, 정보 추출, 결과를 사용자가 지정한 스키마에 따라 포맷팅하는 기능을 제공
- PDF를 이미지로 변환 하여 세부적인 AI 처리를 가능하게 함
- OpenAI의 API를 활용하여 정보를 추출하고 구조화
- 다양한 문서 형식에 대한 추출 스키마를 사용자 정의 가능
- 로컬 및 클라우드 환경 모두에서 유연하게 배포 가능하도록 설계됨
- Zerox 기반으로 개발됨
아무튼 오픈소스이긴 한데 요즘 AI 달리기만 해서, 라이트하고 무료로 사용할 수 있는 도구들이 잘 나오지 않아서 아쉬울 따름이네요...