# Documind - PDF 문서를 구조화된 데이터로 전환하는 오픈소스 AI 도구

> Clean Markdown view of GeekNews topic #17878. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=17878](https://news.hada.io/topic?id=17878)
- GeekNews Markdown: [https://news.hada.io/topic/17878.md](https://news.hada.io/topic/17878.md)
- Type: news
- Author: [xguru](https://news.hada.io/@xguru)
- Published: 2024-11-21T10:21:02+09:00
- Updated: 2024-11-21T10:21:02+09:00
- Original source: [github.com/DocumindHQ](https://github.com/DocumindHQ/documind)
- Points: 26
- Comments: 5

## Summary

Documind는 PDF 문서를 이미지로 변환하여 AI 처리를 통해 정보를 추출하고, 사용자가 지정한 스키마에 따라 데이터를 구조화하는 오픈소스 도구입니다. 이 도구는 OpenAI의 API를 활용하며, 다양한 문서 형식에 대한 사용자 정의 추출 스키마를 지원합니다. 로컬 및 클라우드 환경에서 유연하게 배포할 수 있도록 설계되었습니다.

## Topic Body

- PDF 변환, 정보 추출, 결과를 사용자가 지정한 스키마에 따라 포맷팅하는 기능을 제공  
  - *PDF를 이미지로 변환* 하여 세부적인 AI 처리를 가능하게 함  
- OpenAI의 API를 활용하여 정보를 추출하고 구조화  
- 다양한 문서 형식에 대한 추출 스키마를 사용자 정의 가능  
- 로컬 및 클라우드 환경 모두에서 유연하게 배포 가능하도록 설계됨  
- [Zerox](https://github.com/getomni-ai/zerox) 기반으로 개발됨

## Comments



### Comment 31575

- Author: ng0301
- Created: 2024-11-22T08:51:18+09:00
- Points: 1

아무튼 오픈소스이긴 한데 요즘 AI 달리기만 해서, 라이트하고 무료로 사용할 수 있는 도구들이 잘 나오지 않아서 아쉬울 따름이네요...

### Comment 31570

- Author: iolothebard
- Created: 2024-11-22T02:08:01+09:00
- Points: 1

초첨단 AI기반 소프트웨어가 40년된 Ghostscript에 의존한다니… 미묘하네요 ㅎㅎ

### Comment 31562

- Author: halfenif
- Created: 2024-11-21T14:06:09+09:00
- Points: 2

문자를 pdf로 바꾸고 pdf를 이미지로 바꾸고 이미지를 문자로 바꾸는군요.

### Comment 31555

- Author: curiousotter
- Created: 2024-11-21T11:34:24+09:00
- Points: 1

사내 서비스로 개발중인 서비스인데.. 이게 오픈소스로 나오는군요 ㅎㅎ

### Comment 31599

- Author: rrr6ttt
- Created: 2024-11-22T13:45:17+09:00
- Points: 1
- Parent comment: 31555
- Depth: 1

혹시 회사가 ㅎㅋ 이신가요?
