# pdfsandwich - 이미지와 OCR을 샌드위치한 PDF 파일 만드는 도구

> Clean Markdown view of GeekNews topic #5334. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=5334](https://news.hada.io/topic?id=5334)
- GeekNews Markdown: [https://news.hada.io/topic/5334.md](https://news.hada.io/topic/5334.md)
- Type: news
- Author: [xguru](https://news.hada.io/@xguru)
- Published: 2021-11-07T09:54:01+09:00
- Updated: 2021-11-07T09:54:01+09:00
- Original source: [tobias-elze.de](http://www.tobias-elze.de/pdfsandwich/)
- Points: 14
- Comments: 0

## Topic Body

- "sandwich" PDF : 이미지 만 있는 PDF파일을 OCR하여 텍스트를 각 페이지의 이미지 뒤에 안 보이게 삽입한 파일

ㅤ→ 글 검색 및 선택해서 복사 가능

- 커맨드 라인 도구로 스캔한 책이나 잡지를 OCR하는데 사용

ㅤ→ 멀티컬럼 텍스트도 지원

- tesseract + unpaper + convert + ghostscript

ㅤ→ tesseract 가 지원하는 언어들 다 지원(한국어 포함)

- 리눅스/맥. 멀티프로세서 시스템에서 병렬처리 지원

## Comments



_No public comments on this page._
