▲브라우저에서 PDF와 이미지 OCR 직접 실행하기 (simonwillison.net)22P by xguru 2024-04-03 | ★ favorite | 댓글과 토론 Tesseract.js 를 이용하여 이미지와 PDF 파일의 내용을 직접 읽어냄 서버없이 브라우저에서만 실행되어 데이터가 외부로 전혀 나가지 않음 이 코드는 Claude 3 Opus 와 GPT-4 를 이용해서 작성됨 : 기본 코드와 Prompt 들도 같이 공개 함께 보면 좋은 글 β Tesseract.js - Tesseract OCR 엔진의 자바스크립트 포팅 버전 Tesseract.js v3.0 릴리즈 gifcap - 브라우저에서 화면을 GIF로 녹화하기 Image-Table-OCR - 표 이미지를 CSV로 변환 pdfsandwich - 이미지와 OCR을 샌드위치한 PDF 파일 만드는 도구 인증 이메일 클릭후 다시 체크박스를 눌러주세요