GN⁺ 2024-05-14 | parent | ★ favorite | on: 페이지 왜곡 보정 기술 (mzucker.github.io)
Hacker News 의견

요약:

  • 이미지 이진화 시 높은 임계값 적용에 주의해야 함
    • 일반 텍스트에는 잘 동작하지만, 삽화나 각주 등이 읽을 수 없을 정도로 훼손될 수 있음
    • Google Books 스캔이 유일한 경우 운이 나쁠 수 있음
  • 2024년인데도 문서 스캐너 앱에 이 기능이 내장되어 있지 않음
  • Adobe 전 CEO John Warnock은 희귀 역사 서적 보존에 힘썼음
    • 펼칠 수 없는 스캔 페이지의 de-curling이 과제였음
    • 관련 프로젝트: Rare Book Room
  • 이 글은 기술 프로젝트와 결정을 효과적으로 문서화하는 방법의 예시로 직장에서 참고할 만함
  • 대학 시절 색상 코딩된 노트 스캔 앱을 만들다 색상 왜곡 문제에 부딪힘
    • 페이지 상단과 하단의 색상이 달라 파란색과 초록색 펜 구분이 어려웠음
  • 결과물이 적절해 보이나, warp 모델이 다소 전역적임
    • 종이의 복잡한 왜곡을 모두 포착하지 못해 최종 결과에 잔류 왜곡이 보임
  • 2016년에 못 봐서 아쉬웠던 흥미로운 글
    • 문제 정의, 스마트한 기법 적용, 잘 동작하는 솔루션 도출의 전 과정이 잘 서술됨
    • 직접 사용할 일은 없겠지만 문제 해결 과정의 훌륭한 예시
  • 설치 오류 발생, GitHub 이슈 등록함
  • 영수증 de-wrinkling도 해보면 좋겠음
  • OCR만 필요하다면 이 단계를 건너뛸 수 있을 것
  • Google은 10년 전에 이미 이 문제를 해결함
  • 가치 있는 책고문서라면 X선 단층촬영으로 비접촉식 de-warping 가능