1P by neo 9달전 | favorite | 댓글 1개

원본 WWW 제안서 파일 열기 시도

  • W3C 웹사이트에는 팀 버너스 리(Tim Berners-Lee)가 작성한 원본 WWW 제안서가 있음.
  • 제안서의 원본 파일은 Macintosh 4.0 용 워드 파일로, 1990년에 작성된 것으로 추정됨.
  • 원본 문서는 68,608 바이트 크기이며, Mac에서 파일 유형을 확인한 결과 Microsoft Word for Macintosh 4.0 파일로 나타남.

다양한 소프트웨어로 열기 시도

  • Microsoft Word: 원본 파일을 OneDrive에 업로드하고 .doc 확장자로 Microsoft Word에서 열어봄.
  • Apple Pages: 오래된 Microsoft Word for Macintosh 파일을 이해하지 못함.
  • Apache OpenOffice: 파일을 열 수 있으나 포맷이 사라지고 다이어그램이 누락됨.
  • LibreOffice: 파일을 열고 다이어그램도 선명하게 보임, 그러나 여백과 다른 포맷 문제가 있음.

CERN PDF와 LibreOffice 생성 PDF 비교

  • CERN에서 제공하는 PDF는 1998년에 생성된 것으로, 20페이지 분량임.
  • LibreOffice로 가져온 버전은 24페이지임.
  • 두 PDF를 비교했을 때, 여백, 폰트 크기, 헤더와 푸터, 페이지 분할 등에서 차이가 있음.

에뮬레이션을 통한 원본 문서 확인

  • 1990년대 매킨토시를 에뮬레이션하여 실제 Word for Macintosh 4.0을 실행시켜 원본 문서의 모습을 확인함.
  • 원본 문서와 CERN PDF는 상당히 다르며, 원본 문서는 A4 용지에 22페이지로 나타남.

결론

  • 원본 문서를 현대 소프트웨어로 변환하는 것은 오픈 소스 소프트웨어에 대한 승리이자 문서 보존의 어려움을 보여줌.
  • 문서를 보존하고자 .odt 버전을 GitHub에 업로드함.
  • 34년 된 문서가 여전히 열기 어렵고, 열었을 때도 원본과 정확히 같지 않다는 사실이 다소 실망스러움.

GN⁺의 의견

  • 이 블로그 포스트는 원본 WWW 제안서 문서의 디지털 보존과 접근성에 대한 중요성을 강조함.
  • 오픈 소스 소프트웨어가 오래된 문서 형식을 다루는 데 얼마나 중요한 역할을 하는지 보여줌.
  • 문서 보존의 어려움을 이해하고, 기술의 발전에 따라 호환성과 장기적 접근성을 고려하는 것의 중요성을 인식하는 계기가 됨.
Hacker News 의견
  • 현대 Word 형식으로 변환된 문서 공유

    • 현대 Word 형식의 문서가 공유되었으며, 모든 벡터 아트워크와 폰트가 유지되어 있음.
    • 문서를 변환하기 위해 QEMU로 에뮬레이트된 Power Mac에서 실행되는 Word 98을 사용하여 처음 열고 다시 저장함.
    • 그러나 이미지가 누락되었으며, Word는 이미지를 표시하거나 인쇄할 충분한 메모리나 디스크 공간이 없다고 주장함.
    • 이미지를 복원하기 위해 Word 98에서 Acrobat을 사용하여 PDF로 인쇄한 후, Adobe Illustrator를 사용하여 각 이미지를 별도의 PDF로 추출함.
    • 원본 이미지를 삭제하고 Finder에서 PDF 대체물을 드래그 앤 드롭하여 이미지를 복원하는 것은 간단한 일이었음.
    • 비교를 위해 Power Mac에서 Word 98로 만든 PDF와 macOS Sonoma에서 실행되는 현대 Word로 만든 PDF가 공유됨.
  • 폰트와 레이아웃 확인

    • 원본 폰트가 있어야 문서가 어떻게 보여야 하는지 확인할 수 있음.
    • Word 4.0은 다른 출력 해상도를 위해 화면과 프린터용 폰트 파일을 별도로 가지고 있었음.
    • 프린터 폰트가 누락되면 화면 폰트의 스케일된 렌더링을 인쇄하고, 화면 폰트가 누락되면 시스템 폰트로 대체됨.
    • 이 경우에는 잘 알려진 Palatino와 Courier 폰트가 필요했지만, LibreOffice는 Palatino Linotype가 설치되어 있음에도 Times New Roman으로 대체함.
  • file 명령어의 유용성

    • file 명령어는 파일에 대한 궁금증을 해결하고 유용한 정보를 제공하는 데 매우 유용함.
  • LibreOffice의 우수한 구형 문서 파일 형식 지원

    • LibreOffice는 구형 문서 파일 형식을 아주 잘 지원하여, 이를 위해 사용함.
    • BasiliskII와 InfiniteMac 에뮬레이터 사용도 즐거움.
  • Microsoft Word의 역호환성

    • Windows 버전의 Word에서 파일이 대부분 잘 열리며, 레이아웃이 기사의 PDF와 동일함.
    • 그래픽 필터가 누락되어 이미지를 열 수 없었으나, Word 2003에서는 열릴 수 있을 것으로 예상됨.
  • LibreOffice의 놀라운 기능

    • LibreOffice는 다양한 문서 형식을 열 수 있을 뿐만 아니라, 명령줄 옵션을 통해 자동화 작업을 수행할 수 있음.
  • 에뮬레이터에서의 문서 인쇄

    • Mac 4.0을 실행하는 에뮬레이터에서는 .ps(Postscript) 파일을 생성할 수 있는 인쇄 큐를 설치할 수 있으며, 이를 PDF로 변환할 수 있음.
  • Microsoft Word의 문서 호환성에 대한 실망

    • Microsoft Word가 어떤 버전의 Word로 만들어진 문서든지 열 수 있어야 한다는 책임감을 Microsoft가 가져야 한다는 의견.
    • 취약점에 대한 우려가 있다면, 외부 프로세스에서 격리된 샌드박스에서 실행하여 새로운 버전으로 변환하는 기능을 제공해야 함.
  • 무한 보존 백업의 잠재적 문제

    • 일부 회사는 무한 보존 백업을 가지고 있으며, 이는 "읽을 수 있는" 것과 "사용할 수 있는" 것 사이의 차이를 이해하지 못하는 문제를 야기함.
  • 구형 Mac과 Word 사용

    • System 7.1 Mac SE/30이 있으며, Word 5가 설치되어 있음. 문서를 보내면 Office 2001로 업그레이드하는 데 도움을 줄 수 있음.