GN⁺: 1990년 Word for Macintosh 4 파일로 된 원래 WWW 제안서, 열어볼 수 있을까?
(blog.jgc.org)원본 WWW 제안서 파일 열기 시도
- W3C 웹사이트에는 팀 버너스 리(Tim Berners-Lee)가 작성한 원본 WWW 제안서가 있음.
- 제안서의 원본 파일은 Macintosh 4.0 용 워드 파일로, 1990년에 작성된 것으로 추정됨.
- 원본 문서는 68,608 바이트 크기이며, Mac에서 파일 유형을 확인한 결과 Microsoft Word for Macintosh 4.0 파일로 나타남.
다양한 소프트웨어로 열기 시도
- Microsoft Word: 원본 파일을 OneDrive에 업로드하고 .doc 확장자로 Microsoft Word에서 열어봄.
- Apple Pages: 오래된 Microsoft Word for Macintosh 파일을 이해하지 못함.
- Apache OpenOffice: 파일을 열 수 있으나 포맷이 사라지고 다이어그램이 누락됨.
- LibreOffice: 파일을 열고 다이어그램도 선명하게 보임, 그러나 여백과 다른 포맷 문제가 있음.
CERN PDF와 LibreOffice 생성 PDF 비교
- CERN에서 제공하는 PDF는 1998년에 생성된 것으로, 20페이지 분량임.
- LibreOffice로 가져온 버전은 24페이지임.
- 두 PDF를 비교했을 때, 여백, 폰트 크기, 헤더와 푸터, 페이지 분할 등에서 차이가 있음.
에뮬레이션을 통한 원본 문서 확인
- 1990년대 매킨토시를 에뮬레이션하여 실제 Word for Macintosh 4.0을 실행시켜 원본 문서의 모습을 확인함.
- 원본 문서와 CERN PDF는 상당히 다르며, 원본 문서는 A4 용지에 22페이지로 나타남.
결론
- 원본 문서를 현대 소프트웨어로 변환하는 것은 오픈 소스 소프트웨어에 대한 승리이자 문서 보존의 어려움을 보여줌.
- 문서를 보존하고자 .odt 버전을 GitHub에 업로드함.
- 34년 된 문서가 여전히 열기 어렵고, 열었을 때도 원본과 정확히 같지 않다는 사실이 다소 실망스러움.
GN⁺의 의견
- 이 블로그 포스트는 원본 WWW 제안서 문서의 디지털 보존과 접근성에 대한 중요성을 강조함.
- 오픈 소스 소프트웨어가 오래된 문서 형식을 다루는 데 얼마나 중요한 역할을 하는지 보여줌.
- 문서 보존의 어려움을 이해하고, 기술의 발전에 따라 호환성과 장기적 접근성을 고려하는 것의 중요성을 인식하는 계기가 됨.
Hacker News 의견
-
현대 Word 형식으로 변환된 문서 공유
- 현대 Word 형식의 문서가 공유되었으며, 모든 벡터 아트워크와 폰트가 유지되어 있음.
- 문서를 변환하기 위해 QEMU로 에뮬레이트된 Power Mac에서 실행되는 Word 98을 사용하여 처음 열고 다시 저장함.
- 그러나 이미지가 누락되었으며, Word는 이미지를 표시하거나 인쇄할 충분한 메모리나 디스크 공간이 없다고 주장함.
- 이미지를 복원하기 위해 Word 98에서 Acrobat을 사용하여 PDF로 인쇄한 후, Adobe Illustrator를 사용하여 각 이미지를 별도의 PDF로 추출함.
- 원본 이미지를 삭제하고 Finder에서 PDF 대체물을 드래그 앤 드롭하여 이미지를 복원하는 것은 간단한 일이었음.
- 비교를 위해 Power Mac에서 Word 98로 만든 PDF와 macOS Sonoma에서 실행되는 현대 Word로 만든 PDF가 공유됨.
-
폰트와 레이아웃 확인
- 원본 폰트가 있어야 문서가 어떻게 보여야 하는지 확인할 수 있음.
- Word 4.0은 다른 출력 해상도를 위해 화면과 프린터용 폰트 파일을 별도로 가지고 있었음.
- 프린터 폰트가 누락되면 화면 폰트의 스케일된 렌더링을 인쇄하고, 화면 폰트가 누락되면 시스템 폰트로 대체됨.
- 이 경우에는 잘 알려진 Palatino와 Courier 폰트가 필요했지만, LibreOffice는 Palatino Linotype가 설치되어 있음에도 Times New Roman으로 대체함.
-
file
명령어의 유용성-
file
명령어는 파일에 대한 궁금증을 해결하고 유용한 정보를 제공하는 데 매우 유용함.
-
-
LibreOffice의 우수한 구형 문서 파일 형식 지원
- LibreOffice는 구형 문서 파일 형식을 아주 잘 지원하여, 이를 위해 사용함.
- BasiliskII와 InfiniteMac 에뮬레이터 사용도 즐거움.
-
Microsoft Word의 역호환성
- Windows 버전의 Word에서 파일이 대부분 잘 열리며, 레이아웃이 기사의 PDF와 동일함.
- 그래픽 필터가 누락되어 이미지를 열 수 없었으나, Word 2003에서는 열릴 수 있을 것으로 예상됨.
-
LibreOffice의 놀라운 기능
- LibreOffice는 다양한 문서 형식을 열 수 있을 뿐만 아니라, 명령줄 옵션을 통해 자동화 작업을 수행할 수 있음.
-
에뮬레이터에서의 문서 인쇄
- Mac 4.0을 실행하는 에뮬레이터에서는 .ps(Postscript) 파일을 생성할 수 있는 인쇄 큐를 설치할 수 있으며, 이를 PDF로 변환할 수 있음.
-
Microsoft Word의 문서 호환성에 대한 실망
- Microsoft Word가 어떤 버전의 Word로 만들어진 문서든지 열 수 있어야 한다는 책임감을 Microsoft가 가져야 한다는 의견.
- 취약점에 대한 우려가 있다면, 외부 프로세스에서 격리된 샌드박스에서 실행하여 새로운 버전으로 변환하는 기능을 제공해야 함.
-
무한 보존 백업의 잠재적 문제
- 일부 회사는 무한 보존 백업을 가지고 있으며, 이는 "읽을 수 있는" 것과 "사용할 수 있는" 것 사이의 차이를 이해하지 못하는 문제를 야기함.
-
구형 Mac과 Word 사용
- System 7.1 Mac SE/30이 있으며, Word 5가 설치되어 있음. 문서를 보내면 Office 2001로 업그레이드하는 데 도움을 줄 수 있음.