52년 된 데이터 테이프, 유닉스 역사 담고 있을 가능성
(theregister.com)- 미국 유타대학교 저장고에서 1973년 벨 연구소의 UNIX V4 테이프가 발견되어, 초창기 유닉스의 원본 데이터를 복원할 가능성 제기
- 이 버전은 커널과 핵심 유틸리티가 처음으로 C 언어로 작성된 유닉스로, 현재까지 완전한 사본이 알려지지 않은 희귀 자료
- 테이프에는 “UNIX Original From Bell Labs V4”라는 손글씨 라벨이 붙어 있으며, 필체는 고(故) 제이 르프로 교수의 것으로 확인
- 발견된 테이프는 ‘유타 티팟(Teapot)’의 발명자 마틴 뉴웰이 AT&T로부터 받은 원본으로, 현재 컴퓨터역사박물관(CHM)으로 이송 준비 중
- CHM의 Al Kossow가 복원 작업을 담당하며, 아날로그-디지털 변환 장비로 데이터를 읽어낼 계획으로, 초기 유닉스 연구 복원에 중요한 자료로 평가됨
유닉스 V4 테이프의 발견
- 유타대학교 컴퓨팅학부 저장실을 정리하던 중 벨 연구소의 UNIX V4(1973) 라벨이 붙은 9트랙 테이프 릴이 발견됨
- 라벨에는 “UNIX Original From Bell Labs V4 (See Manual for format)”라는 문구가 수기로 적혀 있음
- 필체는 2008년 사망한 교수 제이 르프로(Jay Lepreau) 의 것으로, 그의 제자 로버트 리치 교수가 확인
- 리치는 Mastodon을 통해 발견 사실을 공개했으며, 완전한 사본이 존재하지 않는 것으로 알려진 버전이라고 설명
- 이 테이프는 컴퓨터역사박물관(Computer History Museum, CHM) 으로 직접 운반될 예정
유닉스 V4의 역사적 의미
- UNIX V4는 커널과 일부 핵심 유틸리티가 C 언어로 처음 재작성된 버전으로, 유닉스 발전사에서 중요한 전환점
- 현재까지 남아 있는 것은 이전 버전 커널 일부 소스 코드, 몇 개의
man페이지, 그리고 1973년 11월자 프로그래머 매뉴얼뿐임 - 따라서 이번 발견은 초기 C 기반 유닉스의 완전한 복원 가능성을 여는 자료로 평가됨
테이프의 출처와 관련 인물
- 추가 조사 결과, 이 테이프는 마틴 뉴웰(Martin Newell) 이 AT&T로부터 받은 것으로 확인
- 뉴웰은 컴퓨터 그래픽스 분야에서 유명한 ‘유타 티팟(Teapot)’의 발명자로, 이는 Windows NT OpenGL 스크린세이버에도 등장
- 리치는 이 사실을 추가로 공개하며, 테이프의 역사적 가치가 더욱 높아졌음을 언급
복원 계획과 기술적 접근
- CHM의 소프트웨어 사서 Al Kossow가 복원 작업을 담당
- 그는 헤드 리드 증폭기를 테이핑하고, 다중 채널 고속 아날로그-디지털 변환기를 사용해 데이터를 약 100GB RAM으로 덤프한 뒤,
Len Shustek이 작성한 분석 프로그램(readtape)으로 처리할 계획 - 테이프는 1970년대 1200피트 길이의 3M 9트랙 테이프로, 복원 가능성이 높다고 평가됨
- 그는 헤드 리드 증폭기를 테이핑하고, 다중 채널 고속 아날로그-디지털 변환기를 사용해 데이터를 약 100GB RAM으로 덤프한 뒤,
- Kossow는 이 프로젝트를 우선순위 상위로 올려 복원 작업을 추진 중이라고 언급
발견의 의의
- 이번 발견은 초기 유닉스의 기술적 진화 과정을 복원할 수 있는 드문 기회로 평가됨
- CHM과 Bitsavers 팀이 협력해 복원 작업을 진행 중이며, 오픈소스 및 컴퓨터 역사 보존 커뮤니티의 주목을 받고 있음
- The Register는 이 귀중한 자료가 “더 나은 손에 맡겨질 수는 없을 것” 이라며 복원 성공에 기대를 표함
Hacker News 의견
-
테이프 내용에는 간단한 할 일 목록이 있었음
예를 들어 Emacs 종료를 더 쉽게 만들기, 임시 디렉터리 이름을 바꾸기 같은 것들이었음. 기존 이름인 bin이나 dev는 의미가 혼동되어 좀 웃긴 느낌이었음- 나는 bin과 dev의 모호함이 오히려 마음에 듦
Unix에는 cat, man, more/less 같은 말장난이 많음. 다만 etc는 좀 이상하게 느껴짐
- 나는 bin과 dev의 모호함이 오히려 마음에 듦
-
컴퓨터 분야가 과거를 거의 망각하는 게 안타까움
고대 무기나 갈릴레오의 실험은 복원하고 연구하지만, 60~70년대 해커들의 업적은 잊히는 중임. 그 시절의 제약된 환경에서 배울 게 많을 텐데 말임- 영화 산업도 비슷함. 보존 체계가 거의 없어서 고전 영화들이 불타거나 사라짐
어떤 전설적인 미국 무성 영화는 스페인 도서관에서 우연히 발견되어 복원되기도 했음. 예술가나 기업이 현재에만 집중하고 과거 작품을 역사로 보지 않는 듯함 - 나는 반대 의견임. 레트로 컴퓨팅과 데모 씬에 대한 관심이 여전히 큼
90년대 아케이드 기계의 암호 해제나 고전 게임의 비트 단위 복원 같은 프로젝트가 활발함 - 사실 모든 분야가 비슷함. 과거의 대부분은 우연히 보존된 것뿐임
피라미드나 고대 유물도 비용이나 공간 제약이 없었다면 다 사라졌을 것임 - 컴퓨터 분야는 아직 너무 젊음
고고학자들이 다루는 건 수백, 수천 년 전의 물건임. 몇 세기 후에는 Unix 같은 발명도 역사적 가치를 인정받을 것임 - 나는 또 다른 반대 의견임. 이미 많은 사람들이 컴퓨팅 역사 보존에 엄청난 노력을 들이고 있음
- 영화 산업도 비슷함. 보존 체계가 거의 없어서 고전 영화들이 불타거나 사라짐
-
나는 1982년부터의 테이프를 읽을 수 있는 9트랙 CCT 리더/라이터를 가지고 있음
1973년 테이프가 9트랙이라 놀랐지만, 헤드를 불법이 된 세정액으로 청소하니 모든 데이터가 완벽히 복구되었음. DEC 미니컴퓨터 등 여러 시스템의 테이프였음- 9트랙 전환은 IBM 360이 8비트 바이트를 도입한 1964년에 이루어졌음
- 그 “불법 세정액”이 뭔지 궁금함. 왜 금지됐는지, 그리고 복구한 데이터를 디지털 고고학 목적으로 공개할 계획이 있는지도 궁금함
-
정말 놀라운 발견임. 이 소스에서 Unix v4를 에뮬레이션해 컴파일하고 실행할 수 있다면 멋질 것임
-
SIMH가 PDP-11을 포함한 여러 초기 미니/마이크로컴퓨터를 에뮬레이션함
TUHS 메일링리스트에서는 1972년 버전의 Unix 소스를 복원해 실행하기도 했음
관련 GitHub 저장소 참고 - 만약 이 초기 버전들에 스파이웨어나 광고 코드가 숨어 있었다면 정말 충격적일 것 같음
- “그걸로 뭘 하려는 거냐”는 질문도 있었음
-
SIMH가 PDP-11을 포함한 여러 초기 미니/마이크로컴퓨터를 에뮬레이션함
-
원본 토론 스레드는 discuss.systems의 글에 있음
- 그 글과 후속 댓글, 그리고 TUHS의 논의도 기사에 함께 링크해 두었음
-
나는 학부 시절 UNIVAC UNISERVO II 강철 테이프에 컴파일러 프로젝트를 저장해 두었음
8트랙(6비트 데이터, 1비트 패리티, 1비트 클록) 구조였고, 지금은 읽을 수 있는 드라이브가 없을 듯함. 그래도 물리적으로는 아직 멀쩡할 것 같음- 하지만 읽으려 시도하는 순간 손상될 위험이 있음
-
멋진 발견임. 이건 달 탐사 테이프가 사라졌던 시기와 비슷함. 조금만 더 찾아보면 더 나올지도 모름
-
IBM Tucson 테이프 연구소가 챌린저호의 테이프 데이터를 복구했었음
52년 된 테이프도 충분히 복구 가능할 것이라 생각함 -
“오, 이건 내 기사임. 고마워, Ricardo!”
-
SIMH-classic 버전이라면 확실히 실행 가능함
상용화된 v4 버전은 잊고, 오픈 버전을 쓰는 게 좋음