Herculaneum 두루마리 전체를 처음으로 해독

(scrollprize.org)

1P by GN⁺ 16시간전 | ★ favorite | 댓글 1개

서기 79년 Vesuvius 분화 뒤 열 수 없었던 PHerc. 1667이 물리적으로 펼쳐지지 않은 채 가상으로 복원돼, 보존된 텍스트가 처음부터 끝까지 읽힘
고해상도 X선 스캔과 표면 재구성, 평탄화, 머신러닝 잉크 검출을 결합해 탄화된 두루마리를 읽을 수 있는 페이지로 바꿈
약 1.4m 파피루스와 그리스어 약 22개 열의 하단부가 복원됐고, 내용은 인간 본성·충동·도덕적 진보를 다루는 스토아 윤리학 논문으로 확인됨
PHerc. Paris 4에서는 3D X선 데이터 안의 잉크가 직접 보였고, PHerc. 139에서는 Philodemus, On Gods, Book 8이라는 제목과 저자 표기가 복원됨
단층촬영 데이터, 복원 표면, 전사문, 코드를 공개해 검증과 재현이 가능하며, 아직 봉인된 수백 개 Herculaneum 두루마리에도 같은 접근을 적용할 수 있음

봉인된 두루마리를 열지 않고 읽음

PHerc. 1667은 Vesuvius Challenge 커뮤니티에서 Scroll 4로 불린 Herculaneum 파피루스임
서기 79년 Vesuvius 분화 이후 약 2,000년 동안 봉인돼 있었고, 탄화 때문에 물리적으로 펼치면 파괴될 수 있었음
이번 작업은 두루마리의 페이지를 직접 건드리지 않고 완전한 가상 펼침과 연속 해독을 달성함
공개된 결과물은 약 1.4m 길이의 파피루스 표면과 그리스어 약 22개 열의 텍스트임
preprint PDF, 데이터, GitHub 코드가 함께 공개됨

PHerc. 1667에서 복원된 텍스트

PHerc. 1667은 원래 더 큰 두루마리였지만, 19세기와 1969년 및 1980년대의 수작업 개봉 시도로 바깥층이 파괴됨
남은 부분은 원래 높이 19–24cm 중 약 8cm에 해당하는 조밀한 내부 코어임
연구팀은 보존된 부분에서 약 22개 열의 하단부를 복원했고, 파피루스학자들이 이를 전사·검토함
이번 결과는 단어와 조각이 아니라 보존된 텍스트를 처음부터 끝까지 연속적으로 읽은 첫 사례임

내용과 학술적 식별

복원된 텍스트는 윤리학 철학 논문임
인간 본성, 충동, 인간의 도덕적 진보를 다루는 주제와 언어적 특징, 마지막 보존 열에 등장하는 Aristocreon 이름이 식별 근거가 됨
Aristocreon은 스토아 철학자 Chrysippus의 조카이자 제자로 제시되며, 이 점이 텍스트를 스토아 맥락과 기원전 2세기로 연결함
파피루스 손상으로 표면이 사라진 곳에는 공백이 남아 있어 해독문은 여전히 단편적임
그래도 여러 구절은 2,000년 만에 처음으로 명확히 읽힘
- “우리가 어떤 것을 탐구하겠지만, 어떤 방식으로든 우리 자신과 우리의 본성에서 벗어난다면 그것을 파악하지 못할 것이다…”
- “연구와 배움을 통해 우리 자신을 극한까지 긴장시킨 뒤… 같은 실천적 지혜를 지니며…”
- “그러한 것들이 우리에게 선이라면, 반대되는 악에서도 좋은 것은 없을 것이며—아름다운 것은 더더욱 없고—나쁜 것도 없을 것이며—추한 것은 더더욱 없고—행복도 없을 것이다…”

다른 두루마리에서 나온 검증과 식별

PHerc. Paris 4는 Vesuvius Challenge 커뮤니티에서 Scroll 1로 불리는 두루마리임
더 높은 해상도 영상 기법으로 잉크가 3차원 X선 데이터 안에서 직접 보이는 결과가 처음 나옴
3D로 분할된 잉크를 펼친 페이지에 다시 투영하자, 2023 Grand Prize에서 읽은 텍스트와 일대일로 일치함
이는 더 나은 데이터로 기존 해독이 실제임을 독립적으로 확인한 사례임
PHerc. 139에서는 제목 영역의 잉크 신호를 강화해 제목과 저자 표기를 복원함
- 식별된 작품은 Philodemus, On Gods, Book 8
- 닫힌 두루마리의 제목을 읽으면 본문 열을 연구하기 전에도 어떤 작품인지 알 수 있음

사용된 기술과 공개 방식

스캔은 Grenoble의 European Synchrotron Radiation Facility BM18 빔라인에서 고해상도 위상대비 X선 마이크로단층촬영으로 획득됨
이 장비는 Herculaneum 두루마리의 얇고 조밀하게 쌓인 층을 분해해 볼 수 있음
작업은 Herculaneum 파피루스를 보관하는 National Library of Naples “Vittorio Emanuele III”와 협력해 수행됨
처리 과정은 네 단계로 구성됨
- 두루마리 내부의 기하 구조를 재구성함
- 표면을 추적해 읽을 수 있는 시트로 평탄화함
- 탄화된 파피루스와 거의 구분되지 않는 잉크를 탐지하도록 머신러닝 모델을 학습함
- 각 해독 결과를 파피루스학자들이 검토하고 전사함
단층촬영 데이터, 재구성 표면, 전사문은 Creative Commons 라이선스로 scrollprize.org/data에 공개되고 ESRF에 보관됨
코드는 GitHub에 공개돼 있어 검증과 다른 두루마리 적용이 가능함

공개 과학과 다음 단계

Herculaneum 두루마리의 가상 펼침은 EduceLab의 Brent Seales 교수가 개척함
2023년 Seales는 자신의 연구실 영상·소프트웨어 기술을 Vesuvius Challenge에 공개함
Vesuvius Challenge는 Brent Seales, Nat Friedman, Daniel Gross가 공동 창립한 공개·기부 기반 프로젝트임
first letters와 2023 Grand Prize는 전 세계 참가자들이 차지함
현재 Vesuvius Challenge 연구팀의 다수는 처음에 참가자로 합류했고, 공개 경쟁에서 돌파구를 만들어 상을 받은 뒤 연구팀에 합류함
아직 봉인된 Herculaneum 두루마리는 수백 개 남아 있으며, 철학·시·산문으로 구성된 전체 도서관이 고대 이후 처음 읽히기를 기다리고 있음
참여 경로는 공개돼 있음
- preprint PDF로 과학적 내용을 확인
- scrollprize.org/data와 GitHub에서 데이터와 코드 확보
- get started에서 커뮤니티 참여 시작

GN⁺ 16시간전 [-]

Hacker News 의견들

기원전 200년쯤 Aristocreon이 두루마리에 생각을 적던 장면을 떠올리게 됨
그 두루마리가 도서관에 한동안 보관될 수 있다는 정도는 알았겠지만, 300년 뒤 화산이 두루마리를 파괴하면서도 어떤 방식으로 보존하고, 거의 2천 년 뒤 모래와 번개에서 먼 친척쯤 되는 재료로 만든 기계를 가진 미래 인류가 다시 읽어 전 지구에 즉시 전송하리라고는 상상 못 했을 것임
당시에는 지구가 구형이라는 사실이 비교적 최근에 증명됐지만, 아직 세계의 많은 부분은 미지였음. 지금의 우리는 더 나은 상상력을 가졌을까? SF 작가들이 지금 우리가 아는 것에서 그만큼 아득히 먼 무언가를 상상할 수 있을까?
- 가장 먼저 떠오른 건, 가까운 미래에 양자 컴퓨팅으로 깨질 가능성을 기대하며 암호화된 데이터를 수집하는 사람들임
- 인간 자체는 크게 달라지지 않았으니, 상상력이 지식의 영향을 받는다면 지금이 더 나을 수 있고, 고정된 능력이라면 아닐 수도 있음
  현대인의 시력이 그 시대와 다르진 않지만, 지금은 거의 모두가 글을 읽고 그때는 이런 두루마리를 읽을 수 있는 사람이 극히 적었음. SF는 충분히 현기증 날 만큼 낯선 미래를 만들어냄. Greg Egan의 Orthogonal 시리즈처럼 공간 3차원과 시간 1차원이 다르게 배치된 우주를 다루는 하드 SF도 있고, 더 평범하게 인간 사회의 연장선에 있는 미래라면 Vinge의 Rainbows End부터 Stross의 먼 미래 작품들까지 많음
- 굳이 기원전 200년까지 갈 필요도 없음. 1700년쯤만 되어도 이 이야기는 상상하기 어려웠을 것임
  1800년대라면 적어도 “전기” 부분은 이해할 수 있었을 듯함
- 그 정도로 상응하는 상상을 해낼 수는 없을 것 같음. 현실은 언제나 소설보다 이상하기 때문임
- Jacquard 직기가 첫 프로그램을 돌린 뒤로는 완전히 다른 행성에 가까워졌음
  어쩌면 인쇄기가 첫 인쇄를 했던 시점부터 이미 그랬을지도 모름
Vesuvius Challenge 팀에서 분할, 펼치기, 잉크 검출을 맡았음. 질문 있으면 답할 수 있음
- 지금 기분이 얼마나 대단할지 궁금함. 오랫동안 읽을 수 없던 두루마리를, 조각조각 읽게 해주는 기계를 발명했다는 건 엄청난 일임
  2천 년 넘은 fragile한 두루마리를 실제로 펼치지 않고 읽는 기계를 만들었고, 그 일에 직접 기여했다는 점이 놀라움
- 모델이 잉크와 파피루스를 구분할 때 어떤 특징을 잡아내는지 궁금함
  사람 전문가가 잉크를 표시한 이미지나, 내용이 알려진 탄화 두루마리 스캔 같은 라벨 데이터가 있었는지도 궁금함. 내 눈으로는 이 작업에서 무작위 추측보다 나을 자신이 없고, 애초에 3차원 데이터 중 2차원 단면만 볼 수 있다는 한계도 큼
- 도전에 참여했지만 멀리 가지는 못했음. 당시 궁금했던 건, 기계학습으로 잉크를 검출하면 환각 문자나 본문 일부를 만들어낼 수 있지 않을까, 그리고 그걸 어떻게 막을 수 있을까였음
- 전체 팀에 큰 찬사를 보냄. 두루마리에 대해 처음 들은 뒤로 30년 동안 이 발표를 기다려왔고, 정말 훌륭한 성과임
- 처리 속도가 어느 정도인지 궁금함
  책을 펼쳐 스캔하는 것보다 닫힌 채 스캔하는 편이 더 빨라질 정도로 자동화할 수 있을까?
Herculaneum 유적은 아직 약 20%만 발굴됐기 때문에 더 많은 두루마리가 존재할 가능성이 큼
현재 두루마리들은 당시의 주 도서관이 아니라 사적인 수집품에 가까웠음. 이제 이 기술로 읽을 수 있다면, 다양한 주제의 두루마리 수천 개가 들어 있는 완전한 도서관을 찾는 장면은 정말 멋질 것임
- 이건 결국 우리가 고대 세계를 이해하는 방식을 완전히 바꿀 수 있음
  현재까지 전해진 고대 그리스어·라틴어 저작은 전체의 약 1%에 불과한 것으로 추정되고, Punic 같은 다른 언어는 더 적음 [0]. 어떤 작품과 저자는 후대 문헌에서 이름만 인용돼 알 뿐임
  또 살아남은 텍스트들은 중세에 비싼 동물 가죽 위에 수도사들이 계속 필사했기 때문에 살아남았고, 그 과정에서 당연히 그들에게 더 흥미로운 주제가 우선됐음. 말 그대로 모든 것이 바뀔 수 있음
  [0] https://talesoftimesforgotten.com/2021/09/25/are-there-more-...
기술 업계 상태가 우울하고, 똑똑한 사람들이 더 많은 광고를 사람들 목구멍에 밀어 넣는 일에 매달린다는 생각이 들 때마다 이런 프로젝트도 존재한다는 걸 떠올리면 됨
엄청난 일을 하는 똑똑한 사람들도 많고, 다만 그들이 덜 시끄러울 뿐임
- 이런 일만 대단한 건 아님. AI는 의학 분야 발견에도 쓰이고, 패혈증을 더 빨리 감지해 사망을 줄이는 데도 쓰임
  또 Alzheimer 유전자가 단순한 징후가 아니라 발병을 활성화한다는 점을 찾아낸 사례도 있었음
2천 년 뒤의 병행 사례는 이런 모습일지 궁금함: “2484년 대태양 플레어 이후의 Step Brothers DVD가 해독됨”
- 우리가 장기간 잃어버린 Chekhov의 “The Three Sisters” 결말을 구전으로 재현한 것으로 보이는 시청각 매체를 성공적으로 복구했음. 알고 보니 불은 켜져 있었음
- 누군가 DeCSS 코드가 적힌 화석화된 티셔츠를 발견했을 것임
- 내가 이해하기로 Pompeii는 기본적으로 향락과 쾌락의 도시였음
  지금까지 나온 두루마리 텍스트도 대체로 고대판 포르노 팬픽처럼 보임. 결국 사람 사는 건 별로 변하지 않음
지금 AI로 하는 일 중에서 이게 가장 흥미로운 축에 들어감. 의료 연구와 함께 그렇다
고대 세계에 꽤 집착하는 편이라, 약 2천 년 전의 새 텍스트를 페이지 단위로 읽을 수 있게 되는 걸 꿈꿔 왔음
이런 번역을 읽을 때마다 항상 어조가 번역됐는지 궁금해짐
원문 작성자는 아주 격식 있는 “to the utmost”를 의도했을까, 아니면 더 가벼운 “to the max”였을까? 번역자의 편향이 이런 글을 사회관계망 게시물 대신 학술 논문처럼 보이게 만드는 비중은 얼마나 될까?
- 쓸모 있는 고대 텍스트 번역에는 보통 원문이 함께 실려서, 독자가 번역이 얼마나 충실한지 판단할 수 있음
  고대 텍스트를 읽고 싶다면 “Loeb library” 같은 대역본이 있음. 원문을 생략한 번역은 내용만 대략 알고 싶고 번역의 정확성에는 관심이 덜한 사람을 위한 것임
  대역본이 있으면 원어 지식이 비교적 적어도 원문을 이해하기 쉬워짐. 원문이 중요한 이유는 목표 언어에 정확한 등가어가 없어서 번역자가 불가피하게 부정확성을 끼워 넣는 경우가 많기 때문임
  특히 서로 다른 고대 단어들을 같은 영어 단어로 옮기면 뉘앙스가 사라져 오해를 부름. 반대로 같은 고대 단어를 문맥에 따라 다른 영어 단어로 옮기는 경우도 혼란스러움
  단어 의미가 문맥에 따라 달라질 수는 있지만, 번역자가 해당 과학·기술 맥락에 충분한 전문 지식이 없으면 독자보다 나은 판단을 못 할 때도 있음. 더 나은 번역자는 단어 간 일대일 대응을 선호해서, 독자가 여러 용례를 보고 고대 작성자의 의도를 직접 찾기 쉽게 해줌
- 그래서 직역과 어원 파고들기를 좋아하고, 당시의 삶을 이루던 활동이 무엇이었는지도 같이 묻는 편임
  유능한 궁수가 될 필요는 없지만, 특정 형태의 활을 쓴 사람을 이해하려면 그 활을 잠깐이라도 만져보는 쪽이 더 쉬움
- 철학 텍스트라면 아마 매우 조밀한 산문일 가능성이 큼
  격식 있는 그리스어·라틴어 글쓰기는 종속절이 잔뜩 붙은 긴 문장을 선호했음. 지금은 학계나 “고급” 문학 바깥에서는 사람들이 그렇게 잘 쓰지 않음. 가벼운 편지나 낙서는 트윗에 더 가까웠을 것임
- 고전 시인 Somewhat Frosty의 고대 명시 Mugger's Paradise를 번역해보면 이렇다:
  죽음의 그림자 드리운 골짜기를 지나며,
  나는 내 삶을 숙고하고 남은 것이 없음을 깨닫노라.
  나는 오랫동안 무기를 휘두르고 웃어왔기에,
  내 어머니에게조차 내 정신은 떠나간 듯 보이노라.
  그러나 나는 속을 만한 자 외에는 누구도 속이지 않았으니,
  내가 겁쟁이로 여겨진다는 것은 실로 들어본 바 없도다.
  무엇을 말하는지, 어디로 나아가는지 조심하라.
  그대와 그대의 동료들이 분필 선으로 둘러싸이지 않도록
- 단서가 아주 적을 때도 있지만, 후기 공화정과 초기 로마 제국에 관해서는 실제로 참고할 것이 많음
  라틴어는 매우 풍부한 언어이고, 이건 짧은 조각도 아님. 번역은 언제나 어렵고 특히 수천 년 전 텍스트는 더 어렵지만, 이런 종류의 번역은 꽤 높은 확신을 가지고 할 수 있음
이 글을 쓴 사람은 피라미드를 만든 기술보다, 자기 텍스트의 탄 조각을 풀어 읽어낸 기술에 시간적으로 더 가까웠음
생각해보면 꽤 기묘함
- “피라미드를 만든 기술”이라면 밧줄과 수레를 말하는 건가?
언젠가 파괴하지 않고 읽을 기술이 생기리라는 희망으로 그렇게 오래 보존했다는 건 인간 능력과 낙관주의에 대한 놀라운 시험처럼 느껴짐
이런 이야기는 미래에 대한 희망을 많이 줌
“어떤 방식으로든 우리 자신과 우리의 본성에서 벗어난다면, 우리는 무언가를 탐구하겠지만 그것을 붙잡지는 못할 것이다…”라는 문장을 우리가 찾아냈다는 게 아름답게 아이러니함

답변달기

Herculaneum 두루마리 전체를 처음으로 해독

봉인된 두루마리를 열지 않고 읽음

PHerc. 1667에서 복원된 텍스트

내용과 학술적 식별

다른 두루마리에서 나온 검증과 식별

사용된 기술과 공개 방식

공개 과학과 다음 단계

함께 보면 좋은 글 β

댓글과 토론

Hacker News 의견들