GN⁺: 베수비우스 챌린지 2023 대상 수상: 첫 번째 두루마리 읽기 성공
(scrollprize.org)베수비오 챌린지 2023 대상 수상: 첫 번째 두루마리 읽기 성공
- 2000년 전 화산 폭발로 묻힌 헤르쿨라네움 파피루스 두루마리가 발견됨.
- 이 두루마리들은 탄화되어 열기 없이는 손상 없이 펼칠 수 없음.
- 2023년 3월 15일, Nat Friedman, Daniel Gross, Brent Seales가 베수비오 챌린지를 시작함.
- 고해상도 CT 스캔을 공개하고, 100만 달러 이상의 상금을 제공함.
- 전 세계 커뮤니티가 컴퓨터 비전, 기계 학습을 이용해 문제 해결에 나섬.
- 2023년 12월, 두루마리의 95%가 남아 있음에도 불구하고, 2000년 만에 처음으로 두루마리의 일부를 읽을 수 있게 됨.
대상 수상
- 베수비오 챌린지 대상에는 많은 훌륭한 제출작이 있었음.
- 심사팀은 1월 내내 제출작을 심사함.
- Youssef Nader, Luke Farritor, Julian Schilliger 팀이 대상 수상자로 선정됨.
- 이 팀은 서로 독립적으로 가장 많은 텍스트를 복구함.
- 제출된 코드와 방법이 기술 팀에 의해 검증되고 재현됨.
- 상금 70만 달러 수상.
준우승자들
- 준우승자들은 각각 5만 달러를 수상함.
- 이들은 잉크 라벨링과 샘플링의 미묘함에 대한 새로운 접근법을 제시함.
두루마리가 말하는 것은?
- 첫 번째 두루마리의 약 5%를 펼치고 읽는 데 성공함.
- 이 두루마리는 기존 작품의 중복이 아니며, 고대 텍스트를 담고 있음.
- 텍스트는 쾌락에 대해 다루며, 음식과 음악의 즐거움에 대한 철학적 논의를 포함함.
이미지의 정확성은 어떠한가?
- 기계 학습 모델이 '환각'을 일으키는 것을 방지하기 위해 여러 조치가 취해짐.
- 기술 재현, 동일 영역에 대한 다양한 제출작, 작은 입력/출력 창을 사용함.
어떻게 두루마리를 펼치는가?
- 가상 펼침은 스캔, 분할, 잉크 감지의 세 단계로 이루어짐.
- 다이아몬드 라이트 소스에서 X-레이 토모그래피를 사용해 3D 스캔을 생성함.
- 분할은 복잡한 두루마리의 층을 식별하고 펼치는 과정임.
- 잉크 감지는 기계 학습 모델을 사용해 펼쳐진 부분에서 잉크가 있는 영역을 식별함.
무엇이 필요했는가?
- 베수비오 챌린지는 헤르쿨라넘 파피루스를 읽는 문제를 해결하고 유사한 프로젝트에 영감을 주기를 희망함.
- 명확한 목표 설정, 견고한 출발점, 경쟁과 협력의 조화, 내부 분할 팀 고용, 돌파구를 위한 표면적 최대화가 중요했음.
다음은 무엇인가? 2024 베수비오 챌린지 대상 발표.
- 2024년의 목표는 한 두루마리의 5%에서 네 두루마리의 90%까지 읽는 것임.
- 2024 대상은 첫 번째로 이를 달성하는 팀에게 수여될 예정임.
- 분할 과정의 자동화가 주요 목표임.
감사의 말
- 프로젝트에 기여한 모든 사람들, 기부자들, 조직 팀, 파트너들, 학자들, 지원 스태프, 그리고 대상 수상자들에게 감사를 표함.
GN⁺의 의견:
- 이 프로젝트는 고대 문서의 디지털 복원과 기계 학습의 결합을 통해 인류 역사에 대한 새로운 이해를 제공하는 중요한 발전임.
- 베수비오 챌린지는 기술과 인문학의 교차점에서 혁신적인 연구를 촉진하는 모범 사례로 볼 수 있음.
- 이러한 노력은 잠재적으로 수천 년 동안 잊혀진 문화적, 철학적 지식을 복원하여 현대 사회에 새로운 통찰력을 제공할 수 있음.
Hacker News 의견
-
첫 번째 댓글 요약:
- 디지털로 두루마리를 풀어내는 기술, 종이의 균열을 잉크의 신호로 인식하는 방법, 그리고 이를 감지하기 위한 모델을 조각조각 맞추는 과정에 매료됨.
- TimeSFormer 사용에 혼란스러움을 느낌. 비디오용으로 알고 있었는데, 이미지에 어떻게 적용했는지 궁금함.
- 고고학에 대한 멋진 날로, 이룬 성과에 대해 젊은 마음들에게 큰 박수를 보냄.
-
두 번째 댓글 요약:
- 프로젝트의 불가능해 보이는 모습과 참여한 사람들의 똑똑함에 놀람.
- 처음엔 5-10년은 걸릴 것으로 생각했으나, 이제 이룬 성과에 대해 놀라움과 함께 축하를 전함.
-
세 번째 댓글 요약:
- 고도로 발전된 기술이 마법과 구분이 안 될 정도로 놀라운 수준에 도달함.
- 기계 학습 기술이 최근에 발견된 것인지, 아니면 오래전부터 있었는지, 그리고 이러한 알고리즘이 인기를 얻으면서 새로운 문제에 적용되는 방식에 대한 궁금증을 표함.
-
네 번째 댓글 요약:
- 올해 읽은 것 중 가장 멋진 것으로, 2000년 된 탄화된 두루마리에서 텍스트를 읽을 수 있다는 것이 과학 소설 같음.
-
다섯 번째 댓글 요약:
- 스캔된 두루마리를 분리하는 수작업과 새로운 두루마리를 스캔하는 비용이 더 많은 텍스트를 읽는 데 있어 주요 병목 현상임.
-
여섯 번째 댓글 요약:
- 고고학의 매력적인 측면 중 하나는 일부 유물을 고의로 탐사하지 않고 미래의 기술을 위해 남겨두는 관행임.
- 원래 발견자들이 두루마리를 풀려고 시도했지만 불가능하다는 것을 깨닫고 나머지는 그대로 두었음.
-
일곱 번째 댓글 요약:
- 원래 모델이 1070 그래픽 카드에서 훈련되었다는 것이 놀라운 작업임.
-
여덟 번째 댓글 요약:
- 이 두루마리 컬렉션이 잃어버린 이야기들을 담고 있을 가능성에 대해 매우 흥분됨.
-
아홉 번째 댓글 요약:
- 필로데무스가 베수비오 화산의 용암에 묻힌 저택에서 글을 썼고, 2000년 후에 우리는 그의 글을 재구성하기 위해 첨단 기술을 사용함.
- 그가 생각하는 사람이었기에, 우리가 그의 글을 읽을 수 있게 되었다는 것을 알려주고 싶음.
-
관련 링크 요약:
- 헤라클레움 두루마리에서 첫 단어를 발견한 컴퓨터 과학 학생에 대한 기사와 베수비오 챌린지에 대한 토론 링크 제공.