베수비우스 챌린지 2023 대상 수상: 첫 번째 두루마리 읽기 성공

(scrollprize.org)

1P by GN⁺ 2024-02-06 | ★ favorite | 댓글 1개

베수비오 챌린지 2023 대상 수상: 첫 번째 두루마리 읽기 성공

2000년 전 화산 폭발로 묻힌 헤르쿨라네움 파피루스 두루마리가 발견됨.
이 두루마리들은 탄화되어 열기 없이는 손상 없이 펼칠 수 없음.
2023년 3월 15일, Nat Friedman, Daniel Gross, Brent Seales가 베수비오 챌린지를 시작함.
고해상도 CT 스캔을 공개하고, 100만 달러 이상의 상금을 제공함.
전 세계 커뮤니티가 컴퓨터 비전, 기계 학습을 이용해 문제 해결에 나섬.
2023년 12월, 두루마리의 95%가 남아 있음에도 불구하고, 2000년 만에 처음으로 두루마리의 일부를 읽을 수 있게 됨.

대상 수상

베수비오 챌린지 대상에는 많은 훌륭한 제출작이 있었음.
심사팀은 1월 내내 제출작을 심사함.
Youssef Nader, Luke Farritor, Julian Schilliger 팀이 대상 수상자로 선정됨.
이 팀은 서로 독립적으로 가장 많은 텍스트를 복구함.
제출된 코드와 방법이 기술 팀에 의해 검증되고 재현됨.
상금 70만 달러 수상.

준우승자들

준우승자들은 각각 5만 달러를 수상함.
이들은 잉크 라벨링과 샘플링의 미묘함에 대한 새로운 접근법을 제시함.

두루마리가 말하는 것은?

첫 번째 두루마리의 약 5%를 펼치고 읽는 데 성공함.
이 두루마리는 기존 작품의 중복이 아니며, 고대 텍스트를 담고 있음.
텍스트는 쾌락에 대해 다루며, 음식과 음악의 즐거움에 대한 철학적 논의를 포함함.

이미지의 정확성은 어떠한가?

기계 학습 모델이 '환각'을 일으키는 것을 방지하기 위해 여러 조치가 취해짐.
기술 재현, 동일 영역에 대한 다양한 제출작, 작은 입력/출력 창을 사용함.

어떻게 두루마리를 펼치는가?

가상 펼침은 스캔, 분할, 잉크 감지의 세 단계로 이루어짐.
다이아몬드 라이트 소스에서 X-레이 토모그래피를 사용해 3D 스캔을 생성함.
분할은 복잡한 두루마리의 층을 식별하고 펼치는 과정임.
잉크 감지는 기계 학습 모델을 사용해 펼쳐진 부분에서 잉크가 있는 영역을 식별함.

무엇이 필요했는가?

베수비오 챌린지는 헤르쿨라넘 파피루스를 읽는 문제를 해결하고 유사한 프로젝트에 영감을 주기를 희망함.
명확한 목표 설정, 견고한 출발점, 경쟁과 협력의 조화, 내부 분할 팀 고용, 돌파구를 위한 표면적 최대화가 중요했음.

다음은 무엇인가? 2024 베수비오 챌린지 대상 발표.

2024년의 목표는 한 두루마리의 5%에서 네 두루마리의 90%까지 읽는 것임.
2024 대상은 첫 번째로 이를 달성하는 팀에게 수여될 예정임.
분할 과정의 자동화가 주요 목표임.

감사의 말

프로젝트에 기여한 모든 사람들, 기부자들, 조직 팀, 파트너들, 학자들, 지원 스태프, 그리고 대상 수상자들에게 감사를 표함.

GN⁺의 의견:

이 프로젝트는 고대 문서의 디지털 복원과 기계 학습의 결합을 통해 인류 역사에 대한 새로운 이해를 제공하는 중요한 발전임.
베수비오 챌린지는 기술과 인문학의 교차점에서 혁신적인 연구를 촉진하는 모범 사례로 볼 수 있음.
이러한 노력은 잠재적으로 수천 년 동안 잊혀진 문화적, 철학적 지식을 복원하여 현대 사회에 새로운 통찰력을 제공할 수 있음.

▲

GN⁺ 2024-02-06 [-]

Hacker News 의견

첫 번째 댓글 요약:
- 디지털로 두루마리를 풀어내는 기술, 종이의 균열을 잉크의 신호로 인식하는 방법, 그리고 이를 감지하기 위한 모델을 조각조각 맞추는 과정에 매료됨.
- TimeSFormer 사용에 혼란스러움을 느낌. 비디오용으로 알고 있었는데, 이미지에 어떻게 적용했는지 궁금함.
- 고고학에 대한 멋진 날로, 이룬 성과에 대해 젊은 마음들에게 큰 박수를 보냄.
두 번째 댓글 요약:
- 프로젝트의 불가능해 보이는 모습과 참여한 사람들의 똑똑함에 놀람.
- 처음엔 5-10년은 걸릴 것으로 생각했으나, 이제 이룬 성과에 대해 놀라움과 함께 축하를 전함.
세 번째 댓글 요약:
- 고도로 발전된 기술이 마법과 구분이 안 될 정도로 놀라운 수준에 도달함.
- 기계 학습 기술이 최근에 발견된 것인지, 아니면 오래전부터 있었는지, 그리고 이러한 알고리즘이 인기를 얻으면서 새로운 문제에 적용되는 방식에 대한 궁금증을 표함.
네 번째 댓글 요약:
- 올해 읽은 것 중 가장 멋진 것으로, 2000년 된 탄화된 두루마리에서 텍스트를 읽을 수 있다는 것이 과학 소설 같음.
다섯 번째 댓글 요약:
- 스캔된 두루마리를 분리하는 수작업과 새로운 두루마리를 스캔하는 비용이 더 많은 텍스트를 읽는 데 있어 주요 병목 현상임.
여섯 번째 댓글 요약:
- 고고학의 매력적인 측면 중 하나는 일부 유물을 고의로 탐사하지 않고 미래의 기술을 위해 남겨두는 관행임.
- 원래 발견자들이 두루마리를 풀려고 시도했지만 불가능하다는 것을 깨닫고 나머지는 그대로 두었음.
일곱 번째 댓글 요약:
- 원래 모델이 1070 그래픽 카드에서 훈련되었다는 것이 놀라운 작업임.
여덟 번째 댓글 요약:
- 이 두루마리 컬렉션이 잃어버린 이야기들을 담고 있을 가능성에 대해 매우 흥분됨.
아홉 번째 댓글 요약:
- 필로데무스가 베수비오 화산의 용암에 묻힌 저택에서 글을 썼고, 2000년 후에 우리는 그의 글을 재구성하기 위해 첨단 기술을 사용함.
- 그가 생각하는 사람이었기에, 우리가 그의 글을 읽을 수 있게 되었다는 것을 알려주고 싶음.
관련 링크 요약:
- 헤라클레움 두루마리에서 첫 단어를 발견한 컴퓨터 과학 학생에 대한 기사와 베수비오 챌린지에 대한 토론 링크 제공.

답변달기