# arXiv의 내부 이야기 - 과학을 뒤바꾼 가장 혁신적인 플랫폼

> Clean Markdown view of GeekNews topic #20481. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=20481](https://news.hada.io/topic?id=20481)
- GeekNews Markdown: [https://news.hada.io/topic/20481.md](https://news.hada.io/topic/20481.md)
- Type: GN+
- Author: [xguru](https://news.hada.io/@xguru)
- Published: 2025-04-23T09:17:13+09:00
- Updated: 2025-04-23T09:17:13+09:00
- Original source: [wired.com](https://www.wired.com/story/inside-arxiv-most-transformative-code-science/)
- Points: 10
- Comments: 1

## Summary

**오픈 액세스 과학 논문 저장소**인 arXiv는 1991년 **Paul Ginsparg**에 의해 설립되어, 전 세계 과학자들에게 **가장 중요한 플랫폼 중 하나**로 자리 잡았습니다. 이 플랫폼은 기존의 **느리고 비싼 학술 출판 구조를 우회**하여 연구자들이 **심사 전(preprint) 논문을 즉시 공유**할 수 있게 함으로써 과학 협업과 혁신에 기여합니다. arXiv는 초기에는 단순한 자동화 스크립트로 시작했지만, 현재는 **월간 2만 건 이상의 논문 제출**과 **500만 명의 이용자**를 갖춘 거대한 플랫폼으로 성장했습니다. 현재는 **Simons Foundation**의 지원과 새 리더십 아래 **클라우드 이전 및 Python 코드 리팩토링**이 진행 중이며, Ginsparg는 여전히 **품질 필터링 문제**에 몰두하고 있습니다.

## Topic Body

- arXiv는 1991년 Paul Ginsparg가 만든 **오픈 액세스 과학 논문 저장소**로, 지금도 전 세계 과학자들에게 **가장 중요한 플랫폼 중 하나**로 사용됨  
- 기존의 느리고 비싼 **학술 출판 구조를 우회**하여, 연구자들이 심사 전(preprint) 논문을 **즉시 공유**할 수 있도록 하여 과학 협업과 혁신에 기여함  
- arXiv는 단순한 자동화 스크립트에서 출발했지만, 현재는 **월간 2만 건 이상의 논문 제출**과 **500만 명의 이용자**를 갖춘 거대한 플랫폼으로 성장  
- 초기에는 비공식적이고 가볍게 운영되었으나, 이후 **운영 코드 복잡성, 내부 갈등, 기술 노후화** 등의 문제를 겪으며 수차례 위기를 넘김  
- 현재는 Simons Foundation의 지원과 새 리더십 아래 **클라우드 이전 및 Python 코드 리팩토링**이 진행 중이며, 여전히 Ginsparg는 품질 필터링 문제에 몰두 중  
  
---  
  
### arXiv의 기원과 과학 출판 구조에 대한 도전  
  
- 물리학자 **Paul Ginsparg**는 _The Godfather_ 의 대사를 인용하며 자신이 만든 플랫폼에서 완전히 손을 뗄 수 없는 심정을 표현함  
  > “*Just when I thought I was out, they pull me back in!*”  
  > “이제 겨우 빠져나왔다 싶었는데, 또다시 끌려 들어갔어!”  
- 그는 **Cornell University**의 교수이자 **MacArthur Genius Grant** 수상자로, 35년 전 **동료 평가 전(preprint)** 논문을 공유할 수 있는 디지털 저장소인 [**arXiv**](https://arxiv.org/)를 개발함  
- 현재도 arXiv.org는 **고전적인 웹 1.0 스타일**의 디자인과 **Cornell의 상징**을 유지하고 있지만, 이 단순한 외형과 달리 arXiv는 **과학 지식 유통 구조에 근본적인 변화**를 일으킨 플랫폼임  
- arXiv가 중단된다면, **전 세계 과학자들에게 심각한 업무 차질**이 발생할 수 있으며, 실제로 많은 수학자와 물리학자들이 arXiv에 **매일 접속**함  
  > “*Everybody in math and physics uses it. I scan it every night.*” — Scott Aaronson  
  > “수학과 물리학 분야 사람이라면 누구나 사용하고 있어요. 저는 매일 밤 훑어봐요.”  
  
### arXiv의 역할과 학술 출판 구조에 대한 문제 제기  
  
- 사회 각 분야에는 고질적인 문제 구조가 존재하며, 학계에서는 **출판 시스템의 불합리성**이 대표적 문제로 지적됨  
- 대형 출판사인 **Elsevier**, **Springer** 등의 **영리 모델**은 다음과 같은 방식으로 비판받음:  
  - **저자에게 무보수 논문 작성 요구**  
  - **다른 연구자가 무료로 편집을 수행하는 구조**  
  - **완성된 논문은 고가에 판매되며, 기관은 높은 구독료를 부담**  
  > “*Calling their practice a form of thuggery isn’t so much an insult as an economic observation.*”  
  > “이들의 방식이 폭력이라고 부르는 건 모욕이 아니라 경제적 사실이에요.”  
  
- 전통적인 **동료 평가(peer review)** 는 **수개월에서 1년**까지 소요되며, 이 느린 과정이 정보 유통의 병목으로 작용함  
- 반면, arXiv는 **논문 심사 이전 단계(preprint)** 에서 누구나 **즉시 공개하고 접근 가능**하도록 함으로써 출판의 구조적 문제를 해결함  
- arXiv의 핵심 혁신은 다음과 같은 방식으로 요약 가능함:  
  > “*Showing that you could divorce the actual transmission of your results from the process of refereeing.*” — Paul Fendley  
  > “연구 결과의 전달과 동료 평가 과정을 분리할 수 있음을 보여준 것이죠.”  
  
- 이러한 구조는 **COVID-19 팬데믹과 같은 위기 상황**에서 **의미 있는 과학적 발견을 신속하게 확산**시키는 데 결정적인 기여를 함  
  - arXiv에서 영감을 받은 **bioRxiv**, **medRxiv** 등이 생명과학 분야로 확장되었으며, **수백만 명의 생명을 구한 가능성**도 제기됨  
  
### arXiv의 품질 관리 구조  
  
- arXiv에 제출되는 논문은 공식적인 **peer review**를 거치지 않지만, **분야별 전문가들의 자발적 검토**를 통해 기본적인 학문적 기준과 규정을 유지함  
- 주요 품질 관리 요소:  
  - **원본 연구만 허용**  
  - **조작된 데이터 금지**  
  - **중립적인 표현 사용**  
- 또한, 제출 논문은 **자동화된 시스템을 통한 기초 검수**도 진행됨  
- 이러한 검증 절차 없이는 arXiv가 **사이비 과학 또는 비전문가 제출물로 넘쳐날 위험**이 있음  
  
### arXiv의 영향력과 Ginsparg의 현재 모습  
  
- 2021년, 학술지 **Nature**는 arXiv를 “*10 computer codes that transformed science*” 중 하나로 선정함  
  > “*10 computer codes that transformed science*”  
  > “과학을 변화시킨 10대 컴퓨터 코드”  
- arXiv의 **과학 협업 촉진 역할**이 높이 평가받았으며, 현재는  
  - **260만 편 이상의 논문** 보유  
  - 매달 **2만 건의 신규 제출**  
  - **월간 사용자 수 500만 명** 기록  
- 21세기 주요 과학적 발견 다수가 **arXiv를 통해 최초 공개**되었으며, 그 예시로는  
  - **현대 AI 붐을 일으킨 “transformers” 논문**  
  - **밀레니엄 난제 중 하나인 푸앵카레 추측의 해법** 등이 있음  
- arXiv에 올라온 논문이 **후속적으로 권위 있는 저널에 실리는 경우도 많음**, 하지만 **arXiv에 공개된 순간부터 누구나 접근 가능**하다는 점이 핵심 장점으로 작용함  
  > “*Just because a paper is posted on arXiv doesn’t mean it won’t appear in a prestigious journal someday.*”  
  > “arXiv에 논문이 올라왔다고 해서, 나중에 권위 있는 저널에 실리지 않는다는 뜻은 아니에요.”  
  
### arXiv의 내부 현실과 지속 가능성 문제  
  
- 과학자들에게 arXiv는 **공공 도서관이나 GPS처럼 없어서는 안 될 존재**로 인식되지만, 실제 arXiv 운영은 **마찰 없는 이상적 플랫폼과는 거리가 있음**  
- arXiv는 그동안 다음과 같은 문제에 직면해 왔음:  
  - **관료적 갈등**  
  - **노후화된 코드**  
  - **스파이 사건**까지 발생  
- Ginsparg는 이 현실을 다음과 같이 표현함  
  > “*A child I sent off to college but who keeps coming back to camp out in my living room, behaving badly.*”  
  > “대학에 보낸 자식이 자꾸 집에 돌아와 거실에 눌러앉아 말썽을 부리는 꼴이에요.”  
- 인터뷰 요청을 FAQ로 돌리거나 직접 방문을 만류하는 등, Ginsparg는 여전히 **arXiv와의 거리두기 시도**를 이어가고 있음  
  
### Ginsparg의 성격, 취향, 일상  
  
- **Ithaca**(Cornell 소재지)에서의 인터뷰를 통해 드러난 Ginsparg는  
  - **유쾌하고 장난기 많은 성격**  
  - 동시에 **제한 없이 자신의 철학을 관철하는 완고함**을 가짐  
- 그의 예전 상사였던 Geoffrey West의 표현에 따르면  
  > “*Quite a character*, *infamous in the community*, *extremely funny*, *a great guy.*”  
  > “상당히 개성 있는 사람이고, 커뮤니티에서 유명하죠. 굉장히 웃기고, 멋진 사람이에요.”  
- Ginsparg 자신은 arXiv 관련 기사를 평가절하하며 말함  
  > “*So many articles, so few insights.*”  
  > “기사야 많지만, 통찰은 적어요.”  
- 현재 69세인 그는 **사이클링과 등산을 즐기는 활동적인 삶**을 유지하고 있으며, 복장은 늘 **편안한 여행자 스타일**임  
  
### Ginsparg의 사무실과 최근 관심사  
  
- Cornell 물리학과의 사무실은 “지저분하다”기보다, **오래된 물건들이 정지된 시간 속에 놓인 듯한 분위기**를 가짐  
  - 90년대 택배 상자, 오래된 잡지, CRT 모니터, 백악관 초대장 등 존재  
  - **Stephen Wolfram**이 보낸 책에는 유쾌한 메모가 있음  
    > “*Since you can’t find it on arXiv :)*”  
    > “arXiv에서 찾을 수 없을 테니 :)”  
- 유일하게 활발히 사용되는 것은 **양자 측정 이론 관련 수식이 가득한 칠판**  
- 사무실 외에서도 그는 건물 구조, 직원 동선, 매년 날아드는 새의 종류까지 **세세한 것들을 놓치지 않는 관찰력**을 보임  
- AI 논문 급증과 함께 증가한 **저품질 논문 문제**에 대해 우려하며, 이를 걸러낼 수 있는 **“holy grail crackpot filter”** 를 개발 중  
  > “*The holy grail crackpot filter.*”  
  > “궁극의 사이비 논문 필터”  
- arXiv의 질 관리를 위해 지금도 스스로 **하드 드라이브를 복구**하면서까지 **언어 모델을 실험** 중임  
  - 이 같은 행동은 **arXiv의 품질 유지 책임감을 스스로 느끼는 태도**로 해석 가능  
  
### arXiv의 탄생과 초기 역사  
  
- arXiv는 원래 **과학 인프라가 아닌**, Ginsparg의 NeXT 머신에서 돌아가던 **단순한 셸 스크립트 모음**이었으며, 1991년 6월, **콜로라도 학회에서의 계기**를 통해 만들어지게 되었음  
- 당시 프린스턴 고등연구소의 포닥이자 물리학 프리프린트 메일링 리스트를 운영하던 **Joanne Cohn**이 “**물리학 논문을 공유할 중앙 시스템이 없다**”는 문제를 언급함  
  - 소속이나 인맥에 따라 **메일링 리스트 접근 여부가 갈렸고**, 논문 공개까지 **수개월이 소요되는 비효율성** 존재  
- 어떤 물리학자가 “**여행 중 이메일 논문이 너무 많아 저장 공간이 가득 찬다**”는 우스갯소리를 하자, Ginsparg는 **자동화된 논문 배포 시스템**의 필요성을 인지함  
  - Cohn에게 “자동화 생각은 안 해봤냐”고 묻자, 돌아온 대답은  
    > “*Go ahead and do it yourself.*”  
    > “그럼 네가 한번 해봐.”  
- 이튿날 Ginsparg는 실제로 스크립트를 짜서 완성했고,  
  > “*My recollection is that the next day he’d come up with the scripts and seemed pretty happy about having done it so quickly.*”  
  > “제 기억엔 그가 바로 다음날 스크립트를 만들었고, 그렇게 빨리 만든 걸 무척 즐거워했어요.” — Joanne Cohn  
  
### Ginsparg의 시대적 위치와 arXiv의 기술 진화  
  
- Ginsparg는 종종 **인터넷 시대의 포레스트 검프**로 비유되며,  
  - Harvard 재학 당시 **Bill Gates**, **Steve Ballmer**와 동급생이었고  
  - 형은 Stanford에서 **AI 선구자 Terry Winograd**와 공부했으며  
  - 두 사람 모두 **Arpanet 이메일 계정 보유**, 이는 당시로선 매우 드문 일이었음  
- Cornell에서 이론물리학 박사 학위 취득 후 Harvard에서 교수직을 시작했으나, **종신재직권 거절**로 Los Alamos로 이직함  
  - 이곳에서는 **고에너지 이론물리학 연구에만 전념할 수 있는 환경**과 **운동 중심 라이프스타일에 적합한 지역 조건**이 있었음  
  
### 웹 이전의 arXiv 시스템과 웹 기반으로의 진화  
  
- arXiv는 초창기 **웹사이트가 아닌 이메일 자동 응답 서버**였고, 몇 달 뒤 FTP 서버도 함께 운영되었음  
  - 이후 Ginsparg는 “World Wide Web”이라는 새로운 기술을 듣고 처음에는  
    > “*I can’t really pay attention to every single fad.*”  
    > “모든 유행에 다 관심을 가질 순 없잖아요.”  
    라며 회의적인 반응을 보였지만, 1993년 Mosaic 브라우저의 등장을 계기로 흥미를 느껴 웹 인터페이스를 직접 구축함  
- 그는 CERN의 **Tim Berners-Lee**와도 교류했으며, 그를 “검정참치를 잘 굽는 프로그래머”로 기억함  
  > “*Tim grilled excellent swordfish at his home in the French countryside.*”  
  > “Tim은 프랑스 시골 자기 집에서 검정참치를 기가 막히게 구워줬죠.”  
  
### 이름의 유래와 코드베이스 정비  
  
- 1994년, National Science Foundation의 자금 지원을 받아 초기 셸 스크립트를 **보다 안정적인 Perl 코드로 리팩토링**하기 위해 두 명의 개발자를 채용함  
  - **Mark Doyle**: 후에 American Physical Society의 CIO가 됨  
  - **Rob Hartill**: IMDb 프로젝트 병행 중이었으며, 이후 Apache Software Foundation에서도 활동  
- arXiv의 초기 주소는 `xxx.lanl.gov`였는데, “xxx”에 지금의 의미는 없었으며, 이후 아내와 함께 “더 나은 이름”을 고민하다 **그리스 문자 chi(χ)를 활용해 ‘arXiv’로 결정**  
  > “*She wrote it down and crossed out the e to make it more symmetric around the X.*”  
  > “아내가 적어보더니 ‘e’를 지우고 ‘X’를 중심으로 대칭적으로 만들었어요.”  
- 초기에는 별도의 조직도 없이 **개발자 1~2명, 관리자는 대부분 지인 및 동료들**이 맡았으며, **연간 100건 정도의 논문을 예상했지만 초기부터 월 100건으로 시작해 급성장**함  
  
### 커뮤니티의 급속한 확장과 arXiv의 정착  
  
- Ginsparg의 말에 따르면,  
  > “*Day one, something happened, day two something happened, day three, Ed Witten posted a paper. That was when the entire community joined.*”  
  > “첫날 뭔가가 일어났고, 둘째 날도 마찬가지였고, 셋째 날 Ed Witten이 논문을 올렸죠. 그때 전 커뮤니티가 합류했어요.”  
- **Edward Witten**은 현대 최고의 이론물리학자이자 “살아있는 가장 똑똑한 사람”으로 불리며, 그 역시 다음과 같이 언급함  
  > “*The arXiv enabled much more rapid worldwide communication among physicists.*”  
  > “arXiv는 전 세계 물리학자 간의 소통을 훨씬 빠르게 해줬어요.”  
- 이후 수학, 컴퓨터 과학 등 **다양한 분야로 확장**되었으며, Ginsparg 본인도  
  > “*It was fun.*”  
  > “재미있었어요.”  
    라며 arXiv 초기 개발 경험을 회상함  
  
### arXiv의 확장과 갈등의 시작  
  
- arXiv의 사용량이 급증함에 따라 **대형 소프트웨어 시스템들이 겪는 확장성과 운영 문제**에 직면하게 되었으며, 특히 서버 속도 저하와 모더레이션 부담이 주요 이슈로 떠올랐음  
  - 예를 들어, “stanford.edu”로부터의 트래픽 폭주로 인한 서버 과부하 사건이 있었으며, 이는 훗날 **Google을 만든 Sergey Brin과 Larry Page**가 arXiv를 웹 크롤링하던 시기였음  
    > “*Years later, when Ginsparg visited Google HQ, both Brin and Page personally apologized to him for the incident.*”  
    > “몇 년 후 Ginsparg가 Google 본사를 방문했을 때, Brin과 Page는 직접 그 사건에 대해 사과했다.”  
  
### arXiv의 생존 전략과 출판 업계로부터의 독립성 확보  
  
- arXiv가 살아남은 가장 큰 이유는 **전통적 학술 출판의 기득권 구조로부터의 공격을 피한 점**에 있으며, 이는 초기부터 사용자가 제출 시 “**arXiv가 해당 논문을 비독점적으로 영구 배포할 수 있다**”는 조항에 동의하게 한 전략 덕분임  
  - 이 조항 덕분에 **논문이 다른 저널에 출판되더라도 arXiv에 계속 남아 있을 수 있게 되었으며**, 거대 출판사들이 폐쇄를 시도할 유인을 제거함  
  
### Los Alamos에서의 이탈과 Cornell로의 복귀  
  
- arXiv가 과학계에 점점 더 중요한 인프라로 자리 잡았음에도 불구하고, **Los Alamos 연구소 내부에서는 arXiv 프로젝트를 크게 지지하지 않았으며**, 오히려 연구소보다 영향력이 커진 점이 부담으로 작용했음  
  - Ginsparg는 당시를  
    > “*dreamlike and heavenly*”  “꿈결 같고 천상의 시기”  
  - 라고 표현했지만, 1999년 **Wen Ho Lee 간첩 사건** 이후 연구소 내 분위기가 급변하면서 **보안 강화 조치와 심리적 피로 누적**으로 이직을 결심하게 됨  
    - 당시 성과 평가에서 “*a strictly average performer with no particular computer skills*”  
      → “평균 수준의 성과자이며, 특별한 컴퓨터 기술은 없다”는 혹평을 받았고, 갓 태어난 딸과 교육 환경 문제도 이직 이유 중 하나였음  
- 결국 Ginsparg는 모교인 **Cornell로 복귀하면서 arXiv도 함께 옮겨졌고**, 그는 “최대 5년 안에 arXiv에서 손을 떼겠다”고 선언함  
  > “*They disseminate material to academics, so that seemed like a natural fit.*”  
  > “도서관은 학술 자료를 배포하니 자연스러운 선택처럼 보였다.”  
  
### 도서관 내에서의 운영 충돌  
  
- 하지만 **Cornell 도서관은 arXiv의 기술적 복잡성을 제대로 이해하지 못했으며**, 제출 로직 하나만 해도 수많은 예외 처리가 요구되는 구조였기에, 단순한 자료 저장 시스템으로 취급한 것이 문제였음  
- Ginsparg와 초기 멤버들은 **도서관 측이 arXiv를 일종의 사후적 덤으로 여겼다**고 느꼈고, 반대로 도서관 측은 Ginsparg가 지나치게 직접 개입한다는 인상을 받았음  
  > “*Good lower-level manager … but his sense of management didn’t scale.*”  
  > “좋은 실무형 관리자이지만, 관리 역량이 대규모 운영에 적합하지 않았다.”  
- 2000년대 대부분의 기간 동안, **arXiv는 안정적인 개발 인력을 확보하지 못한 채 운영되었음**  
  
### Ginsparg의 철학과 운영 방식에 대한 비판  
  
- Ginsparg는 여전히 **자신이 직접 코드 리뷰를 하고 오류를 찾아내는 실무 중심의 개발자 성향**을 유지했으며, 외부 강연이나 고위 자문 역할에는 냉소적 태도를 보임  
  > “*Larry Summers spending one day a week consulting for some hedge fund—it’s just unseemly.*”  
  > “Larry Summers가 일주일에 하루씩 헤지펀드 자문을 한다는 건 보기 좋지 않다.”  
- 그러나 **오랫동안 계속 관여하는 것도 문제가 되었으며**, arXiv는 점점 규모가 커졌고  
  > “*bigger than all of us*” — Stephanie Orphan (arXiv 프로그램 디렉터)  
  > “우리 모두보다 커진 존재”  
    라는 인식이 공유되기 시작함  
- **지적설계론 물리학자의 소송**, **표절 논란**, **모더레이터 권한 남용 비판** 등 다양한 논쟁이 불거졌으며  
  - 특히 2009년에는 독립 물리학자 **Philip Gibbs**가 arXiv의 반대 플랫폼 **viXra**를 창설함  
    - 이는 “**arXiv의 반대 방향으로 작동하는 거의 무규제 플랫폼**”으로, 괴상한 이론이나 아마추어 논문들이 주로 등록됨  
    - 대표적 예시로는 “**π는 거짓이다**”는 논문([링크](https://vixra.org/abs/1308.0126))이 있음  
  
### 코드베이스 관리 문제와 개발 관행의 충돌  
  
- arXiv는 점점 더 **대규모 코드베이스**로 성장했으며, 초기 구조는 **유지보수성과 테스트를 고려하지 않은 방식**으로 구성되었기에  
  - “**안전점검 없는 건물 공사**”와 유사한 구조적 문제 발생  
  - 이는 빠른 초기 개발은 가능했지만 **장기적 기술 부채와 복잡도 증가**를 야기함  
- Ginsparg는 여전히 도서관 측의 승인 없이 **직접 코드 검토 및 수정에 개입**했고, 이로 인해  
  > “*micromanaging and sowing distrust*”  
  > “지나친 개입과 불신 조성”  
    이라는 비판을 받게 됨  
  
### 은퇴 시도와 잔류, 그리고 내부 갈등의 고조  
  
- 2011년 arXiv의 **20주년을 맞이한 Ginsparg는 은퇴 결심**을 굳히고, [Nature에 “ArXiv at 20”](https://www.nature.com/articles/476145a)이라는 제목의 작별 인사를 게재함  
  > “*For me, the repository was supposed to be a three-hour tour, not a life sentence.*”  
  > “내게 arXiv는 세 시간짜리 여행이었지, 평생형은 아니었다.”  
  > “*ArXiv was originally conceived to be fully automated, so as not to scuttle my research career.*”  
  > “arXiv는 내 연구 경력을 해치지 않도록 완전 자동화를 목표로 설계되었다.”  
  > “*But daily administrative activities associated with running it can consume hours of every weekday, year-round without holiday.*”  
  > “하지만 arXiv 운영에 따른 행정 업무는 평일마다 수 시간을 소모하고, 연중무휴로 이어졌다.”  
- 이후 **일상적인 운영은 Cornell 도서관에 이관되고**, Ginsparg는 자문 위원으로 물러날 계획이었지만, 현실은 그렇게 흘러가지 않음  
  - 일부 직원들은 Ginsparg가 **코드를 “인질처럼 붙잡고 있다”** 며 GitHub나 내부 공유를 거부한다고 비판했으며,  
  - 그는 과거 **하루 만에 구현하던 기능이 이제는 몇 주나 걸린다는 점에 대한 좌절감**을 표현함  
    > “*I learned Fortran in the 1960s, and real programmers didn’t document.*”  
    > “나는 1960년대에 Fortran을 배웠고, 진짜 프로그래머는 문서화를 하지 않았다.”  
    (→ 질문자에게 심장마비급 충격을 안긴 답변으로 묘사됨)  
  
### 경영 혼선과 구조 개편  
  
- arXiv는 기술 문제에 더해 **관리적 혼란**도 겪었으며,  
  - 2019년에는 Cornell 내에서 arXiv의 소속 부서가 **컴퓨팅 및 정보과학부로 이관**되었지만 몇 달 후 다시 변경됨  
  - 이후에는 **상업 학술 출판 경험을 가진 인사가 운영 책임자로 부임**했지만, 1년 반 만에 퇴임함  
    > “*There was disruption … it was not a good period.*”  
    > “혼란이 있었고, 좋은 시기가 아니었다.” — arXiv 내부자  
- 전환점은 2022년, **Simons 재단의 지원으로 개발 인력을 대거 확보**하고,  
  - Cornell의 **Ramin Zabih 교수가 운영 책임자로 임명되며**,  
  - **클라우드 이전과 Python 기반 코드 리팩터링 작업이 본격화**됨  
  
### 개인적 면모와 성찰  
  
- Ginsparg는 기자와의 인터뷰 도중에도 **아들의 자전거를 정비해주고, 자전거 여행 중 상대의 체력에 대해 놀림을 주는 등** 장난기 있는 태도를 유지함  
  - 마지막 오르막에서 그는  
    > “*I might’ve oversold this to you.*”  
    > “내가 이 코스를 과대평가했을지도 모르겠네.”  
    라며 피곤함을 인정함  
- 여러 날 인터뷰를 진행하면서 기자는 그의 **끈기와 완고함에 arXiv의 생존 이유가 있다고 언급**했고, 이에 대해 Ginsparg는 뜻밖의 반응을 보임  
  > “*One person’s tenacity is another person’s terrorism.*”  
  > “누군가에겐 끈기지만, 다른 누군가에겐 테러리즘일 수도 있다.”  
- 그는 이어  
  > “*I’ve heard that the staff occasionally felt terrorized.*”  
  > “직원들이 가끔은 공포감을 느꼈다고 들었다.”  
  라고 인정함  
  
### arXiv의 현재와 미래  
  
- 현재 arXiv는 여전히 **극적인 운영을 이어가고 있으며**,  
  - 언어학자 Emily Bender는 arXiv를 **“junk science”와 “fast scholarship”을 조장하는 “암(cancer)”** 이라 비판한 바 있음  
    ([관련 트윗](https://x.com/emilymbender/status/1696374958652522612), [관련 글](https://medium.com/@emilymenonbender/scholarship-should-be-open-inclusive-and-slow-15ab6ce1d74c))  
- 2023년에는 **상온 초전도체 발견을 주장한 논문이 빠르게 반박되었고**, 이는 arXiv의 빠른 피드백 메커니즘을 보여주는 사례가 되었음  
  - 반대로, **정상적인 논문이 “선동적 표현”이나 “비전문적 언어”를 이유로 철회**되는 사례도 있어 “검열” 논란도 있음  
    - 대표 사례: **h-index 창시자 Jorge Hirsch의 논문 철회 사건**  
  
### Ginsparg의 현재 태도와 애착  
  
- 그는 **스스로를 “오픈 사이언스의 선구자”로 포장하는 것에 거리를 두며**, 거창한 미션보다는 **아이디어 실험의 장으로서 arXiv를 즐기고 있음**  
  > “*There are various aspects of this that remain incredibly entertaining.*”  
  > “이 프로젝트에는 여전히 매우 재미있는 부분들이 있다.”  
  > “*I have the perfect platform for testing ideas and playing with them.*”  
  > “아이디어를 실험하고 놀 수 있는 완벽한 플랫폼이 있다.”  
- 비록 **arXiv 운영 코드에는 더 이상 손대지 않지만**, 여전히 **‘가짜 논문 필터’를 개발하는 개인 프로젝트에 몰두** 중임  
  > “*It’s like that Al Pacino quote: They keep bringing me back.*”  
  > “그 Al Pacino 대사처럼, 계속 나를 다시 끌어들이는 거야.”  
  > “*But Al Pacino also developed a real taste for killing people.*”  
  > “하지만 Al Pacino는 결국 사람 죽이는 데 맛을 들였지.”  
  (→ arXiv에 대한 애증과 스스로의 집착을 유머로 표현한 것)

## Comments



### Comment 37554

- Author: neo
- Created: 2025-04-23T09:17:13+09:00
- Points: 1

###### [Hacker News 의견](https://news.ycombinator.com/item?id=43738478) 
- 90년대에 "xxx"라는 표현이 오늘날의 의미를 가지지 않았다는 주장은 사실이 아님
- 이 글은 공공재를 유지하는 데 있어서의 어려움을 보여주는 미시적 사례로, 약간의 우울한 분위기를 가짐
  - 작은 서비스는 눈에 잘 띄지 않지만 중요한 역할을 하며, 이를 유지하기 위한 도움을 받기 어려움
  - 서비스가 커지면 주목받게 되고, 이를 다른 목적으로 변질시키려는 시도가 생기며, 이로 인해 도움을 받는 것이 어려워짐
- 과학자들에게 arXiv 없는 세상은 공공 도서관 없는 세상과 같음
- Zenodo를 선호하는 사람도 있으며, 이는 CERN에서 호스팅하고 더 많은 기능을 제공함
- 2021년 Nature 저널은 arXiv를 과학을 변혁시킨 10대 컴퓨터 코드 중 하나로 선정했음
  - 이 기사는 유료 벽 뒤에 있으며, 연간 $199로 열람 가능함
- arXiv의 라이선스 중 일부는 비상업적 용도로만 사용 가능함
  - 특정 논문의 주 페이지에서 라이선스 정보를 확인할 수 있는 방법을 찾고 있음
- arXiv는 .ps, .tex, .pdf 형식의 학술 논문 업로드를 허용함
- 인터넷과 웹은 과학에서 가장 변혁적인 플랫폼임
- arXiv는 컴퓨터 과학 학위가 없는 사람이 프로그래밍 언어를 독자적으로 개발했다는 사실을 믿지 못해 논문을 보류 중임
