ArXiv, 코넬 대학교로부터의 독립을 선언
(science.org)- 1991년 설립된 선구적인 논문 사전 공개 서버 ArXiv.org가 7월 1일부터 Cornell University로부터 독립한 비영리 법인으로 전환
- 독립을 통해 기부자 기반 확대와 기술 인력 확충을 추진하며, 연간 30만 건에 달하는 급증하는 논문 제출량과 AI 생성 부실 논문(AI slop) 문제에 대응
- 최근 2년간 운영 적자와 50% 증가한 투고량으로 재정 압박이 커졌으며, Cornell은 2025년 29만7천 달러 적자 보전과 81만9천 달러 상당의 현물 지원을 제공
- 창립자 Paul Ginsparg는 대학이 장기적 글로벌 연구 인프라를 유지하기 어렵다고 지적하며, 독립이 지속 가능성 확보에 필수적이라고 언급
- 이번 조치는 bioRxiv·medRxiv의 독립 사례와 유사하며, ArXiv는 초기 재정 안정 상태로 출발해 향후 몇 년간 운영 자금을 확보한 상태
ArXiv의 독립 결정
- ArXiv.org는 1991년 과학 논문의 신속하고 무료인 프리프린트 게시 플랫폼으로 시작해, 20년 넘게 Cornell University의 호스팅을 받아왔음
- 7월 1일부터 독립 비영리 법인으로 전환되며, 새로운 조직의 최고경영자(CEO) 를 모집 중
- Cornell Tech의 부학장 Greg Morrisett은 독립이 더 다양한 기부자 확보와 기술 인프라 확충에 도움이 될 것이라고 설명
- 올해 30만 건 이상의 프리프린트 게시가 예상됨
- AI가 작성한 부실 논문(AI slop) 문제 대응에도 자금이 필요함
재정 구조와 성장 압박
- 2022년 이후 투고 논문이 50% 증가하며, 직원 수를 27명으로 확충
- 2025년 29만7천 달러의 적자가 발생했고, Cornell이 이를 보전함
- Cornell은 또한 81만9천 달러 상당의 현물 지원을 제공
- ArXiv의 연간 운영비는 670만 달러 수준
- 270개 이상의 기관이 연회비를 내며 ArXiv를 지원
- 일부 기관은 연간 최대 1만 달러를 납부
- 회원 기관은 운영 참여권과 이용 데이터 접근권을 가짐
- 주요 후원자로는 Simons Foundation과 Schmidt Sciences가 있으며, 두 기관은 최근 기술 업그레이드 자금을 지원
독립 추진 배경
- Cornell Tech 내부에서도 자금 경쟁이 존재했으며, 일부 단체는 Cornell의 영향력 과다를 우려
- Morrisett과 ArXiv 리더, 기부자들은 독립이 자금 다변화와 확충의 최선책이라 판단
- 창립자 Paul Ginsparg도 독립을 권장
- 그는 대학이 장기적 글로벌 연구 인프라 제공 경험이 부족하다고 지적
- Cornell은 소프트웨어 개발자 고용 능력이 제한적이었고, 사이트는 여전히 단순한 형태 유지
- Cornell과 Simons는 초기 재정 안정 자금을 마련해 ArXiv가 적자 없이 출발하도록 지원
- 단기적으로 회원비 인상 계획은 없음
학계 반응과 우려
- 일부 과학자들은 상업화 가능성과 신임 CEO 연봉 30만 달러 수준에 대해 우려 표명
- ArXiv 측은 이에 동의하지 않음
- Ginsparg는 이러한 우려를 이해하지만, ArXiv의 운영이 항상 불안정한 재정 기반 위에 있었다고 언급
- 그는 이를 1914년 영화 Perils of Pauline에 비유하며, “늘 위태로운 상태였다”고 표현
창립자 Ginsparg의 역할과 향후 계획
- Ginsparg는 여전히 Cornell 교수로 재직하며 ArXiv 운영에 참여 중
- 그는 35년간 ArXiv를 이끌어왔으며, 점차 역할을 줄이고 은퇴를 고려 중
- 새 비영리 조직 출범 후에도 초기 정착을 돕겠지만, 장기적으로는 후임에게 이양할 계획
다른 프리프린트 서버와의 비교
- ArXiv의 독립은 bioRxiv와 medRxiv가 Cold Spring Harbor Laboratory에서 독립해 openRxiv로 이관된 사례와 유사
- 세 플랫폼 모두 비영리 독립 구조를 통한 지속 가능성 확보를 목표로 함
Hacker News 의견들
-
최근 arXiv이 리뷰 논문과 포지션 페이퍼를 거부하겠다고 발표한 건, 플랫폼이 점점 더 ‘의견 중심적’으로 변하고 있다는 신호처럼 느껴짐
원래 arXiv은 단순한 PDF 호스팅 서비스로서, 논문이 정식 출판되기 전 인용될 수 있는 최소한의 신뢰도를 제공하는 역할이었음
하지만 시간이 지나면서 특히 ML 분야에서는 arXiv 자체가 하나의 공식적인 발표 장소(venue) 처럼 되어버림
이제는 arXiv가 가진 힘이 커질수록 본래의 기능에서 멀어진다고 생각함. Cornell과의 분리가 진정한 기능 향상을 위한 것이라고는 믿기 어려움
공식 성명과 FAQ(링크)에서 나온 말들은 전형적인 ‘안심용 문구’로 들림
“사용자들이 기대할 수 있는 긍정적 변화는 무엇인가?”라는 질문에 대한 답은, 아마 부정적 변화를 직접 보게 될 거라는 것뿐임- 물리학, 특히 이론 분야에서는 arXiv에 초안 올리고 피드백을 받아 수정하는 게 오래된 관행이었음. ML만의 문제는 아님
- 나도 비슷한 생각임. ML을 활용하지만 전공은 아닌 입장에서 보면, arXiv만으로 충분하다고 믿는 사람들과, 여전히 정식 저널 출판만이 진짜 연구라고 믿는 사람들 사이의 충돌이 있음
ML 쪽의 빠른 속도는 이해하지만, 동료 평가(peer review) 과정이 주는 가치도 큼. 완전히 버리기보다는 개혁 방향으로 나아가야 함
arXiv 같은 플랫폼이 학계 전체의 개혁을 이끌 수 있다면 좋겠음 - “arXiv의 힘이 약할수록 기능을 더 잘 수행한다”는 말은 ‘최소 권력의 원칙(rule of least power)’ 을 떠올리게 함 (위키 링크)
- 출판 과정을 직접 겪은 입장에서 보면, 기존 저널 출판은 높은 게재비, 불편한 UI, 무의미한 리뷰로 점점 피로해지고 있음. 그래서 arXiv에 올리고 끝내는 게 더 낫다고 느껴짐
- 요즘 arXiv에는 건강·보충제 분야의 사기성 논문도 올라옴. ChatGPT로 만든 가짜 논문을 올리고 ‘출판된 연구’라고 홍보하는 경우도 있음
연구자들은 속지 않지만 일반인은 쉽게 믿음. 최근엔 이런 문서가 너무 많아져서, arXiv의 검수 시스템이 제대로 작동하는지 의문임
-
arXiv 새 CEO의 연봉 30만 달러가 높다는 지적이 있었지만, 비영리 기관이라도 경쟁력 있는 인재를 뽑으려면 그 정도는 필요하다고 생각함
- 미국 외 지역에서는 30만 달러가 터무니없이 높은 금액으로 보임. 미국의 급여 체계가 비정상적으로 높음
- arXiv의 전 세계적 영향력을 생각하면 오히려 낮은 편임. 다만 다른 직원들의 급여 수준도 함께 고려해야 함
- 실리콘밸리 밖에서는 확실히 높은 금액임. arXiv는 주주 가치 극대화를 목표로 하는 조직이 아니므로 과도한 보상은 불필요함
- 비영리단체가 기부금을 낭비하는 ‘편한 자리’를 만드는 건 문제임. arXiv는 결국 클라우드 폴더에 불과하므로 고액 연봉은 납득하기 어려움
- CEO가 굳이 정년 교수급 인물일 필요는 없음. 단순한 프리프린트 저장소임
-
arXiv의 공식 성명은 여기에서 볼 수 있음
- 원문 기사보다는 이 링크가 핵심임. 기사 내용은 CEO 채용 공고를 기반으로 작성된 것임
-
arXiv의 필터링보다 인덱싱(랭킹) 문제를 해결하는 게 더 중요하다고 생각함
웹이 혼란스러웠을 때 Google이 PageRank로 정리했듯, 논문 간 인용 관계를 기반으로 학술용 랭킹 시스템을 만들 수 있지 않을까 궁금함- 나도 같은 생각임. arXiv가 논문을 막는 저널처럼 변하면 존재 이유가 사라짐. 다만 LLM 생성 스팸 논문이 넘쳐나는 지금은 최소한의 필터링은 필요함
완전한 차단이 아니라 남용 방지를 위한 수준이어야 함. 그 외에는 사용자 주도형 랭킹과 태깅 시스템이 더 바람직함 - PageRank 자체가 원래 서지통계학(bibliometrics) 에서 영감을 받은 것이지만, 지금의 학술 랭킹은 이미 왜곡되어 있음. 단순히 랭킹을 손보는 것으로는 해결되지 않음
- 관련된 참고 사이트로 readabstracted.com을 추천함
- 나도 같은 생각임. arXiv가 논문을 막는 저널처럼 변하면 존재 이유가 사라짐. 다만 LLM 생성 스팸 논문이 넘쳐나는 지금은 최소한의 필터링은 필요함
-
arXiv를 미러링하는 건 기술적으로 어렵지 않음. 문제는 사용자를 옮기는 것임
학계는 새로운 시스템 도입에 매우 보수적이지만, arXiv가 정말 쓸 수 없게 된다면 결국 대체 플랫폼으로 이동할 수밖에 없음
arXiv는 여전히 단순한 PDF 저장소에 머물러 있지만, 연구 공유 방식을 혁신할 잠재력이 큼
대학의 영향력에서 벗어나는 건 오히려 좋은 일일 수도 있음. 다만 성공 여부는 운영진의 역량에 달려 있음 -
솔직히 arXiv가 Cornell에서 분리되는 이유를 잘 모르겠음. 해결해야 할 ‘문제’가 보이지 않음
- 기사에 이유가 명확히 나와 있음
- 6번째 단락에서 언급된 문제는 실제로 해결이 필요하다고 생각함
-
국립과학재단(NSF) 같은 기관이 arXiv와 같은 사이트를 운영하면 어떨까 하는 생각을 해봄
인증된 연구자라면 누구나 업로드할 수 있고, 리뷰어로 활동하면 신뢰 점수를 얻는 구조로 만들 수 있을 듯함- 최근 몇 년간의 과학 자금 삭감을 보면, arXiv 같은 핵심 인프라를 정부가 직접 운영하지 않는 게 오히려 다행임
- NIST가 CVE 저장소를 MITRE를 통해 운영하는 사례처럼, 정부 위탁형 모델도 가능함
-
arXiv의 인증(endorsement) 시스템은 독립 연구자에게 큰 장벽임
기관 이메일이나 기존 저자 연결이 없으면 특정 분야(cs.NE)에 업로드할 수 없음
독립성을 강화하려면 비소속 연구자 접근성도 함께 개선되길 바람 -
Cornell이 연간 학비로 5만 달러를 받는 걸 생각하면, CEO 연봉 30만 달러는 그리 큰 금액이 아님
- 뉴욕시 기준으로 보면 30만 달러의 실질 가치가 낮음
- 요즘 대학 등록금 수준을 보면, 그 금액이 얼마나 비현실적인지 알 수 있음
-
관련 영상: YouTube 링크