최근 arXiv이 리뷰 논문과 포지션 페이퍼를 거부하겠다고 발표한 건, 플랫폼이 점점 더 ‘의견 중심적’으로 변하고 있다는 신호처럼 느껴짐
원래 arXiv은 단순한 PDF 호스팅 서비스로서, 논문이 정식 출판되기 전 인용될 수 있는 최소한의 신뢰도를 제공하는 역할이었음
하지만 시간이 지나면서 특히 ML 분야에서는 arXiv 자체가 하나의 공식적인 발표 장소(venue) 처럼 되어버림
이제는 arXiv가 가진 힘이 커질수록 본래의 기능에서 멀어진다고 생각함. Cornell과의 분리가 진정한 기능 향상을 위한 것이라고는 믿기 어려움
공식 성명과 FAQ(링크)에서 나온 말들은 전형적인 ‘안심용 문구’로 들림
“사용자들이 기대할 수 있는 긍정적 변화는 무엇인가?”라는 질문에 대한 답은, 아마 부정적 변화를 직접 보게 될 거라는 것뿐임
물리학, 특히 이론 분야에서는 arXiv에 초안 올리고 피드백을 받아 수정하는 게 오래된 관행이었음. ML만의 문제는 아님
나도 비슷한 생각임. ML을 활용하지만 전공은 아닌 입장에서 보면, arXiv만으로 충분하다고 믿는 사람들과, 여전히 정식 저널 출판만이 진짜 연구라고 믿는 사람들 사이의 충돌이 있음
ML 쪽의 빠른 속도는 이해하지만, 동료 평가(peer review) 과정이 주는 가치도 큼. 완전히 버리기보다는 개혁 방향으로 나아가야 함
arXiv 같은 플랫폼이 학계 전체의 개혁을 이끌 수 있다면 좋겠음
“arXiv의 힘이 약할수록 기능을 더 잘 수행한다”는 말은 ‘최소 권력의 원칙(rule of least power)’ 을 떠올리게 함 (위키 링크)
출판 과정을 직접 겪은 입장에서 보면, 기존 저널 출판은 높은 게재비, 불편한 UI, 무의미한 리뷰로 점점 피로해지고 있음. 그래서 arXiv에 올리고 끝내는 게 더 낫다고 느껴짐
요즘 arXiv에는 건강·보충제 분야의 사기성 논문도 올라옴. ChatGPT로 만든 가짜 논문을 올리고 ‘출판된 연구’라고 홍보하는 경우도 있음
연구자들은 속지 않지만 일반인은 쉽게 믿음. 최근엔 이런 문서가 너무 많아져서, arXiv의 검수 시스템이 제대로 작동하는지 의문임
arXiv 새 CEO의 연봉 30만 달러가 높다는 지적이 있었지만, 비영리 기관이라도 경쟁력 있는 인재를 뽑으려면 그 정도는 필요하다고 생각함
미국 외 지역에서는 30만 달러가 터무니없이 높은 금액으로 보임. 미국의 급여 체계가 비정상적으로 높음
arXiv의 전 세계적 영향력을 생각하면 오히려 낮은 편임. 다만 다른 직원들의 급여 수준도 함께 고려해야 함
실리콘밸리 밖에서는 확실히 높은 금액임. arXiv는 주주 가치 극대화를 목표로 하는 조직이 아니므로 과도한 보상은 불필요함
비영리단체가 기부금을 낭비하는 ‘편한 자리’를 만드는 건 문제임. arXiv는 결국 클라우드 폴더에 불과하므로 고액 연봉은 납득하기 어려움
arXiv를 미러링하는 건 기술적으로 어렵지 않음. 문제는 사용자를 옮기는 것임
학계는 새로운 시스템 도입에 매우 보수적이지만, arXiv가 정말 쓸 수 없게 된다면 결국 대체 플랫폼으로 이동할 수밖에 없음
arXiv는 여전히 단순한 PDF 저장소에 머물러 있지만, 연구 공유 방식을 혁신할 잠재력이 큼
대학의 영향력에서 벗어나는 건 오히려 좋은 일일 수도 있음. 다만 성공 여부는 운영진의 역량에 달려 있음
솔직히 arXiv가 Cornell에서 분리되는 이유를 잘 모르겠음. 해결해야 할 ‘문제’가 보이지 않음
기사에 이유가 명확히 나와 있음
6번째 단락에서 언급된 문제는 실제로 해결이 필요하다고 생각함
국립과학재단(NSF) 같은 기관이 arXiv와 같은 사이트를 운영하면 어떨까 하는 생각을 해봄
인증된 연구자라면 누구나 업로드할 수 있고, 리뷰어로 활동하면 신뢰 점수를 얻는 구조로 만들 수 있을 듯함
최근 몇 년간의 과학 자금 삭감을 보면, arXiv 같은 핵심 인프라를 정부가 직접 운영하지 않는 게 오히려 다행임
NIST가 CVE 저장소를 MITRE를 통해 운영하는 사례처럼, 정부 위탁형 모델도 가능함
arXiv의 인증(endorsement) 시스템은 독립 연구자에게 큰 장벽임
기관 이메일이나 기존 저자 연결이 없으면 특정 분야(cs.NE)에 업로드할 수 없음
독립성을 강화하려면 비소속 연구자 접근성도 함께 개선되길 바람
Cornell이 연간 학비로 5만 달러를 받는 걸 생각하면, CEO 연봉 30만 달러는 그리 큰 금액이 아님
Hacker News 의견들
최근 arXiv이 리뷰 논문과 포지션 페이퍼를 거부하겠다고 발표한 건, 플랫폼이 점점 더 ‘의견 중심적’으로 변하고 있다는 신호처럼 느껴짐
원래 arXiv은 단순한 PDF 호스팅 서비스로서, 논문이 정식 출판되기 전 인용될 수 있는 최소한의 신뢰도를 제공하는 역할이었음
하지만 시간이 지나면서 특히 ML 분야에서는 arXiv 자체가 하나의 공식적인 발표 장소(venue) 처럼 되어버림
이제는 arXiv가 가진 힘이 커질수록 본래의 기능에서 멀어진다고 생각함. Cornell과의 분리가 진정한 기능 향상을 위한 것이라고는 믿기 어려움
공식 성명과 FAQ(링크)에서 나온 말들은 전형적인 ‘안심용 문구’로 들림
“사용자들이 기대할 수 있는 긍정적 변화는 무엇인가?”라는 질문에 대한 답은, 아마 부정적 변화를 직접 보게 될 거라는 것뿐임
ML 쪽의 빠른 속도는 이해하지만, 동료 평가(peer review) 과정이 주는 가치도 큼. 완전히 버리기보다는 개혁 방향으로 나아가야 함
arXiv 같은 플랫폼이 학계 전체의 개혁을 이끌 수 있다면 좋겠음
연구자들은 속지 않지만 일반인은 쉽게 믿음. 최근엔 이런 문서가 너무 많아져서, arXiv의 검수 시스템이 제대로 작동하는지 의문임
arXiv 새 CEO의 연봉 30만 달러가 높다는 지적이 있었지만, 비영리 기관이라도 경쟁력 있는 인재를 뽑으려면 그 정도는 필요하다고 생각함
arXiv의 공식 성명은 여기에서 볼 수 있음
arXiv의 필터링보다 인덱싱(랭킹) 문제를 해결하는 게 더 중요하다고 생각함
웹이 혼란스러웠을 때 Google이 PageRank로 정리했듯, 논문 간 인용 관계를 기반으로 학술용 랭킹 시스템을 만들 수 있지 않을까 궁금함
완전한 차단이 아니라 남용 방지를 위한 수준이어야 함. 그 외에는 사용자 주도형 랭킹과 태깅 시스템이 더 바람직함
arXiv를 미러링하는 건 기술적으로 어렵지 않음. 문제는 사용자를 옮기는 것임
학계는 새로운 시스템 도입에 매우 보수적이지만, arXiv가 정말 쓸 수 없게 된다면 결국 대체 플랫폼으로 이동할 수밖에 없음
arXiv는 여전히 단순한 PDF 저장소에 머물러 있지만, 연구 공유 방식을 혁신할 잠재력이 큼
대학의 영향력에서 벗어나는 건 오히려 좋은 일일 수도 있음. 다만 성공 여부는 운영진의 역량에 달려 있음
솔직히 arXiv가 Cornell에서 분리되는 이유를 잘 모르겠음. 해결해야 할 ‘문제’가 보이지 않음
국립과학재단(NSF) 같은 기관이 arXiv와 같은 사이트를 운영하면 어떨까 하는 생각을 해봄
인증된 연구자라면 누구나 업로드할 수 있고, 리뷰어로 활동하면 신뢰 점수를 얻는 구조로 만들 수 있을 듯함
arXiv의 인증(endorsement) 시스템은 독립 연구자에게 큰 장벽임
기관 이메일이나 기존 저자 연결이 없으면 특정 분야(cs.NE)에 업로드할 수 없음
독립성을 강화하려면 비소속 연구자 접근성도 함께 개선되길 바람
Cornell이 연간 학비로 5만 달러를 받는 걸 생각하면, CEO 연봉 30만 달러는 그리 큰 금액이 아님
관련 영상: YouTube 링크