1P by GN⁺ 1일전 | ★ favorite | 댓글 1개
  • 광범위한 분석 연구를 통해 과학적 사기가 조직적으로 이루어지고 있는 '산업화' 현상이 드러남
  • 논문 제작 업체, 출판사, 학술지, 중개업자 등이 복잡하게 연결된 사기 네트워크를 형성함
  • 일부 편집자와 저자들이 서로 논문을 맡아주며 부정행위에 공모하는 사례가 발견됨
  • 위조 논문은 최근 들어 폭발적으로 증가하는 추세를 나타내며, 적발 및 논문 철회 속도를 앞지름
  • 출판 및 채용 평가 제도의 병폐와 인센티브 구조가 사기 산업 성장을 부추기는 원인으로 지적됨

과학적 사기 산업의 현황과 분석

서론: 증가하는 과학적 사기의 구조

  • 최근까지 과학 사기를 연구하는 전문가들은 가짜 논문을 대량 생산하는 산업적 규모정교함에 대해 경고함
  • 대규모 조사를 통해 논문 제작 업체, 학술지, 중개인, 출판사 등 다양한 행위자들이 경제적 이득을 목적으로 사기에 관여하는 증거가 확인됨
  • 해당 연구는 수천 건의 논문, 저자, 편집자를 데이터로 삼아 복잡하게 얽힌 사기 메커니즘을 분석함

연구 결과 개요

  • 논문은 Proceedings of the National Academy of Sciences에 발표되어, 편집자·저자 네트워크가 부실 논문을 조직적으로 등재하는 사례가 확인됨
  • 대형 조직이 한꺼번에 가짜 논문을 투고한 뒤 학술지에 싣는 사례와, 브로커(중개인)가 논문 제작업체와 부실 논문을 수용하는 학술지 사이를 연결하는 구조가 발견됨
  • 위조 논문 수는 전체 논문 대비 소수이지만, 증가 속도는 전체 과학논문 성장률을 크게 상회

부정 편집자와 논문의 분석

  • 연구진은 corrupt editors(부정행위 편집자) 탐색을 위해 대형 학술지인 PLOS ONE을 분석 대상으로 선정, 다량의 메타데이터와 편집자 실명이 공개되어 이상 징후 탐색이 용이함
  • PLOS ONE의 논문 철회 이력, PubPeer에 비판 혹은 문제로 지적된 논문들의 담당 편집자를 모두 식별함
  • 33명의 편집자가 유독 철회 및 비판 논문을 반복적으로 담당한 것으로 나타남
    • 사례: 한 편집자가 담당한 79개 논문 중 49개가 철회됨
  • 2024년 기준, 이들 편집자는 전체 논문의 1.3%만 담당했으나, 전체 철회 논문의 거의 1/3을 차지함

편집·저자 간 공모 네트워크

  • 유독 한 저자의 논문을 반복적으로 처리하는 편집자 사례가 다수 있었으며, 이 중 다수는 저자이자 편집자인 경우가 많음
  • 이들 간에는 뇌물 수수 또는 동료 간 비공식 도움 제공 등 다양한 부정 협력 가능성이 제기됨
  • 유사 행위는 Hindawi 등 오픈 액세스 출판사가 발행한 10여 개 학술지에서도 재현
  • 출판사 대표 등은 연구진의 핵심 타깃은 PLOS의 오픈 데이터이지만, 논문 제작 업체 문제는 업계 전반 문제임을 강조

최근 적발된 공모 사례와 문제 확대

  • 최근 Frontiers 출판사도 35명의 편집인·저자 네트워크가 이해충돌을 숨기고 상호 논문 심사를 해준 사실을 적발, 122개 논문을 철회함
  • 해당 네트워크는 7개 이상의 출판사에서 4000편 이상의 논문을 발표했으며, 추가 조사 필요성이 제기됨

중개업자와 논문 제작 업체

  • 단순 제작 업체·공모 네트워크를 넘어, 대량 논문을 여러 저널에 동시 투고하는 조직적 배포행위가 확인됨
  • 이미지 중복 논란이 있는 2000여 편의 논문을 기반으로, 복수 논문에서 동일 이미지가 발견되는 클러스터를 추적함
  • 해당 논문 집단은 특정 시기, 소수 저널에 집중적으로 발표되는 패턴이 뚜렷함
  • 이 과정에선 제작 업체뿐 아니라 브로커(중개인)도 공모 체계에 개입

ARDA 등 조직의 사례

  • 인도 Chennai 기반 Academic Research and Development Association(ARDA) 사례 분석
    • 논문·학위 작업, 저널 실적 확보 등 서비스 제공
    • 자사 웹사이트에서 연구자 대신 논문 등재를 주선하고, 250~500달러의 비용을 요구
  • ARDA는 자체 논문을 생산하는 업체가 아닌, 합법적 외형의 중개업자 역할
  • ARDA 등 조직은 대학원생·신진 연구자를 주요 타깃으로 삼음

사기 논문 급증과 속도

  • 55개 데이터베이스 지정 의심 논문 제품의 연도별 통계를 기반으로 분석
  • 2016~2020년 사이, 의심 논문은 1.5년마다 두 배로 빠르게 증가(전체 논문 증가율의 10배)
  • 논문 철회 및 PubPeer의 문제 제기 건수 또한 각각 3.3년, 3.6년마다 두 배 상승
  • 그러나 적발 속도가 위조 논문 증가 속도를 따라가지 못함에 따라, 과학계 내 사기 비율이 상승함

원인 및 구조적 요인

  • 글로벌 과학계 성장 속도, 영향력 낮은 학술지·익명성 증가, 논문 생산량 중심의 평가 제도 등 여러 요인이 악순환 구조를 조장
  • 젊은 연구자는 동료와의 경쟁에서 살아남기 위해 논문 제작 업체에 의존하는 사례가 급증
  • 일부 의학 분야의 경우, 이 같은 가짜 논문이 체계적 문헌 고찰 및 메타 분석에도 유입되어, 치료법·신약 효과에 대한 인식 왜곡 위험이 동반됨

결론: 산업적 규모의 사기와 대응의 시급성

  • 이미 의심되던 문제였으나, 본 연구는 이를 드라마틱하게 입증한 것에 의미가 큼
  • 연구진 및 전문가들은 학계 전체가 실태를 인지하고 단호한 대응책 마련이 시급함을 강조
  • 채용·평가·출판 등 다양한 이해관계자들이 관련자에게 확실한 처벌과 인센티브 구조 개혁을 도입하지 않으면, 사기 '산업' 문제는 가파르게 확산할 위험
Hacker News 의견
  • 과학적 사기에 여러 가지 종류가 존재함을 발견함. 이 문제들은 섞이면 오히려 혼란만 줄 뿐이라고 생각함

      1. 권위 있는 저널에 실린 논문에서 데이터가 조작된 경우는 매우 심각한 문제임
      1. 정상적인 저널에서 잘못된 방법론을 써서 결론이 틀린 논문—이게 바로 '재현성 위기'임
      1. 검증 없이 대량 생산된 논문, 일명 페이퍼 밀(paper mill)에서 나온 완전 가짜 논문—이들은 찾기 쉽고 아무도 개별적으로 속지 않음
      • 3a. 하지만 이런 논문이 메타 분석에 사용돼 버리면, 사람들이 메타 분석 자체를 믿기 때문에 매우 위험함
    • 문제 1은 도덕적으로 최악이며 생각보다 훨씬 자주 발생함. Nature나 NEJM 같은 저널에 데이터가 조작된 논문이 실리는 건 재앙임
    • 문제 2는 개혁이 가능한 부분임. 실제 여러 분야에서 변화가 일어나는 중임
    • 문제 3은 과학지식 자체에는 큰 영향 없음. 대학이나 펀딩 기관 입장에서는 자기 과학자들이 가짜 논문을 산다는 점이 불만이겠지만 이런 논문들은 무시해도 됨
    • 하지만 문제 3a는 실제 정책에 영향을 줄 수 있어서 아주 심각함
    • 내 경험상 완전히 조작된 데이터는 드물다고 생각함. 하지만 원하는 결과를 얻기 위해 데이터만 선별적으로 선택하거나 통계를 잘못 사용하는 경우는 Nature 포트폴리오 같은 유명 저널에서도 매우 흔하게 일어남. 생명과학, 의학 논문의 적어도 20%는 심각한 방법론적 오류가 있다고 본다고 생각함

      • 이런 일이 일어나는 가장 큰 이유는 왜곡된 인센티브와 권력 불균형 때문임. 학생이나 박사후연구원이 지도교수의 요구에 불응하면 프로젝트에서 쫓겨나고 경력이 끝날 수 있음
      • 반대로 이런 문화를 조장하는 교수들은 사실상 아무런 처벌도 받지 않음. 감독이나 진실성 검증도 없고, 대학도 명백한 데이터 조작이나 사기를 그저 무시함. 결국 규칙을 어길 줄 아는 사람들이 보상을 더 많이 받으니까, 잘못된 행동이 계속됨
    • 악의, 무능, 사고—이 셋은 재현성의 관점에서는 구별이 불가함. 연구자의 의도를 파악할 방법이 없음

      • 이 업계(과학자, 대학, 펀딩기관 등등)가 자정작업과 불량 연구자 처벌을 하지 않으면, 결국 모든 연구결과는 실제로 재현될 때까지는 늘 의심해야 하는 시대가 올 것임
      • 처벌 방식에는 "데이터+방법론 제출 없이는 논문 게재 불가"에서 펀딩 삭감, 거짓말·무능력의 공적 기록 등 다양한 방식이 있을 수 있음
    • 내가 겪은 한 논문 사례를 얘기하고 싶음. 아주 쿨한 논문을 발견해서 문제가 해결될 뻔했음. Tier A 컨퍼런스에 실렸고, 데이터·코드를 곧 공개하겠다고 밝혔음

      • 하지만 아무리 찾아도 데이터, 코드를 구할 수 없었음. 저자, 학과에도 연락해봤지만, 돌아온 답변은 한동안 공개될 계획이 없다는 말뿐.
      • 결국 이 논문은 완전히 조작됐을 수도 있고, 아무 근거도 없는 이야기일 수도 있음
      • 나로서는 실험 데이터, 코드 하나하나 모으는데 엄청난 시간이 소요되는데, 이런 현실에 내 일 자체에 신뢰를 잃게 됨
    • Reinhart-Rogoff 논문과 같은 사례를 예로 들고 싶음. 엑셀 오타 하나 때문에 수많은 정치인들이 긴축 정책을 정당화했는데, 이건 문제 2와 3a 중 어디에 해당하는지 궁금함

    • 문제 3에는 또 다른 부작용이 있음. 음모론자들이 그런 논문을 근거 삼아서 자신만의 엉뚱한 주장에 과학적 신뢰성을 부여함

      • Youtube나 대중과학 기사 등에서 그런 논문을 인용하면서 대중을 현혹함. 내 지인도 최근에 과학에 '관심'을 가지며 엉터리 Youtube 영상만 계속 보내줌
        • 예를 들면 베텔게우스가 초신성이 됐기 때문에 지구가 망했다거나, 기자 피라미드 밑에 외계인만이 팔 수 있는 심층 갱도가 있다거나 하는 것
      • 결국 이런 현상은 과학에 대한 대중의 신뢰를 계속 떨어뜨림
  • 중국의 한 교수가 내 박사 논문의 수식, 그림 등 모든 걸 베껴서 논문을 쓴 사건을 기억함. 다른 랩의 중국인 학생이 두 논문을 비교하다가 너무 똑같아서 알려줬고, 해당 대학에 연락했으나 아무 답변도 못 받았음. 참 좋은 추억임

    • 나도 비슷한 경험이 있음. 영국에서 연구 중이었는데, 중국인 박사후연구원이 우리 메서드와 결과를 중국의 누군가에게 보내주고 있었음. 우리가 모르는 저널에 동시다발적으로 출판됐고, 우리가 할 수 있는 게 거의 없다는 걸 깨달았음. 부끄럽게 해도 전혀 효과가 없었음. 다행히 우리에게 큰 영향은 없었음

    • 농담 삼아, 여행객으로 방문해서 그 사기꾼 교수 사무실에 불쑥 찾아가보라는 방법을 제시하고 싶음

      • 비슷한 상황에서 내 석사 논문을 베껴쓴 사람에게 직접 찾아간 적이 있음. 캠퍼스 당국에 신고하면 왜 내가 방문했는지 공식 보고서가 남으니까 상대방은 더 난감해짐
      • 참고로 이건 중국에서 일어난 일은 아니었음. 아이러니하게도 내가 만난 중국 연구자들은 매우 윤리적이고 성실하게 일하는 이들이었음. 몇몇 소수로 인해 다른 이들의 명성이 훼손되는 건 안타까움
  • 요즘 AI 관련 하이테크 직업에서는 최고 컨퍼런스에 제1저자로 논문을 낸 경력이 필수가 되어가고 있음

    • 초봉이 $150,000 이상인 경우가 많아서 논문 부정행위의 금전적 유인이 충분히 생김
    • 결국 논문 한 편 출판하는 것이 점점 덜 중요해질 것이라 예상함. 시간이 지나면 비즈니스 쪽도 다른 성공 지표를 찾을 것임
    • 논문 출판은 단지 취직용만은 아님. "전문가" 비자로의 이민에도 유리해서, 대기 기간이 짧고 쿼터도 더 많으며 혜택도 좋음

      • 실제 내 주변에서 기록용 논문, 독창적 연구를 돈 주고 전문업체에 만들어달라는 게 일상화되어 있음.
      • 결과적으로 좋은 이민자와 나쁜 이민자 구분에 대한 왜곡된 인식도 함께 생김
    • 최상위 컨퍼런스 논문이 이런 "논문 공장"에서 나오는 논문은 아님

      • 가짜 논문은 특정 저널(PLOS ONE 등)에서 편집자가 처리한 79개 논문 중 49개가 철회된 경우처럼 나타남
      • 이런 일이 최고 컨퍼런스에서는 일어나지 않음
    • 최근 회사들이 논문 출판 경력을 평가할 때 현장에서 논문 재현(reproduction)을 시켜보는 경우도 봄. 모두 이런 문제에 깨어나고 있음

  • "trust the science"(과학을 믿으라)는 구호에 회의가 든다는 의견임

    • 이제는 과학이 인류 발전보다 안정적인 화이트칼라 일자리 싸움으로 변질된 느낌임
    • 이런 일이 "trust the science"란 말을 진짜로 약화시키지는 않음. 단, 개별 논문을 무비판적으로 믿어서는 안 됨

      • 실제 연구를 따라가는 사람은 누구나 이런 점을 잘 알고 있음
      • 종종 아주 혁신적으로 보이는 논문이 나오지만, 따라하면 재현도 안 되고 상용화도 결국 못 하는 경우가 많음
      • 보통 건강 팟캐스터 등 일부 커뮤니티는 이런 논문에 열광하지만, 실제로는 검증이 되어야만 믿음을 줄 필요가 있음
    • "trust the science"가 가능한 이유는 아직 과학 자체가 전반적으로 잘 작동하기 때문임

      • 오히려 'trust the science*'라는 슬로건 아래 자기 입장만 합리화시키고 논문 초록만 인용하는 문화가 신뢰 위기를 키움
      • 진짜 과학은 검증 가능한 실험과 사실에 기반함
      • 만약 과학 자체가 신뢰 불가하면 우리가 뭔가 잘못하고 있다는 신호이고, 과학 그 자체는 여전히 건재함
    • 기사에 따르면 잘못된 논문은 비판받고 철회되고 있음

      • 일부 사기꾼이 있어도 과학 시스템 자체가 의도된 대로 견고하게 작동함을 보여줌
    • 코로나 이후로는 "trust the science"라는 구호조차 자주 못 봄

      • 엉터리 과학은 원래부터 많았고, 오히려 요즘은 부정행위에 대한 대중의 인식과 논문 철회가 더 활발히 이루어지는 느낌임
    • 과학계에 부패와 사기가 많은 건 사실임. 하지만 이런 사기가 대중의 주요 담론을 주도하는 경우는 거의 없음

      • 사기는 대부분 눈에 드러나지 않는 99%의 과학에 숨어 있고, 그래서 쉽게 들키지 않음
  • 예전에는 학계가 순수한 실력주의 공간일 거라 생각했음. 그런데 막상 들어와 보니 기업 세계보다 훨씬 치열하고, 인간의 약함에서 자유로운 조직은 없다는 걸 깨달았음. 모두 인간 본성의 산물이기 때문임

    • 전직 태양광 연구자로서 완전히 똑같은 경험을 했음

      • 세계 최고 연구실에서 석사 논문 작성, 선임 연구원이 발표한 논문 기반으로 실험
      • 몇 달간 미친 듯이 실험했는데 결과를 재현할 수 없었음
      • 우연히 실험 데이터를 박사과정 선배에게 보여줬더니, 논문에 나온 전압 자체가 물리적으로 불가능하며, 전압만 올리면 전력량을 속여서 크게 만들 수 있다는 사실을 알려줌
      • 논문 인용 횟수만 높으면 학계에서 성공하고, 교수는 인용수로만 펀딩을 받게 됨
      • 결국 다수의 실험자, 더 많은 설비, 더 많은 논문, 더 많은 인용이 선순환으로 이어짐
      • 이런 체계에서는 부정행위 유인이 너무 많고, 모두가 알면서도 묵인함
      • 과학은 모든 것이 작은 틈새 분야라, 그 안에서는 모두가 서로를 알기 때문에 부정적 문화가 만연함
      • 7개월을 불가능한 숫자에 집착하느라 허비했고 모든 게 돈과 정치에 좌우되는 시스템임을 깨달아 연구자의 길을 포기함
      • 해결책은 각 논문 발표마다 여러 연구실이 철저히 검증하도록 여러 정부와 교육부가 협력하는 것뿐임. 비싸긴 하지만 다른 방법은 없음
    • 비즈니스 업계에서 일하다 보니 오히려 학계에 대한 인식이 달랐음

      • 정해진 연구비, 정해진 자리만 두고 다같이 경쟁하는 제로섬 게임에, '못 잘리는' 자리까지 배분됨
      • 만약 그런 환경에 있다면 신변에 위협을 느끼며 살아야 할 듯함
      • 비즈니스는 상호이익(win-win) 기회가 많아도 사기가 많은데, 학계라면 더 심각할 것임
    • 학계는 이타주의적이고 깨인 공간이라 생각했음. 실제로 그런 사람들도 많았음

      • 반면 전체 학과 자체가 사기로 덮인 곳도 실제로 존재함
      • 하지만 대부분의 학자들은 학문에 진심으로 임하고, 학생도 챙기고, 외로운 정치 속에서 주어진 일은 성실히 해내려고 노력함
      • tech 업계보다는 그래도 훨씬 나은 모습임
    • Sayre's Law라는 유명한 말이 있음: "학계 정치가 가장 악의적이고 신랄한 이유는 그 판돈이 너무 작기 때문임"

    • 반드시 분리해야 할 점이 있음

      • 지금은 인정 평가, 교육, 연구가 하나로 묶여 있음
      • 최고 기관에서 자격 인증을 받고 싶으면 그곳에 등록해 수업을 들어야 함
      • 그 과정에서 본인은 가르침에 관심 없는 연구자에게 배워야 하고, 실질적으로는 초급 대학원생이 최소 임금 받고 대신 가르침
      • 그런데 이런 환경에 엄청난 학비를 내야 함
  • 이 상황이 전혀 놀랍지 않음. 이것은 과학자 과잉 배출, 극한 경쟁적 시장, 그리고 논문 실적을 인사 평가의 핵심 지표로 삼는 근시안적 결정의 자연스러운 결과임

    • 이런 문제에 놀라는 사람이 있다면, 수십 년간 과학자들이 받아온 심각한 왜곡된 인센티브를 제대로 못 본 것임
  • 여기 언급된 페이퍼 밀 등 사기 논문 유형은 미국에서는 드물게 나타남(미국에도 더 미묘하고 복잡한 종류의 사기가 존재함)

    • 이런 행태는 특정 국가별 학문 환경, 대학 확장 역사와 관련이 있음
    • LLM(대형언어모델) 이전에는 이런 엉터리 논문이 실제 필드에는 별 영향 없었다고 생각함
    • 논문들이 서로만 인용하는 인용고리 안에서만 돌았지, 분야 밖 주류 지식에는 영향이 미미했음
    • 하지만 이제 Deep Research 같은 데서 이런 논문이 활용된다면 문제임
    • 미국에선 기존 구조에서 약간만 바꿔 새롭게 보이게 하고 신선함을 강조하는 논문도 흔함
  • Nature가 얼마나 변해버렸는지 보라고 말하고 싶음

    • 예전엔 생명과학의 대표 저널이었는데, 이제 Nature Portfolio에 아래처럼 수십 종의 하위 저널이 생김
    • Nature Energy는 배터리 과장 논문이 많고, Nature Materials는 표면화학, 나노기술 분야에서 유난히 홍보성 논문이 많음
    • 아마 다른 하위 저널도 비슷한 문제가 있을 거라 의심함
    • "nature partner journals"도 잊으면 안 됨. 사람들은 이 저널들도 "Nature XX"로 부르며 인용함
  • 과학적 사기는 예전부터 한 산업이었고, 실제로는 신호 대 잡음 비(signal to noise ratio)가 충분히 좋으면 그럭저럭 굴러간다고 생각해왔음

    • 혹시 부의 불평등이 심화될 때 학자들에게 생존 부담이 커지고, 그 결과 부정행위가 늘어나는 것은 아닌지 의문임
    • "출판 아니면 도태(publish or perish)"라는 문화가 과학 연구를 완전히 상품화함

      • 내 이론으로는, 1차 세계대전 이전에는 부유한 귀족층이 과학을 진정 즐기며 연구하는 데 헌신했으나, 규모 확장은 어려웠음
      • 그때는 생계형 거짓말이 적었다고 봄
      • 그렇다고 옛 모델로 돌아가면 안 되지만, 과학자를 시스템 내 '교체가능 부품'으로 만들고, 인용수 같은 지표로 영향력을 측정하는 MBA식 접근은 실패할 것이라 생각함
    • 요즘 사기 논문을 탐지하는 신기한 지표로 "tortured phrases"(부자연스러운 기계번역 문구)가 있음

      • 예: Parkinson’s illness/infection/sickness 등
      • 이런 표현은 표절 감지 회피용 패러프레이즈 소프트웨어에서 비롯되고, 저자/에디터/심사자/교정자 모두가 눈치 못 챘다는 건 심각한 문제임
      • 관련 기사: Retraction Watch: All the red flags...
  • 이런 사기가 어느 정도까지 퍼져야 과감하게 과학에 대한 지원을 줄여야 하는지 질문을 던짐

    • 90%가 재현 불가가 되면? 95%? 98%? 건강한 일부 분야까지 손해를 보더라도 확실한 대응이 필요하다는 입장임
    • 온라인상에서 과학지원의 중요성을 주장하는 사람들은 실제 내부 상황이나 과학적 사고와는 동떨어진 팬심이 많음

      • 실제 현장에선 과학 펀딩 기관이 좋은 아이디어에 제대로 자금을 주지 못하고, 시스템을 잘 아는 사람만 살아남게 구조화됨
      • "전문가"라는 말도 결국 이 시스템에서 잘 적응한 사람만 인정받게 됨
      • 새로운 펀딩 시스템이 논의될 때마다 거센 반발이 일어나기도 함
    • 과학을 암(cancer)에 비유하는 건 좋은 논쟁법이 아니라고 생각함

      • 데이터가 있는지, 실제로 90%가 재현불가인지 묻고 싶음
      • 암과 과학 사기가 비슷하다고 할 수 있는 근거가 있는지 궁금함
    • 1970년대의 전반적 번영 감소와 급격한 인플레이션이 대학의 지원 축소를 촉발했고, 그때부터 금융화와 학문적 우수성에서 멀어지기 시작했다고 봄

      • 모두가 그때부터 생존을 위해 경제적 요소에 더 집중해야 했고, 이 분위기가 대학까지 주입됨
      • 이때부터 외국인 유학생 의존도 급증하게 된 계기임