3P by GN⁺ 6시간전 | ★ favorite | 댓글 1개
  • 메타는 AI 모델 학습을 위해 비트토렌트를 통해 불법 도서를 다운로드 및 업로드한 행위가 공정 이용에 해당한다고 주장
  • 회사는 비트토렌트의 업로드 기능이 기술적으로 불가피한 과정이며, 데이터 확보를 위한 유일하고 효율적인 수단이었다고 설명
  • 저자 측은 새로운 공정 이용 방어 논리가 소송 기한 이후 제출되었다며 절차 위반을 지적했으나, 메타는 이미 방어 논리를 명시했다고 반박
  • 메타는 또한 저자들이 자사 AI 모델이 책 내용을 복제하거나 시장 피해를 입혔다고 입증하지 못했다는 점을 강조
  • 이번 논쟁은 AI 학습용 데이터 수집과 저작권의 경계를 가르는 핵심 판례로 주목받고 있음

메타의 공정 이용 주장과 배경

  • 메타와 다른 기술 기업들은 Anna’s Archive 등 쉐도 라이브러리에서 비트토렌트를 통해 도서를 수집해 AI 모델 학습에 사용
    • 이 과정에서 저작권자의 허락 없이 저작물을 활용했다는 이유로 2023년 여러 작가들이 집단 소송 제기
    • 원고에는 Richard Kadrey, Sarah Silverman, Christopher Golden 등이 포함
  • 법원은 2025년 여름, 불법 도서를 학습 데이터로 사용하는 행위 자체는 공정 이용에 해당한다고 판단
    • 그러나 비트토렌트를 통한 다운로드 및 업로드 행위에 대해서는 판단이 남아 있었음

비트토렌트 업로드의 공정 이용 논리

  • 메타는 최근 캘리포니아 연방법원에 보충 답변서를 제출, 업로드 행위도 공정 이용에 포함된다고 주장
    • 비트토렌트는 구조상 파일을 다운로드할 때 자동으로 일부 데이터를 타인에게 업로드하는 기술임
    • 따라서 업로드는 선택이 아닌 프로토콜의 본질적 기능이라는 설명
  • 메타는 Anna’s Archive의 데이터셋이 토렌트 형태로만 제공되었기 때문에, 비트토렌트를 사용할 수밖에 없었다고 명시
    • “데이터셋을 얻기 위한 효율적이고 신뢰할 수 있는 수단이었다”는 변호인 발언 인용
    • 업로드 과정은 AI 학습이라는 변형적 공정 이용 목적을 위한 필수 절차로 간주

저자 측의 반발과 절차 논쟁

  • 저자 측은 메타가 소송 기한 이후 새로운 방어 논리를 추가했다며 법원에 항의 서한 제출
    • 메타가 2024년 11월부터 업로드 관련 주장을 인지하고 있었음에도 공정 이용 방어를 제시하지 않았다고 주장
    • 연방법 규정(Rule 26(e))은 증거 보완 의무를 부여하지만, 새로운 방어 논리를 추가할 수 있는 ‘허점’은 아니다고 강조
  • 이에 대해 메타는 2025년 12월 공동 사건 관리 문서에서 이미 해당 방어를 명시했다며 반박
    • 저자 측 변호인도 당시 법정에서 이를 언급했다고 주장

저자 증언과 시장 피해 논점

  • 메타는 저자들의 증언을 인용해 시장 피해가 없음을 강조
    • 모든 원고가 자신의 책 내용이 메타 모델 출력에 복제된 사례를 알지 못한다고 진술
    • Sarah Silverman은 “모델이 책 내용을 출력하지 않는다면 상관없다”고 증언
  • 메타는 이를 근거로 저자들이 실질적 피해나 매출 손실을 입증하지 못했다고 주장
    • 따라서 이번 소송은 책 보호보다 학습 과정 자체를 문제 삼는 것에 불과하다고 설명

미국 AI 경쟁력과 향후 쟁점

  • 메타는 답변서에서 AI 투자와 데이터 활용이 미국의 글로벌 AI 리더십을 강화했다고 강조
    • 이러한 기술적 진보가 국가적 자산으로서 보호받을 가치가 있다는 입장
  • 재판부는 향후 ‘기술적 불가피성에 따른 공정 이용’ 논리를 인정할지 여부를 판단해야 함
    • 이번 판결은 AI 학습 데이터 수집과 저작권의 경계를 규정할 중요한 선례가 될 가능성 있음
  • 현재 남은 쟁점은 비트토렌트 배포 행위에 대한 직접 침해 여부이며, 판사의 결정이 주목됨
Hacker News 의견들
  • 예전에 RIAA가 아이들이 Metallica 앨범을 파일공유로 받았다고 소송을 걸던 시절을 기억함
    노래 한 곡당 10만 달러를 청구했는데, 실물 CD를 훔쳤을 때 피해액이 곡당 1달러 정도였던 걸 생각하면 터무니없는 금액이었음
    법원은 이 금액을 진지하게 받아들였고, 보통 3천 달러 정도로 합의했지만 여전히 실제 피해액의 30배 수준이었음
    심지어 영화 Wolverine의 초본이 유출됐을 때도, 법적으로 청구 가능한 최대 금액은 15만 달러였음

    • Metallica 멤버들이 직접 이런 소송을 주도했다는 걸 기억함
      단순히 RIAA나 음반사가 잔인했던 게 아니라, Metallica 자신이 팬들을 상대로 싸웠던 것임
    • 그래도 그 덕분에 Metallicops 같은 재밌는 플래시 애니메이션이 나왔음
      YouTube 링크
    • 그렇다면 지금은 BitTorrent로 미디어를 받다가 걸리면, “로컬 모델 학습용으로 썼으니 공정 이용”이라고 주장할 수 있는 건지 궁금함
    • 하지만 그들은 억만장자임. 사회에서 가장 ‘보호받아야 할’ 존재들이라며 풍자함. 아이들이 대신 희생양이 되는 셈임
    • 2003년에 저작권이 이렇게 약했다면 얼마나 기뻤을까 생각함
      만약 이런 변화가 기업뿐 아니라 일반인에게도 적용된다면, 저작권이 사회 발전을 막는 정도가 줄어들 것임
      저작권 약화는 혁신의 해방으로 이어질 수 있음
      저작권이란 ‘복제할 권리를 특정 집단에게만 제한하는 법’인데, 멀리서 보면 정말 부조리한 제도처럼 보임
  • BitTorrent는 기본적으로 파일을 받을 때 자동으로 업로드도 하게 되어 있음
    즉, 업로드는 선택이 아니라 프로토콜의 본질이라는 주장인데, 법정에서 이걸 증명하기는 어렵다고 봄

    • 완전히 자동은 아님. 시딩(seeding) 은 기본값이지만 수동으로 끌 수 있음
      대부분의 사용자는 설정을 건드리지 않기 때문에 자신도 모르게 시딩을 하는 것임
      하지만 프로토콜 자체가 강제하는 건 아니고, 업로드를 0으로 제한하거나 트래커에 거짓말을 하는 것도 가능함
      즉, 시딩은 기술적 의무가 아니라 커뮤니티 규범에 가까움
    • 이런 논리를 법정에서 써본 적이 없다는 게 놀라움
      그렇다면 과거의 BitTorrent 음악 다운로드 사건들도 다시 재심해야 하는지 의문임
    • “총을 쏘면 사람이 죽는 건 기술의 작동일 뿐”이라는 비유로, 기술 탓만 하는 건 책임 회피라고 비판함
    • 설령 법원이 그 주장을 받아들여도, 사용자가 그 사실을 미리 알고 있었다면 책임을 피할 수 없음
    • 예전에는 이런 사람들을 “leechers”라고 불렀다며, 관련된 xkcd 만화를 언급함
  • 예전에는 대기업이 법정에서 친해적 복제(pro-piracy) 입장을 취할 거라 상상도 못했음
    반면, 예전의 해적행위를 옹호하던 활동가들이 이제는 대기업이 그걸 하니까 반대하는 상황이 됨

    • 활동가들도, 대기업들도 각자 다른 이해관계를 가짐
      “정보는 자유로워야 한다”는 쪽과 “예술가의 생계”를 중시하는 쪽이 다름
      AI 기업과 출판사는 같은 ‘대기업’이라도 이익 구조가 다름
    • 활동가들이 반대하는 이유는 대기업이 또다시 개인 창작자들을 착취하기 때문임
      Meta가 Nintendo IP를, OpenAI가 Netflix IP를 토렌트로 받는다면 아무도 신경 안 쓸 것임
    • 내 나라에서는 모든 저장매체 판매에 저작권 보상금(Artisjus) 이 포함되어 있음
      복제를 안 해도 이미 돈을 냈으니, 도덕적으로 불법 다운로드에 죄책감이 없음
      같은 논리로, AI 기업도 데이터 스크래핑에 대해 불평할 자격이 없음
    • 과거의 해적들은 단순히 즐기기 위해 복제했지만, 지금의 대기업은 이윤을 위해 훔침
      전자는 감옥에 갔고, 후자는 돈을 벌고 있음
    • 결국 돈의 흐름은 예전과 다르지 않음
      법원은 그저 정류기 다이오드처럼 한쪽 방향으로만 흐르게 만드는 존재일 뿐임
  • 대기업들이 이제 Anna’s Archive 같은 섀도우 라이브러리에 직접 돈을 주고 접근할지도 궁금함
    Nvidia가 그렇게 했다는 소문도 있음
    Meta 입장에서는 수만 달러는 미미한 금액이지만, Anthropic 사건처럼 흘러간다면 가능성 있음
    물론 작가들이 여전히 LLM에게 자기 책 내용을 물어볼 수 있겠지만, 증거가 줄어들면 소송 가능성은 낮아질 것임

    • 이미 그런 거래가 존재함이라고 단언함
  • Meta의 이번 주장은 궁지에 몰린 변명처럼 보임
    법원이 받아들일 가능성은 낮고, 결국 집단소송 합의로 끝날 것 같음
    대표 원고들은 꽤 큰 금액을 받을 수 있겠지만, 나머지 작가들은 거의 잔돈 수준일 것임
    만약 원고가 대형 미디어 회사였다면 훨씬 비싼 싸움이 됐을 것임

  • Meta가 이 논리를 실제로 성공시킨다면, 나도 책을 훔쳐서 공유해도 되는 건지 궁금함
    음악, 영화, 게임에도 같은 논리가 적용되는지 의문임

    • Facebook만 가능함”이라고 냉소적으로 답함
  • 언젠가는 “법은 공정하다”는 이상과 “법은 권력에 휘어진다”는 현실의 모순이 해결되어야 함

    • 나쁜 소식임. 이미 그 문제는 해결되어 있음
    • Disney 등이 법을 이용해 자신들의 이익을 극대화한 건 비극적인 사례
      Copyright Term Extension Act 참고
    • 그들이 권력을 포기하기 전에 핵이 먼저 떨어질 것이라 냉소함
    • 법은 언제나 권력자의 폭력 수단이었음
      약자가 따르지 않으면 처벌받는 구조임
    • 법은 과학이 아니라 해석의 영역이기 때문에 완전히 공정할 수 없음
      “살인”, “사기”, “절도” 같은 개념도 모호함
      해결책은 더 나은 시민 교육뿐이라고 생각함
  • Meta가 이런 소송을 굳이 싸우는 게 의외임
    논리 자체가 우스꽝스러워 보이지만, 기업 입장에서는 법을 어기고 벌금을 내는 게
    법을 지켜서 이익을 놓치는 것보다 싸게 먹히는 구조
    결국 이런 소송비용도 사업 비용의 일부로 처리될 것임

  • 90~2000년대에는 FBI가 거리에서 불법 VHS/DVD를 파는 노숙자들을 단속하곤 했음

    • 미국에서 진짜 범죄는 가난한 것 자체였다고 생각함
    • 당시 ICE가 이런 사건의 공급망을 추적했는데, 지금 보면 순진하게 느껴짐
      그래도 그들은 아동 착취 같은 범죄에는 관여하지 않았음
      오늘날 ICE나 FBI가 그런 사건을 발견한다면, 누구에게 먼저 연락할까라는 질문을 던짐
  • 법원이 일관성을 잃고, 언제나 법인(기업) 을 사람처럼 대우하면서
    실제 인간이나 다른 생명체를 상품처럼 취급할 때 존경을 잃음
    질서와 발전을 유지할 더 나은 방식이 필요함