3P by neo 21일전 | ★ favorite | 댓글 1개
  • 메타의 불법 토렌팅 의혹

    • 최근 공개된 이메일은 메타가 불법적으로 AI 모델을 해적판 책으로 훈련시켰다는 저작권 소송에서 중요한 증거로 제시됨.
    • 메타는 LibGen이라는 논란의 데이터셋을 토렌팅했다고 인정했으며, 이는 수천만 권의 해적판 책을 포함함.
    • 메타는 Anna’s Archive를 통해 여러 섀도우 라이브러리에서 최소 81.7 테라바이트의 데이터를 토렌팅했으며, 이 중 35.7 테라바이트는 Z-Library와 LibGen에서 가져옴.
    • 저자들은 메타의 불법 데이터 해적 행위가 매우 심각하다고 주장하며, 소량의 저작권 침해도 형사 조사로 이어질 수 있다고 강조함.
  • 저자들의 배포 이론 확장

    • 메타의 토렌팅과 시딩에 대한 정보 요청이 거부되었으나, 저자들은 자체적으로 증거를 수집함.
    • 메타의 연구 엔지니어인 Nikolay Bashlykov는 "기업 노트북에서 토렌팅은 옳지 않다"며 우려를 표명함.
    • Bashlykov는 법무팀과 직접 상담하며, 토렌트 사용이 불법일 수 있음을 강조함.
  • 메타의 시딩 은폐 의혹

    • 메타는 Facebook 서버를 사용하지 않고 데이터를 다운로드하여 시딩을 은폐하려 했다는 내부 메시지가 공개됨.
    • 프로젝트 관리 책임자인 Michael Clark는 시딩을 최소화하기 위한 설정 변경을 언급함.
    • 저자들은 새로운 정보가 이전 증언과 모순된다고 주장하며, 관련자들의 재조사를 요구함.
    • 마크 저커버그는 LibGen 사용 결정에 관여하지 않았다고 주장했으나, 이메일은 그가 관련되었음을 시사함.
  • 메타의 법적 대응

    • 메타는 AI 훈련이 공정 사용이라고 주장하며, 저자들의 책이 실제로 배포되지 않았다고 법원에 제출함.
    • 메타는 저작권 침해 주장에 대해 법적 대응을 준비 중임.
Hacker News 의견
  • YouTube, Google, Spotify 모두 초기에는 저작권을 위반하여 성장했음. 기업들은 자신의 지적 재산권을 보호하면서도 타인의 권리는 쉽게 침해함. 개인은 이런 특권이 없으며, 법을 지키려는 사람들은 결국 손해를 봄

  • Thomas Babington Macaulay의 저작권에 대한 연설을 읽어볼 것을 권장함. 저작권 연장은 종종 출판사에게만 이익이 됨

  • Meta가 저작권 있는 자료로 LLM을 훈련했다는 것은 명백함. 그들의 논문에서도 이를 인정하고 있음. 법적으로 AI 모델을 저작권 있는 자료로 훈련하는 것이 가능한지에 대한 논의가 필요함

  • Libgen은 인류의 문명적 프로젝트로 지지받아야 하며, 처벌받아서는 안 됨. 미래에는 우리가 얼마나 어리석었는지 깨닫게 될 것임

  • 많은 사람들이 대기업, 특히 Meta를 비판하며 처벌을 요구하지만, 지적 재산권 법을 개정하는 것이 더 현명함

  • 과거 인터넷 사용자들은 저작권 법이 너무 엄격하다고 생각했으며, 이는 소수의 이익을 위해 인류의 지식을 제한한다고 주장했음

  • Meta AI를 사용한 적이 없으며, 주변에서도 사용하는 사람을 본 적이 없음. Meta의 ROI가 무엇인지 이해하기 어려움

  • Meta 직원들이 저작권 있는 콘텐츠의 불법 다운로드 및 배포에 대해 거짓말을 했다는 기사가 있음

  • 대기업이 자동차를 다운로드하는 것은 괜찮지만, 개인이 하면 문제가 됨