# Zuckerberg가 Meta의 저작권 침해를 “개인적으로 승인하고 적극적으로 장려했다”

> Clean Markdown view of GeekNews topic #29231. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=29231](https://news.hada.io/topic?id=29231)
- GeekNews Markdown: [https://news.hada.io/topic/29231.md](https://news.hada.io/topic/29231.md)
- Type: GN+
- Author: [neo](https://news.hada.io/@neo)
- Published: 2026-05-07T01:35:20+09:00
- Updated: 2026-05-07T01:35:20+09:00
- Original source: [variety.com](https://variety.com/2026/digital/news/meta-ai-mark-zuckerberg-copyright-infringement-lawsuit-publishers-scott-turow-1236738383/)
- Points: 1
- Comments: 1

## Topic Body

- **[Meta](https://variety.com/t/meta/)** 와 CEO **[Mark Zuckerberg](https://variety.com/t/mark-zuckerberg/)** 가 AI 시스템 학습을 위해 수백만 권의 책·논문·기사 등 저작물을 불법 복제했다는 혐의로 5개 출판사와 [Scott Turow](https://variety.com/t/scott-turow/)에게 피소됨
- Meta는 악명 높은 해적 사이트에서 저작권 자료 수백만 건을 토렌트로 내려받고, 무단 웹 스크레이프 자료를 여러 차례 복제해 **Llama** 학습에 사용했다는 혐의를 받음
- 소송은 2026년 5월 5일 미국 뉴욕 남부지방법원에 제기됐으며, **Hachette**, **Macmillan**, **McGraw Hill**, **Elsevier**, **Cengage**와 Scott Turow가 특정되지 않은 금전적 손해배상을 청구함
- Meta는 저작권 자료를 AI 학습에 쓰는 것이 **공정 이용**에 해당할 수 있다는 법원 판단이 있었다며 적극 대응하겠다고 밝혔고, 2025년 6월에는 Llama 학습 관련 저자들의 청구가 기각된 바 있음
- 이번 소송은 Meta가 라이선스 전략을 검토하다가 **Zuckerberg의 개인적 지시**로 중단했고, **LibGen** 사용 위험을 알면서도 267TB가 넘는 해적판 자료 다운로드를 승인했다는 점을 핵심 차별점으로 내세움

---

### 소송의 핵심
- [Meta](https://variety.com/t/meta/)와 CEO [Mark Zuckerberg](https://variety.com/t/mark-zuckerberg/)가 AI 시스템 학습을 위해 수백만 권의 책, 논문, 기사 등 저작물을 불법 복제했다는 혐의로 5개 출판사와 작가 [Scott Turow](https://variety.com/t/scott-turow/)에게 피소됨
- Meta와 Zuckerberg는 생성형 AI 모델을 만들기 위해 “move fast and break things”라는 Meta의 잘 알려진 구호를 따랐고, 악명 높은 해적 사이트에서 저작권이 있는 책과 저널 논문 수백만 건을 토렌트로 내려받았다는 혐의를 받음
- Meta는 거의 전체 인터넷에 해당하는 무단 웹 스크레이프 자료를 내려받고, 이를 여러 차례 복제해 Meta의 수십억 달러 규모 생성형 AI 시스템 **Llama** 학습에 사용했다는 혐의를 받음
- 이 행위는 “역사상 가장 대규모의 저작권 자료 침해 중 하나”로 규정됨

### 원고와 청구 내용
- 소송은 2026년 5월 5일 화요일, 미국 뉴욕 남부지방법원에 제기됨
- 원고는 **Hachette**, **Macmillan**, **McGraw Hill**, **Elsevier**, **Cengage** 등 5개 출판사와 Scott Turow 개인임
- 제안된 집단소송은 저작권 침해 혐의에 대해 특정되지 않은 금전적 손해배상을 청구함
- 소장 사본은 [이 링크](https://publishers.org/wp-content/uploads/2026/05/2026-05-05-Complaint.pdf)에서 제공됨

### Meta의 반박과 기존 판례
- Meta 대변인은 “AI는 개인과 기업을 위한 혁신, 생산성, 창의성을 가능하게 하고 있으며, 법원은 저작권 자료를 AI 학습에 사용하는 것이 공정 이용에 해당할 수 있다고 올바르게 판단해 왔다”고 밝힘
- Meta는 이 소송에 적극적으로 맞서겠다는 입장임
- 저자들이 AI 기업을 상대로 저작권 침해 소송을 제기했다가 패소한 사례가 있음
- 2025년 6월, 연방 판사는 Sarah Silverman과 Junot Díaz를 포함한 13명의 저자가 Meta의 AI 모델 학습이 저작권을 침해했다며 제기한 청구를 [기각함](https://variety.com/2025/biz/news/judge-rejects-claim-meta-ai-training-copyright-1236441270/)
- 당시 Vincent Chhabria 판사는 Meta가 약 20만 권의 책으로 구성된 데이터셋을 Llama 언어 모델 학습에 사용한 것이 **공정 이용**에 해당한다고 판결함

### 이번 소송의 차별점
- 이번 소송은 Meta와 Zuckerberg가 저작권 보호 장치를 의도적으로 우회했다는 점을 앞세움
- Meta는 저작물을 라이선스하는 방안을 검토했지만, “Zuckerberg의 개인적 지시”에 따라 그 전략을 포기했다는 혐의를 받음
- 소송은 문제의 행위가 미국 저작권법상 공정 이용 조항의 보호 범위를 벗어난다고 봄
- 소장에는 Meta가 Zuckerberg의 지시에 따라 원고와 집단 구성원이 소유하거나 관리하는 저작물을 포함해 수백만 권의 책, 저널 논문, 기타 저작물을 무단 복제했고, Llama 학습을 위해 추가 복제본을 만들었다는 내용이 담김
- Zuckerberg는 침해를 “개인적으로 승인하고 적극적으로 장려했다”는 혐의를 받음
- Meta는 훔친 저작물에서 **저작권 관리 정보**를 제거해 학습 출처를 숨기고 무단 사용을 쉽게 만들었다는 혐의를 받음

### 라이선스 검토와 중단
- 소송에 따르면 Meta는 Llama 1 출시 이후 주요 출판사와 라이선스 계약을 맺는 방안을 잠시 검토함
- Meta는 2023년 1월부터 4월까지 회사의 **데이터셋 라이선스** 예산을 최대 2억 달러까지 늘리는 방안을 논의함
- 2023년 4월 초 Meta는 라이선스 전략을 갑자기 중단한 것으로 제시됨
- 저작권 자료를 앞으로 라이선스할지, 해적판을 사용할지에 대한 문제가 Zuckerberg에게 “상향 보고”됐다고 소장에 적시됨
- 이 상향 보고 이후 Meta의 사업개발팀은 라이선스 노력을 중단하라는 구두 지시를 받았다고 원고 측이 밝힘
- 소장에는 한 Meta 직원이 “책 한 권이라도 라이선스하면 공정 이용 전략에 기대기 어려워질 것”이라는 취지로 그 이유를 설명했다는 내용이 포함됨

### Meta의 기존 라이선스 경험
- Meta와 Zuckerberg는 AI 학습 자료 라이선스 시장을 잘 알고 있었다는 점이 제시됨
- 소장에 따르면 Meta는 2022년에 아프리카 언어권 도서 출판사들과 제한된 학습 세트에 대한 라이선스 4건을 체결함
- Meta는 이후 Fox News, CNN, USA Today를 포함한 주요 뉴스 출판사들과도 라이선스 계약을 체결함

### LibGen 사용과 내부 위험 검토
- 소장에 따르면 2023년 12월 13일 Meta 직원들은 **LibGen** 사용의 법적 위험을 다룬 내부 메모를 회람함
- 해당 Meta 메모는 LibGen을 “우리가 해적판임을 알고 있는 데이터셋”이라고 표현함
- 같은 메모에는 “학습에 사용된 LibGen 데이터셋 사용 사실을 공개하지 않을 것”이라는 내용도 있었다고 소장에 적시됨
- 이런 우려는 결국 받아들여지지 않은 것으로 제시됨
- 소장에 따르면 Zuckerberg와 다른 Meta 임원들은 267TB가 넘는 해적판 자료의 토렌트 다운로드를 승인하고 지시함
- 이 분량은 수억 건의 출판물에 해당하며, 미국 의회도서관 전체 인쇄 장서 규모의 여러 배에 달한다고 제시됨

### Llama 출력물에 대한 주장
- 침해 혐의의 결과로 Meta의 AI 시스템은 학습에 사용된 원고와 집단 구성원의 저작물을 대체할 수 있는 결과물을 빠르고 대규모로 생성한다는 혐의를 받음
- 소장에 따르면 이런 대체물에는 원문과 거의 같은 복제물, 학술 교과서의 대체 챕터, 유명 소설과 저널 논문의 요약 및 대안 버전이 포함됨
- Llama는 원저작물의 창작 요소를 복제한 저품질 모방물과 권리자에게만 배타적으로 허용된 2차적 저작물도 생성한다는 혐의를 받음
- 소장에 따르면 Llama는 특정 작가의 표현 요소와 창작적 선택을 모방하도록 출력물을 맞춤 생성하기도 함

## Comments


### Comment 56966

- Author: neo
- Created: 2026-05-07T01:35:21+09:00
- Points: 1

###### [Hacker News 의견들](https://news.ycombinator.com/item?id=48026207) 
- 이 일로 Zuckerberg가 각 침해 건마다 **법정 최저 손해배상액**인 750달러라도 물게 된다면 기뻐할 사람이 많을 듯함  
  이전 Anthropic 침해 사건에서는 AI 학습 자체는 변형적 이용이고 그 자체로 침해가 아니지만, 그 목적을 위해 저작물을 불법 복제한 행위는 명백히 침해라고 봤음  
  합의금이 15억 달러였고, 불법 복제한 50만 건당 거의 3천 달러꼴이었으니 Zuckerberg가 “수백만” 건을 불법 복제했다면 **60억 달러 합의**도 꽤 그럴듯함
  - 예전에 MP3 사이트를 운영했다는 이유로 형사처벌을 받은 아이들[1]을 생각하면 답답함  
    그런데 이 사람은 존재하는 거의 모든 미디어를 훔쳐 쓰고도, 기소될 수 없을 만큼 부자라서 그대로 빠져나갈 것 같음  
    [1] 예: [https://en.wikipedia.org/wiki/Oink%27s_Pink_Palace#Legal_pro...](<https://en.wikipedia.org/wiki/Oink%27s_Pink_Palace#Legal_proceedings>)
  - DJT가 대통령인 동안에는 Zuckerberg나 **Meta**에게 아무 일도 안 생길 것 같음  
    법을 어겨도 되는 최고의 보호막을 사둔 셈임
  - 이 정도로는 전혀 인상적이지 않음. 그렇게 해놓고도 어떻게 계속 **AI 독점자/패권자**로 남을 수 있는지 모르겠음  
    사실상 묻지도 않고 전부 강제 인수해 놓고, 나중에 가격 흥정을 하는 꼴임. 형사 기소는 어디 갔고, 자유가 아니라면 최소한 지분 자산 박탈이라도 어디 갔나 싶음
  - 결국 **지식재산권 변호사**를 응원하게 될 줄은 몰랐음
  - 맥락상 Zuckerberg의 순자산은 약 **2,200억 달러**임

- 예전에 MP3를 내려받기만 하고 재배포도 안 한 학생들에게 온갖 소송을 걸었음  
  공정 이용으로 볼 만한 변형도 없고 그냥 파일 다운로드였다는 이유였는데, 배운 교훈은 그 학생들이 차라리 **수백만 건을 훔쳤어야 했다**는 것임
  - 그건 **정보 여론 조성 캠페인**이었을 수도 있음  
    최종 이용자도 기소될 수 있으면 담론 자체가 긍정에서 부정으로 바뀌고, 권력을 가진 쪽이 그 행동을 억제하기 쉬워짐
  - 진짜 구분 기준은 **엄청난 부자냐 아니냐**임

- 몇 주 전에 개인 cgit 서버에서 **Meta의 ASN**을 차단해야 했음. robots.txt를 무시하고 서버를 태워 먹고 있었음  
  서로 다른 네트워크 블록에 퍼져서 IP 기반 제한을 피하려는 게 분명해 보였고, 그들 때문에 접근 로그만 수백 MB가 쌓였음. 믿기 어려웠음
  - 작년에도 같은 일을 겪었음. 존재하지 않는 무작위 URL을 쉬지 않고 크롤링했음  
    사용자 질의를 검색 엔드포인트로 프록시하려는 것처럼 보였고, ASN이 일치해서 누가 Meta인 척한 것도 아니었음
  - **ASN 기반 차단**이 훨씬 더 흔해야 한다고 봄. 다만 흔한 도구들에서 1급 설정 옵션으로 지원하지 않는 경우가 많아 아쉬움
  - 이런 회사를 어떻게 식별하는지 궁금함. 어느 회사가 내 사이트를 긁어 갔는지 알아보는 서비스가 있나?

- 갑자기 사람들이 **Elsevier** 편을 드는 게 웃김. 현행법상 AI 학습은 변형적 공정 이용이라는 게 명확해 보임  
  어쩌면 이 사건이 그걸 입증하는 판례가 될 수도 있음
  - AI 지지자들이 지난 20년간 저작권 산업에 맞서 온 사람들까지, AI 산업에 반발한다는 이유로 갑자기 입장을 바꾼 것처럼 몰아가는 게 거슬림  
    개인 사용을 위한 소량의 대마 비범죄화나 합법화에는 찬성하지만, 그게 경제를 왜곡할 정도로 거대한 산업적 마약 생산과 모든 제품에 메스암페타민을 넣으려는 회사들을 지지한다는 뜻은 아님
  - 나도 웃기다고 봄. 다른 스레드와 글[0]에서도 이렇게 말했음  
    “그들은 그 훔친 과실을 다시 복사했다”라고 하는데, 도대체 무엇이 “훔친” 것인가? 원 소유자는 도난당했다는 것을 여전히 가지고 있지 않나?  
    Dowling v. United States, 473 U.S. 207 (1985)에서 대법원은 저작권 있는 음악 저작물의 음반을 무단 판매한 것이 National Stolen Property Act상 “도난, 전용, 사기 취득” 물품에 해당하지 않는다고 판결했음  
    설령 논증을 위해 훔친 것이라고 해도, 저작권의 목적은 “저자와 발명가에게 제한된 기간 동안 각자의 저작과 발견에 대한 독점권을 보장함으로써 과학과 유용한 예술의 발전을 촉진”하는 것임  
    LLM이 예술과 과학을 발전시키지 않았다고 입증하기는 매우 어려울 테니, 최소한 **변형적 이용**, 즉 공정 이용에 해당한다고 봄  
    [0] [https://news.ycombinator.com/item?id=48026207#48029072](<https://news.ycombinator.com/item?id=48026207#48029072>)
  - “AI 학습이 현행법상 변형적 공정 이용”이라는 정도까지도 갈 필요가 없다고 봄. 이건 완전히 **새로운 제품**임  
    키보드를 판 사람이 그 키보드로 만든 소프트웨어에 대해 로열티를 요구하는 것과 비슷함  
    책을 쓴 사람이 LLM 학습이라는 새로운 사용 사례를 예측하지 못했다는 건 중요하지 않음. 그 책이 LLM 안에 들어 있는 것도 아니고, LLM과 함께 판매되는 것도 아님. LLM을 만드는 데 쓰인 수십억 개 도구 중 하나일 뿐임  
    AI 회사가 Disney 같은 불쌍한 지식재산권 보유자에게서 가치를 뽑아낸다는 식으로 포장하는 게 미칠 노릇임. 그 콘텐츠는 우리의 문화유산이고 이미 우리 것임. 단지 어떤 바보에게 평생 독점 착취권이 주어졌을 뿐임  
    LLM은 우리가 이미 소유한 데이터로 학습됨. Disney 등은 수십 년 전 만들어진 것들에서 새 기술을 이용해 돈을 더 뜯어내려는 것임  
    최악으로 보더라도 **역공학**이고, 미국에서는 공정 이용으로 보호되어야 했지만 그 보호가 어느 정도 침식된 듯함
  - 보통 쟁점은 변형 여부가 아니라 **저작권 자료를 불법으로 취득**했다는 데 있음
  - Elsevier도, 저자의 동의 없이 상업 배포 AI 학습 목적으로 지식재산을 가져가는 사람들도 모두 합법이어야 한다고 봄

- **개인 책임**이 어떻게 될지 기대됨  
  회사에서는 책임이 너무 자주 증발하는데, 그 법률적 정당화가 뭔지 궁금했음. 지금까지 남은 이유는 “어깨 으쓱”과 “관련 조항이 적용되지 않는 듯하다” 정도인데, 둘 다 좋은 이유는 아님  
  Aaron Swartz의 시신에 자석을 붙이면, 지금쯤 얼마나 빠르게 돌고 있을지 생각하면 강력한 에너지원이 되겠다는 농담을 하려 했음  
  하지만 솔직히 그는 자기 사건이 처리된 방식과 그 뒤로도 별로 나아진 게 없다는 점을 보면 이런 일을 예상했을 것 같음
  - **Aaron Swartz 사건** 처리는 참사였지만, 그는 불법 복제 혐의로 기소된 게 아니었음  
    혐의는 사기, 보호된 컴퓨터에 대한 불법 접근, 컴퓨터 손상이었음  
    시간이 지나며 사건의 근거가 잊히고 불법 복제 사건이라는 가정으로 대체됐지만, 실제로는 **불법 접근**에 관한 사건이었음
  - 다른 현실의 Aaron Swartz는 성인화되지 않고, 지금쯤 YC 동문 친구들과 함께 학습 데이터를 업로드하면 돈을 주는 **AI/암호화폐 스타트업**을 운영하고 있을지도 모름

- Zuckerberg가 이 일로 심하게 처벌받지 않는다면, 적어도 다른 모든 사람도 똑같이 해도 면책된다는 **법적 선례**가 생겼으면 함  
  미래의 모든 Aaron Swartz들이 과학 논문을 전 세계에 자유롭게 공유할 수 있어야 함
  - 그들은 로비로 **규제 포획**을 만들고, 작은 참가자들에게는 다리를 올려버릴 가능성이 높다고 봄

- 법적 문제가 많다는 걸 알면서도, 회사에 변호사가 있는 이유가 있다며 어떤 일을 하라고 지시받은 엔지니어를 개인적으로 알고 있음
  - 소송이 걸렸을 때 증거개시 절차에서 그런 게 드러나면 좋겠지만, 아마 절대 나오지 않을 것 같음  
    내부고발도 요즘 경제 상황에서는 좋은 선택지가 아니지만, 그래도 더 많은 사람이 했으면 함

- 그러니까 “빠르게 움직이고 **물건을 훔쳐라**”인가?
  - AI 수집기들이 막 시작했을 때 기본적으로 그렇게 생각했음. 사람들이 무슨 일이 벌어지는지 깨닫고 차단하기 전에 가능한 한 전부 긁어 모으려는 계획이었던 듯함  
    그들이 사이트를 훑고 긁어가는 속도는 합법적인 크롤러라고 불리는 것들과 비교해도 훨씬 과했고, 그게 가장 논리적인 설명처럼 보였음
  - 빠르게 움직이고 **법을 깨라**
  - 처음부터, 맨 위에서 시작된 일임
  - 노동계급에게서 일어난 사상 최대의 절도임
  - 물건을 훔쳤다고? 이게 또 “차를 불법 복제하진 않겠죠” 논리인가? 그건 이미 한참 전에 넘어선 줄 알았음

- CEO가 승인했든 다른 고위 인사가 승인했든, 회사의 책임은 바뀌지 않을 것 같음  
  답해야 할 질문은 그런 일이 있었는지, 있었다면 공정 이용으로 보호되지 않는 **저작권 침해**인지이지, 어느 회사 임원이 승인했는지가 아님

- Aaron Swartz는 과학 저널 논문을 내려받아 세상에 무료로 공유하려 했다는 이유로, 그것도 이익을 낸 것도 아닌데 수년의 징역형에 직면했고 결국 스스로 생을 마감했음  
  그런데 수십억 달러짜리 기업이 수백만 건의 저작권 있는 창작물을 내려받아, 그 데이터셋으로 새로운 유형의 인공지능 모델을 학습시키고 노동시장 전체를 재편하려는 건 그냥 Silicon Valley식 혁신이고, 훈장이라도 줘야 한다는 분위기임
  - 한 사람이 저작권 자료를 불법 다운로드하면 범죄임. 다국적 기업이 저작권 자료를 불법 다운로드하면 미국 경제에 남은 유일한 성장 영역이자 **국가안보**에 필수적인 일이 됨
  - Aaron이 로컬 사본을 삭제하자 Jstor는 소송을 취하했음. DOJ는 취하하지 않았음  
    Meta가 로컬 사본을 삭제했을 것 같지는 않음
  - Aaron Swartz는 부당한 대우를 받았고, 그 이유는 **저작권법이 형편없기 때문**임  
    그런 법과 처우에 반대해야지, 상대를 응징하는 도구로 휘둘러서는 안 됨  
    모두가 똑같이 부당하게 대우받아야 한다고 주장하는 건 잘못임. 나쁜 법과 구조를 없애자고 주장하는 편이 낫다
  - Meta도 AI 모델을 세상에 무료로 공유하긴 했음
  - 정말 시대를 앞서갔음