미국 저작권청, AI 기업 저작권 침해 인정 후 다음날 청장 해임

(theregister.com)

2P by GN⁺ 2025-05-13 | ★ favorite | 댓글 1개

미국 저작권청은 생성형 AI 학습에 쓰인 저작권 저작물 사용이 공정 이용 범위를 넘을 수 있다는 Part 3 초안을 공개했고, 다음날 청장 Shira Perlmutter가 해임된 것으로 알려짐
초안의 핵심은 생성형 AI 개발 과정에서 대규모 데이터를 쓰는 행위가 저작권자의 동의나 보상을 필요로 하는지임
AI 기업들은 인터넷 등에서 수집한 콘텐츠 학습이 공정 이용이라고 주장해 왔지만, 저작물의 잠재 시장이나 가치에 미치는 영향이 법적 쟁점으로 남아 있음
저작권청은 연구·분석 목적과 달리, 기존 시장과 경쟁하는 표현적 콘텐츠를 상업적으로 만들거나 불법 접근이 동반되면 공정 이용 방어가 어려워진다고 봄
Perlmutter 해임을 두고 Joe Morelle 의원은 Elon Musk의 AI 학습용 저작물 채굴 시도와 연결했으며, 백악관은 Library of Congress 관련 DEI와 아동 도서 문제를 별도 해임 맥락으로 제시함

저작권청 Part 3 초안의 판단

미국 저작권청은 저작권과 AI에 관한 보고서의 세 번째 부분 초안을 5월 9일 공개함
- Part 1은 디지털 복제물을 다룸
- Part 2는 생성형 AI 출력물에 저작권을 부여할 수 있는지 다룸
- Part 3는 생성형 AI 시스템 개발에서 저작권 저작물을 사용하는 문제를 다룸
Part 3 초안 PDF는 생성형 AI 시스템이 “저작권 저작물을 포함한 방대한 데이터”를 활용한다고 전제함
AI 개발 과정의 행위 중 저작권자의 동의나 보상이 필요한 행위가 있는지가 핵심 쟁점임
저작권청은 Part 3 최종본이 곧 공개되며, 분석이나 결론에 실질적 변화는 없을 것으로 예상함

공정 이용 방어가 흔들리는 조건

여러 소송에서 같은 쟁점이 다뤄지고 있음
- AI 모델 개발사들은 인터넷과 다른 출처에서 스크랩한 콘텐츠로 제품을 학습시켰음을 인정해 왔음
- 콘텐츠 창작자나 저작권자에게 보상하지 않은 사례가 쟁점이 됨
- AI 기업들은 저작권법의 공정 이용 조항 때문에 잘못이 없다고 주장해 왔음
법원이 공정 이용을 판단할 때 보는 요소 중 하나는 사용이 저작권 저작물의 잠재 시장이나 가치에 미치는 영향임
- AI 기업의 저작물 사용이 시장이나 가치에 영향을 주지 않는다고 판단되면 공정 이용이 적용될 수 있음
저작권청 초안은 다음 조건에서 AI 기업의 공정 이용 방어가 유지되기 어렵다고 봄
- 분석이나 연구 목적 모델 배포에서는 출력물이 학습에 사용된 표현적 저작물을 대체할 가능성이 낮음
- 방대한 저작권 저작물을 상업적으로 사용해 기존 시장에서 경쟁하는 표현적 콘텐츠를 만들면 기존 공정 이용 경계를 넘음
- 특히 그 과정이 불법 접근을 통해 이뤄졌다면 공정 이용 범위를 넘는다는 판단이 강화됨

소송 중인 AI 기업과 법률 전문가 반응

Tech law professor Blake E. Reid는 해당 보고서를 AI 기업 소송에 “매우 나쁜 소식”이자 “AI 기업들의 전면 패배”라고 평가함
저작권 관련 소송 중인 AI 기업으로 Google, Meta, OpenAI, Microsoft가 거론됨
네 회사 모두 Donald Trump의 취임 기금에 기부함
Reid는 Part 3 보고서 공개 시점에도 의문을 남김
- 저작권청은 의회 질의와 이해관계자 관심에 대응해 공개했다고 밝힘
- Reid는 저작권청 숙청이 임박했고, 그래서 보고서를 서둘러 공개했을 가능성을 “추측”으로 언급함

Shira Perlmutter 해임과 Elon Musk 관련 해석

Trump 행정부는 토요일 저작권청장 Shira Perlmutter를 해임한 것으로 알려짐
Representative Joe Morelle(D-NY)는 성명에서 해임이 “우연이 아니다”라고 밝힘
- 그는 Perlmutter가 Elon Musk의 AI 모델 학습용 저작권 저작물 채굴 시도를 승인하지 않은 지 하루도 지나지 않아 해임됐다고 봄
- Morelle은 “승인하지 않았다”는 표현을 Part 3 보고서와 연결함
Musk 관련 발언은 두 사안과 연결될 수 있음
- Musk가 Twitter 창업자 Jack Dorsey의 “모든 IP 법을 삭제하자”는 요구를 최근 지지함
- Tesla와 SpaceX CEO인 Musk가 X 사용자 게시물로 자체 AI인 Grok을 학습시키려는 계획을 갖고 있음

백악관이 제시한 다른 해임 맥락

Library of Congress의 수장은 전주에 해임됨
백악관 대변인 Karoline Leavitt는 해당 해임 사유로 DEI 추구와 어린이를 위한 도서관에 부적절한 책을 넣은 점을 언급함
Perlmutter 해임은 보고서가 기부자나 Elon Musk에게 미칠 수 있는 영향과 무관하게, Trump 행정부의 다양성 정책 대응 집행일 가능성도 있음

GN⁺ 2025-05-13 [-]

Hacker News 의견들

여기 댓글들이 놓치는 부분은 지정학적 압력이라고 봄
미국이 LLM은 저작권물을 사용할 수 없거나 모든 권리자에게 보상해야 한다는 입장을 취하면, 중국 같은 다른 나라는 따라오지 않을 가능성이 큼
그러면 미국 LLM 기업은 뒤처지거나 비용이 너무 비싸지고, 중국과 다른 나라들이 AI의 유용성 측면에서 앞서 나갈 수 있음
그래도 옳은 일을 해야 한다는 점은 별개지만, 정부가 AI 규제 수위를 정할 때 밑바탕에는 “앞으로 누가 세계를 지배할 것인가?”라는 감각이 깔려 있다고 봄
- 그런 논리라면 일반 시민도 중국이 지식재산권법을 지키지 않을 테니 기업 지식재산을 세탁할 수 있어야 함
  나도 좋으니 당신도 동의하는지 궁금함
- 저작권 자료에 제한 없이 접근하면 AI가 더 강력해질 수 있다는 데는 대체로 동의하지만, 정확히 무엇에 더 강력해지는지가 문제임
  국가안보 차원에서 LLM이 학술 논문, 과학·기술 정보 같은 것에 제한 없이 접근하는 건 괜찮다고 봄
  독점 코드에 대해서는 조금 애매하지만, 이미 LLM이 학습할 수 있는 코드가 충분하지 않다고 믿기는 어려움
  그 외의 저작권 자료를 무제한으로 쓴 LLM이, 과학·기술 정보와 라이선스된 저작권 자료만 쓴 LLM보다 더 잘하는 건 아마 창작 글쓰기와 저작권물 재현일 것임
  결국 더 지능적인 모델이라기보다 더 유능한 표절 기계가 되는 셈이고, 별다른 가치를 더하지 않는다면 우리가 이를 용인해서 얻는 게 무엇인지 모르겠음
  이미지·동영상 모델에서는 이 논점이 더 잘 보임. 저작권 자료를 마음껏 쓴 모델은 더 유능하겠지만, Mario와 Luigi를 무한히 우스운 장면에 재현하는 능력이 우리에게 어떤 이익을 주는지 의문임
- 진짜 문제는 AI 기업들이 대기업의 관행조차 따르려 하지 않고, 자기 필요에 맞게 법을 바꾸는 절차도 밟지 않는다는 데 있음
- 사람들이 저작권 있는 Windows를 설치했을 때는 추적하는 데 아무 문제 없었고, BSA도 있었음
  그런데 지금은 Microsoft에 유리하니 눈감아 주는 것처럼 보임
- LLM이 세계 지배에 기여한다는 걸 개인적으로 믿기는 어렵지만, “대통령님, 갱도 격차를 허용할 수 없습니다” 같은 분위기가 강하게 느껴짐
이걸로 누군가를 해고하는 건 매우 이상함
유용한 기술을 비판하고, 저작권법의 엄격하지만 어쩌면 낡은 해석과 맞아떨어지는 법 해석을 검열하려는 시도처럼 보임
저작권 데이터로 모델을 학습시키는 건 전통적 기준으로는 분명 불법처럼 보이지만, 인간은 책을 읽고 영감을 받아 새 책을 써도 소송당하지 않음
파생 판타지 소설들을 보면 전부 완전히 독립적인 작품이라고 보기는 어렵고, AI가 앞으로도 유용하고 변혁적일 것이므로 이 사용 사례를 법이 예상하지 못했다는 점을 인정하고 법을 바꿔야 한다고 봄
- 인간도 이런 일로 자주 소송당함
  관대하게 말해도 너무 많이 영감받는 것이라는 게 존재함
  https://en.wikipedia.org/wiki/List_of_songs_subject_to_plagi...
- 법은 이런 경우를 꽤 잘 다루고 있음. 다만 법의 상대가 매우 강력하고 부유한 세력이며, 그들의 탐욕이 반복해서 선을 넘었을 뿐임
  충분히 오래되어 합법적으로 이용 가능한 작품을 쓰거나, Creative Commons로 공개된 작품을 쓰거나, 입력과 일정 편집 거리 안에 있는 문구를 그대로 출력하지 않도록 조회를 돌리거나, 침해 대상이 된 사람들에게 연락해 비용을 지불할 수도 있었음
  하지만 당연히 아무것도 하지 않았고, 자신들이 법 위에 있다고 생각하는 것처럼 보임
- 인간은 AI 기업들이 하려는 일을 허용받지 못함
  저작권청 논리 중 하나도 학생이 도서관에 들어가 “학습에 필요하니 모든 책의 복사본을 달라”고 할 수는 없다는 것이었음
  인간도 충분히 유용하고 변혁적임
- 어떤 것이 유용하더라도 나쁜 생각일 수 있다는 점을 인정할 수도 있음
- 그래도 “Hairy Plotter and the Philosophizer's Rock”을 상업 출판하는 건 허용되지 않을 것임
“Minnesota woman to pay $220,000 fine for 24 illegally downloaded songs”
https://www.theguardian.com/technology/2012/sep/11/minnesota...
- 이게 왜 관련 있는지 모르겠음
  RIAA는 그 여성이 KaZaA 파일 공유 사이트에서 음악 파일 1,700개 이상을 내려받고 배포했다고 주장했음
  AI 기업들이 모델 학습에 하는 일은 인터넷의 임의의 사람들에게 원본 복사본을 보내는 것과 다르다고 대부분 동의할 것 같음
트랜스포머 모델 학습이 어떻게 동작하는지, 기술적 세부와 전체 구조를 이해했다는 걸 보여주면서도 왜 그것이 명백한 저작권 침해인지 논리적으로 설명하는 사람은 아직 보지 못함
학습을 이야기하는 사람도 많고, AI 학습이 저작권 침해라고 말하는 사람은 훨씬 많지만, 둘을 함께 제대로 다루는 사람은 찾기 어려움
여기서 말하는 건 추론, 즉 출력이 아니라 학습임
- 질문을 잘 이해했는지 모르겠지만, 트랜스포머가 권리 없는 자료를 재현하다가 걸리는 건 꽤 명확함
  사람이 손으로 했다면 소송으로 이어질 수 있는 종류임
  방대한 저작권 자료를 가져와 다른 것을 생성하는 데 쓰는 행위가 저작권 침해 수준에 이르는지는 덜 명확함
  사람들이 미리 생각했다면 이용 약관에 명시적으로 금지했을 법한 일이고, 그렇게 되면 웹은 훨씬 작아졌을 가능성이 큼
  당신의 말은 작가와 예술가가 자기 작품에서 파생된 제품에 대해 아무 이해관계도 없고, 그저 오해하고 있다는 듯 들림
  하지만 컴퓨터 과학자이자 예술가로서 그런 결론에 어떻게 도달할 수 있는지 모르겠음. 내 작품이 관련 없다면 학습에서 빼면 됨
- 판결은 모델 학습 자체가 저작권 침해라고 말하지 않았음
  저작권 자료를 분석·연구 목적으로 모델 학습에 쓰는 건 저작권 침해가 아니지만, 그 결과 모델의 상업적 사용은 침해가 될 수 있다고 말함
  “모델이 분석이나 연구 같은 목적에 배포될 때… 출력물이 학습에 사용된 표현 저작물을 대체할 가능성은 낮다. 그러나 방대한 저작권물을 상업적으로 이용해 기존 시장에서 그들과 경쟁하는 표현 콘텐츠를 생산하고, 특히 불법 접근을 통해 이를 수행하는 것은 확립된 공정 이용의 경계를 넘어선다.”
- 그런 설명을 나도 보고 싶음. 특히 동영상 코덱에서 쓰이는 일반적인 변환과 어떻게 다른지 설명하는 것이 필요함
  손실 압축은 왜 명백한 저작권 침해가 아니고, 생성 AI는 왜 침해인지 궁금함
- 다른 사람의 저작권 있는 작품을 재현하는 기계이기 때문임
  저작권은 원작의 본질이 파생 저작물 안에 들어가거나 변형된 뒤에도 보호함
  “인간도 그렇게 하고 허용된다”는 주장을 하는 사람도 있지만, 기계 학습이 인간의 추론과 같다는 건 입증되지 않았고 입증하기도 쉽지 않음
  증거가 없으면 법은 아니다라고 가정함
- 이건 책으로 AI를 학습시키는 문제가 아니라, AI 기업들이 그 책 값을 전혀 내지 않은 문제임
  말하자면 불법 공유 사이트에서 전자책을 내려받아 학습에 사용한 것임
공개된 초안 보고서는 결론을 뒷받침하는 추론의 깊이가 거의 없이, 저작권자 불만을 그대로 반복한 목록처럼 보임
- 필요한 추론은 그렇게 깊지 않음. AI가 과학 논문 100편을 읽고 새 논문을 뽑아내면 표절임
  완벽한 기억력을 가진 천재가 텍스트를 정확히 기억해 재배열한 뒤 약간 새로운 글을 만든다면 저작권 침해로 소송당할 것임
  오직 대기업만 빠져나감
- 목록처럼 읽힐 뿐 아니라, 저작권자들이 Meta 사건이 법원에서 진행되는 방식에 만족하지 못해 공정 이용을 아예 우회하려는 것처럼 보임
  https://www.copyright.gov/ai/Copyright-and-Artificial-Intell...
현 행정부가 특수 이익집단을 지원하며 벌이는 나쁜 일의 양이 놀라울 정도임
지식재산권법은 아이디어의 확산을 패권적 기업 소송으로 지배하는 제도로 빠르게 변하고 있음
책의 전체 내용을 아는 것이 불법이라면, 그 앎 자체를 어느 정도까지 기호로 부호화할 수 있는지도 임의적으로 정해질 수밖에 없음
판사들이 여기서 판단하도록 허용된다면, 이는 상업적 상품의 복제가 아니라 인류의 집단적 이해를 통제하는 문제가 됨
“Copyright and Artificial Intelligence Part 3: Generative AI Training” PDF를 보면 됨
https://www.copyright.gov/ai/Copyright-and-Artificial-Intell...
“하지만 방대한 저작권물을 상업적으로 이용해 기존 시장에서 그들과 경쟁하는 표현 콘텐츠를 생산하고, 특히 불법 접근을 통해 이를 수행하는 것은 확립된 공정 이용의 경계를 넘어선다”는 문장이 어떻게 공정 이용을 직접 다루는지 잘 모르겠음
여러 저작권물에서 조금씩 빌려 무언가를 발명하는 것이 공정 이용이 아니라는 식으로 읽히는, 이상하게 포괄적인 문장임
1대1 복제라면 그렇겠지만 여기서는 사실상 창의성이 공정 이용이 아니라고 말하는 셈임
만약 기존 시장에서의 경쟁을 말하는 것이라면, 이는 공정 이용이 아니라 공익과 저작권의 목적에 대한 문제이고 결국 입법자가 다룰 사안임

답변달기

미국 저작권청, AI 기업 저작권 침해 인정 후 다음날 청장 해임

저작권청 Part 3 초안의 판단

공정 이용 방어가 흔들리는 조건

소송 중인 AI 기업과 법률 전문가 반응

Shira Perlmutter 해임과 Elon Musk 관련 해석

백악관이 제시한 다른 해임 맥락

함께 보면 좋은 글 β

댓글과 토론

Hacker News 의견들