2P by GN⁺ 2일전 | ★ favorite | 댓글 1개
  • 미국 저작권청이 최근 AI 기업들의 저작권 침해 사례를 공식적으로 인정함
  • AI 알고리듬이 방대한 저작권 자료를 활용하며 창작자 동의 및 보상이 필요함을 지적함
  • 일부 상황에서 공정 이용(fair use) 방어가 성립하지 않는다고 보고서에서 결론 내림
  • OpenAI, Google, Meta, Microsoft 등 주요 업체가 이 문제로 소송 중임
  • AI 친화 정책과 정치적 인사 해임이 겹치며 상황의 복잡성이 커지고 있음

미국 저작권청 보고서와 청장 해임 이슈 개요

  • 미국 저작권청 청장이 해임됨은 AI 모델 개발기업이 저작권 자료 활용에서 기존 공정 이용 범위를 초과했음이 보고서로 결론 내려진 직후 발생함
  • 이번 보고서는 저작권과 AI 관련 세 번째 보고서 초안에 담긴 의견임
  • 첫 번째 보고서는 디지털 복제 문제, 두 번째는 생성형 AI 결과물의 저작권 가능성 검토임

보고서 초안 주요 내용

  • 5월 9일, 생성형 AI 시스템 개발 시 저작물 사용에 관한 보고서 초안(PDF) 공개됨
  • AI 시스템이 방대한 데이터, 곧 저작권 자료를 활용함이 명확하게 드러남
  • AI가 저작권자의 동의나 보상을 받아야 하는지에 대한 의문이 제기됨
  • 이는 실제 여러 소송의 핵심 쟁점임
  • AI 개발사들은 인터넷 등의 콘텐츠를 무단으로 활용해 제품을 학습시켰음을 인정함

공정 이용(fair use) 관련 판례와 판단 기준

  • AI 기업은 저작권법상 공정 이용 조항을 근거로 법적 문제없음을 주장함
  • 그러나 판사들은 “원 저작물의 잠재적 시장이나 가치에 영향을 주는지”가 공정 이용 판단 기준임을 강조함
  • 만약 영향이 크지 않다면 공정 이용에 해당함
  • 해당 보고서는 특정 상황에서 AI 기업의 공정 이용 방어 논리가 성립 불가함을 명시함

보고서의 영향과 학계 반응

  • 최종 보고서는 큰 변화 없이 곧 발간될 예정임
  • 법학자 Blake. E Reid는 이 보고서가 “AI 기업들에게 매우 불리”하고 "법정 패소로 직결될 수 있음"으로 평가함
  • 현재 Google, Meta, OpenAI, Microsoft 등이 저작권 관련 소송의 당사자임

해임의 배경과 정치적 맥락

  • 청장 해임 시점과 보고서 발표가 맞물려, “Congress와 이해관계자 질의에 따른 발행”이라는 공식 입장에 의문이 제기됨
  • Reid 교수는 저작권청의 급박한 보고서 공개는 조직 내 인사 조치(‘purge’) 징조일 수 있음을 지적함
  • 실제로 트럼프 행정부가 청장 Shira Perlmutter를 해임했다고 보도됨

정치적 파장과 Elon Musk 연관성

  • Joe Morelle 하원의원은 해임이 Elon Musk의 AI 모델 훈련을 위한 저작권 자료 활용 요구에 저작권청장이 동의하지 않은 직후라는 점을 꼬집음
  • Musk와 Jack Dorsey 등이 “모든 지식재산(IP) 법 삭제”를 주장하거나, X(옛 Twitter) 포스트로 AI 학습 추진 등 정책 변화 움직임 보임

기타 해임 사유 가능성

  • 저작권청이 미국 의회 도서관(Library of Congress) 산하 기관임을 고려할 때, 최근 도서관장이 다양성(DEI) 정책 추진 및 아동 도서 선정 문제로 해임된 사례와 연관될 수 있는 점이 언급됨
  • 따라서, 이번 해임이 AI 정책, 주요 기부자, 혹은 DEI 정책 등 다양한 내부 및 정치적 요인과 복합적으로 연결된 현상임
Hacker News 의견
  • 미국이 LLM이 저작권이 있는 자료를 사용하지 못하게 하거나 모든 저작권자에게 보상을 해야 한다고 하면, 중국 같은 다른 나라들은 그렇게 하지 않을 것임을 언급함. 그렇게 되면 미국 LLM 기업들은 경쟁에서 뒤처지거나 비용 부담으로 불리해질 것이라는 우려임. 결국 AI의 유용성 측면에서 중국 등 다른 국가가 앞서 나가게 됨. 물론 옳은 일을 해야 한다고 생각하지만, AI 규제에 있어 정부 결정에는 누가 미래 세계에서 주도권을 쥘 것인가에 대한 근심이 내재되어 있음
    • 그 논리라면 평범한 시민도 중국이 절대 따라오지 않을 것이니 기업의 지적재산권을 세탁해도 된다는 결론이 나옴. 상대가 괜찮으면 나도 동참하겠음
    • 전체적으로 저작권 자료 접근성을 완전히 허용하면 AI가 더 강력해질 수 있다는 데 동의함. 다만, "더 강력하다"는 게 정확히 무슨 의미인지 의문임. 국가 안보를 생각하면 LLM에 학술, 과학, 기술 정보를 전면적으로 허용하는 데 찬성함. 독점적 코드에는 조금 의문이 있지만 이미 충분히 많은 코드 데이터가 있다고 봄. 그런데 LLM이 저작권 자료까지 전면적으로 접근한다고 해서, 논문이나 기술 데이터 및 라이선스를 통한 저작권 자료만 접근하는 경우보다 어떤 실질적 이점이 있을지 모르겠음. 결과적으로 LLM이 훨씬 더 강력한 표절 기계가 되고, 실제로는 더 지능적으로 변하지 않음. 이미지와 비디오 모델에서도 같은 논지임. 저작권 자료 접근시 모델이 더 많은 이미지를 생산하거나 마리오와 루이지를 무한한 시나리오로 재생산할 수 있지만, 거기서 얻을 실질적 이득이 없으니, 오히려 이런 모델은 금지해야 함. 중요한 안보나 경제적 이점이 없음
    • 진짜 문제는 AI 기업들이 기존 대기업들처럼 법을 스스로 바꾸려고 노력하지 않는다는 점임
    • 한편, 중국에 145% 관세를 부과하는 대통령이 있다면, 중국 인터넷 챗봇에 1000% 관세를 걸거나, 국가 비상사태를 이유로 인터넷 케이블을 끊어버릴 수도 있음. 중국이 앞으로 어떻게 할지는 불확실하지만, 최소한 미성년자에게는 AI 사용을 금지할 것 같음. 군사적 활용 문제는 저작권 문제와 별개임
    • AI가 정말 이렇게 중요하다면, 정부가 소유하고 모든 시민이 무료로 쓸 수 있게 해야 함
    • 이런 논리는 AI뿐 아니라 모든 지식재산권 위반에도 적용될 수 있음
    • LLM이 세계를 지배하는 데 실제로 기여할지 개인적으로 믿기 어렵지만, 핵심 경쟁의식이 이 논의의 바탕에 깔려 있음
    • 예전에도 저작권 있는 윈도우즈 설치에 아무런 문제가 없었음. BSA가 등장했지만, 이제는 Microsoft가 자신들에게 유리하니 눈을 감고 있음
  • 이런 이유로 사람을 해고하는 건 매우 이상함. 이는 법 해석을 검열하려는 시도처럼 보임. 내 생각엔 저작권 자료로 모델을 학습시키는 건 전통적으로 봤을 때 명백히 불법임. 물론 인간은 책을 읽고 영감받아 새로운 책을 써도 소송을 당하지 않음. 수많은 판타지 소설을 보면 완전히 독립된 작품만 있는 것이 아님을 알 수 있음. AI가 유익하고 혁신적인 만큼 법이 이 사례를 고려하지 못했음을 인정하고, 법을 바꿔야 한다고 생각함
    • 인간이 책을 읽고 영감받아 쓰는 것은 소송 대상이 아니라고 했지만, 실제로 "과하게 영감받은" 사례로 소송 당하는 일은 자주 있음. 음악 표절 분쟁 사례는 유명함
    • 법적으로 이 문제를 충분히 커버했지만, 권력 있는 자들이 법 위에 군림한다는 걸 반복해서 보여줌. 오래 전 릴리스된 자료, 크리에이티브 커먼즈 자료, 혹은 원본과 일정 편집 거리 이상이 되게 출력하거나, 해당 저작권자에게 연락해 허락을 받는 식으로 충분히 방지할 수 있었음. 근데 AI 기업들은 이런 걸 전혀 하지 않음
    • AI는 인간과는 다름. 인간 권리가 있다 해서 기계에도 바로 권리가 있다고 추론할 수 없음. 그런 논리라면 자동차를 폐기할 때 살인죄가 됨
    • 인간도 AI 기업들이 하려는 일을 할 수 없음. 학생이 도서관에 가서 "학습을 위해 모든 책을 복사하고 싶다"고 할 수 없는 것과 같음. 인간도 유용하고 혁신적임
    • 유용하다고 해서 무조건 좋은 생각이라고 인정할 수 없는 점도 인식해야 함
    • 저작권이 소멸한다면, 기업들은 매우 화낼 것이고 특허 시스템도 무너질 것임. 미국 기업들이 세계 장악력을 잃게 됨. 곧 미디어 불법 복제가 저작권 존속의 유일한 이유로 재정의되고, 기존 기관이 통제기관이 되어 검열국으로 변질될 수 있다는 우려임
    • 영감을 받아 다른 소설을 쓰는 건 자유지만, 예를 들어 "Hairy Plotter and the Philosophizer's Rock"을 공식적으로 출판하는 건 허용되지 않을 것임
    • 분석의 문제는 애초에 저작권의 존재 이유를 논의하지 않는다는 데 있음. '허락 없이 LLM이 자료를 학습하는 게 허용돼야 한다'는 믿음과 '저작권은 의미 있다'는 믿음은 양립 불가임. 미국 헌법상 저작권은 과학과 예술의 진보를 위한 것이고, EU에서는 창작자 보호와 창의성 장려가 목적임. 만약 내가 책을 냈을 때 기술 기업들이 복사해 훈련용으로 쓰고 그걸 소비자에게 다시 제공할 수 있다면, 그 누구도 내 책을 사지 않을 것임. 그러면 투자도 멈추고 책도 만들어지지 않음
    • 라이선스 없이 지적재산권을 판매 목적으로 모델에 넣어 제공하는 행위는 예외가 아님
    • 만약 법을 바꾼다면 모든 사람에게 적용돼야 하고, AI 기업에만 특혜가 되어선 안 됨
    • 인간이 저작권 있는 작품에서 영감을 받아 작업한 경우 이를 침해로 보지 않았다면, 왜 로봇이 하면 문제가 되는지 명확히 설명해야 함. 만약 로봇이 해석상 본질적으로 새로운 동적이 생겼다면, 집행 가능한 방식으로 논거를 만들어야 함
    • AI가 그렇게 쓸모 있는 기술이라고 생각하지 않음. 1950년대부터 시작해서 이제서야 겨우 쓸만해졌고, 아직도 제대로 동작하지 않음
    • 영화를 해적판으로 보는 것도 유용하지만 그게 합법이 아님. 인간과 AI는 완전히 다르고, 인간이 영감받는다는 논리는 근거 없는 주장임
    • 커버 곡을 부르려면 허락이 필요하고, 허락 없이 하면 불법이 될 수 있음. 반면 영감을 받아 곡을 쓴다면 합법임. AI가 생성하는 작품이 충분히 새롭고 변형적이면 문제 없지만, 만약 남의 작품을 그대로 복사해 내보내면 문제임. 법은 영혼이나 영감 같은 모호한 개념이 아니라, 실제 결과물의 차이로 판단해야 함
    • 기업과 AI는 인간도 다람쥐도 아님. 인간과 비교하는 게 무슨 의미냐는 의문임
    • 소프트웨어가 IP를 허락 없이 복구하는 것에 저항하는 창작자들의 심정을 이해함. 단지 자료를 읽는 것 자체가 저작권 침해인지는 의문임. 읽거나 요약하는 행위는 기존 법에 의해 통제되지 않았음. "사람은 내가 배포한 책을 읽으면 안 됨", "사람은 내 글 스타일로 팬픽을 쓰면 안 됨", "사람은 미술관에서 명화 모작 훈련을 하면 안 됨"과 같은 주장은 현실과 동떨어짐. 우리가 여기서 보다 합리적인 사회적 토론과 방향 제시가 필요함
  • 미네소타 여성에게 24곡의 불법 다운로드로 22만 달러의 벌금이 부과됨
    • 해당 사례는 AI기업의 모델 훈련과는 다름을 지적함. AI 회사의 데이터 학습은 남에게 곡을 그대로 공유/배포하는 것과 다르다고 주장함
  • 지금까지 트랜스포머 모델 훈련의 기술적 구조와 저작권 침해 주장을 동시에 세부적으로 설명하는 사람을 본 적 없음. 즉, 모델 훈련 메커니즘과 저작권 침해 논리를 모두 아는 사례가 드뭄. 여기서 말하는 건 훈련 과정이지, 생성된 결과(추론)에 관한 게 아님
    • 트랜스포머가 본인이 허락받지 않은 자료를 재현할 때 문제가 되며, 그 자체만으로 소송거리가 될 수 있음. 방대한 저작권 자료를 건드리는 자체가 저작권 침해가 되는지는 불확실함. 창작자와 예술가도 자신들의 저작물에서 파생된 제품들에 당연히 이해관계가 있음. 내 작품이 불필요하다면 제외하면 됨
    • 모델 자체 운용은 저작권 침해가 아니고 분석이나 연구 목적 훈련은 괜찮음. 하지만 상업적 이용, 시장 대체 등은 공정사용 범위를 넘어서는 것으로 판단됨
    • 훈련 방식이 어떻게 비디오 코덱의 트랜스포머와 다른지, 손실 압축이 저작권 침해와 어떤 차이가 있는지도 궁금함
    • 인간의 행동(동일 문장 쓰기)도 구조적으로 설명할 수 없는 상황에서 AI 훈련이 왜 침해인지 명확히 논의된 사례가 없음. 즉, 읽기와 표절 모두를 동시에 다루는 논의가 없음
    • 이 논쟁의 요점은 AI 기업들이 책을 도입목적으로 사용료를 내지 않고, 무단으로 다운로드해서 쓴다는 데 있음
    • 실제로 어떻게 작동하는지는 상관없고, 결과적으로 무엇을 하느냐가 중요하다고 봄
    • 프로그래머+저작권 변호사 조합이 적지만, 아예 없는 건 아님. 하지만 궁극적으로는 어떻게 판결이 나오는지가 중요함. 이번 사건에서는 해당 내용이 실제로 중요하지 않을 수도 있음
    • 기계가 다른 사람의 작품을 복제하면 저작권 침해임. 인간과 기계는 같지 않으며, 입증되지 않았기에 법은 이를 허용하지 않음
    • 본인은 침해 증거를 가지고 있음이라며 참고자료를 공유함
    • 훈련 방식 구조를 아는 사람들은 오히려 저작권 침해가 아니라고 생각함
  • 공개된 초안 보고서는 저작권자들의 불만을 그저 나열한 수준으로 보임. 주장의 근거가 깊지 않음
    • 깊은 근거는 필요하지 않음. AI가 논문 100개 읽고 새 논문을 내면 표절임. 기억력이 완벽한 사람이 기존 글을 재배열해 새 글을 내도 저작권 침해임. 오직 대기업만이 예외가 됨
    • 단순 불만 리스트에 그치지 않음. 저작권자들이 법정에서 불리하게 돌아가는 상황을 공정사용 원칙 무력화로 우회하려 한다고 봄
    • 별로 동정할 생각은 없음
  • AI가 상업적으로 방대한 저작권 작품을 활용해 기존 시장과 경쟁하는 컨텐츠를 만든다면, 그건 공정사용을 넘어선다는 결론에 동의할 수 없음. 다양한 소스에서 조금씩 차용해 창의적으로 만드는 것이 왜 공정사용이 아니라는 건지 의문임. 이 논지는 결국 공공의 이익과 저작권의 근본 목적에 대한 질문임
  • 현 행정부에서 특수이해 집단을 위해 벌어지는 행위가 너무 많다는 점을 지적함
  • "Copyright and Artificial Intelligence Part 3: Generative AI Training" PDF 자료를 참조하라고 안내함
  • 지적재산권법이 아이디어 확산을 억제하는 거대 기업 소송의 도구로 변해간다고 느낌. 책의 전체 내용을 아는 것이 불법이라면, 어느 정도 내용 인지를 기호화한 것까지 어디까지 제약 가능한지가 모호함. 여기서 판사가 판단할 때는 상업적 복제 문제가 아니라 인류 집단 지식의 통제 문제가 됨
  • 이전 논쟁에서 이번 이슈가 또 반복된다는 점에 공감함