GN⁺: NY 타임즈 저작권 소송, OpenAI에 모든 GPT 인스턴스 삭제 요구
(arstechnica.com)뉴욕 타임즈, OpenAI에 저작권 소송 제기
- 뉴욕 타임즈가 OpenAI 및 그 파트너사인 마이크로소프트를 대상으로 저작권 침해 소송을 제기함.
- OpenAI가 개발한 GPT 기반 시스템이 뉴욕 타임즈의 기사를 재생산할 수 있다는 증거 제시.
- 뉴욕 타임즈는 협상이 원활하지 않자 라이선스 문제로 OpenAI를 고소하기로 결정.
저널리즘은 비용이 많이 듦
- 뉴욕 타임즈는 다양한 분야의 기자들을 통해 중요한 탐사 저널리즘을 수행하는 등 많은 비용을 지출함.
- 신문사는 강력한 유료 벽을 통해 수익을 창출하며, 저작권 통지 및 이용 약관을 통해 저작물의 사용을 제한함.
- OpenAI가 개발한 도구들이 이러한 수익 창출 방식을 침해하고 있다고 소송에서 주장.
훈련뿐만 아니라
- 저작권이 있는 자료를 AI 시스템 훈련에 사용하는 것에 대한 여러 소송이 제기됨.
- 뉴욕 타임즈의 소송은 훈련 중에 흡수된 자료가 사용 중에 어떻게 다시 나타나는지를 보여줌.
- GPT-4가 뉴욕 타임즈의 기사를 거의 그대로 재생산하는 사례가 소송에 포함됨.
명성 및 기타 피해
- AI의 '환각'으로 인해 뉴욕 타임즈의 명성에 피해를 주고, 인간의 건강에 부정적인 영향을 줄 수 있다고 소송에서 지적.
- 뉴욕 타임즈 소유의 Wirecutter 기사에서도 저작권이 있는 내용이 무단으로 사용되고 수익 창출 링크가 제거됨.
- 소송은 OpenAI와 마이크로소프트를 대상으로 저작권 침해, DMCA 및 상표권 위반 등을 주장함.
GN⁺의 의견:
- 이 기사는 AI 기술의 발전이 저작권과 같은 기존 법적 프레임워크와 충돌할 때 발생하는 문제를 잘 보여줌.
- 저작권 소유자와 AI 개발자 간의 긴장 관계는 AI의 미래와 관련된 중요한 법적 및 윤리적 논의를 촉발할 수 있음.
- 뉴욕 타임즈와 같은 주요 언론 매체가 AI 기술에 대해 법적 조치를 취하는 것은 AI의 콘텐츠 생성 및 배포 방식에 대한 규제와 지침을 설정하는 데 중요한 전례가 될 수 있음.
Hacker News 의견
-
뉴욕타임즈(NYT) 기사를 스크랩하여 제품을 만드는 것이 공정 이용에 해당하는지에 대한 질문
- 법적으로 스크랩한 NYT 기사를 이용해 제품을 만들고, 이를 요약 및 재작성하여 유료로 제공하는 행위가 공정 이용에 해당하는지 의문을 제기함.
- 검색 엔진과의 차이점을 언급하며, 검색 엔진은 원본을 대체하지 않고 참조를 제공하는 반면, 요약 제품은 NYT 구독 대신 사용될 수 있음을 지적함.
-
NYT의 저작권 소송에 대한 전망
- 차세대 LLM(대규모 언어 모델)은 저작권이 없는 '합성' 데이터로만 훈련될 것이며, 저작권 침해 문제가 없을 것이라는 주장.
- 미국이 이러한 기술 발전을 막을 수 없으며, 다른 국가들이 앞서 나갈 것이라는 의견.
- AI 모델의 복잡한 진화와 데이터 출처의 불명확성으로 인해 저작권법이 이를 따라잡기 어려울 것이라는 관점 제시.
-
ChatGPT/Bing Copilot의 NYT 저작물 복사에 대한 평가
- ChatGPT와 Bing Copilot가 NYT 기사를 그대로 복사하는 사례가 공정 이용에 해당하지 않는다고 생각함.
- 소송은 단순한 복사뿐만 아니라 LLM 훈련을 위한 기사의 무단 복사가 저작권을 침해한다고 주장함.
- 모델이 '변형적'일 수 있는지에 대한 법적 문제에 초점을 맞춰야 한다는 의견.
-
소송에서 제기된 '공정 이용'에 대한 우려
- 소수의 기업이 인터넷의 가치를 독점하게 될 위험성에 대한 우려 표명.
- 법원이 이 분야에 대한 규칙을 설정하기를 바라는 의견.
-
NYT 저작권 소송 문서 링크 및 내용 요약
- ChatGPT가 저작권이 있는 자료를 그대로 인용하는 사례를 명확히 보여주는 문서 링크 제공.
- 저작권이 있는 자료를 얼마나 변형해야 저작권이 더 이상 적용되지 않을지에 대한 질문 제기.
- OpenAI가 웹 인터페이스를 통해 저작권이 있는 자료의 유출을 차단할 수 있는 가능성에 대한 토론.
-
LLM이 인간과 유사하다는 개발자들의 인식에 대한 비판
- LLM이 인간처럼 교육적 자료로 NYT 기사를 사용한다는 개발자들의 인식에 대한 비판.
- LLM이 복잡하다는 사실이 저작권이 있는 콘텐츠가 소스 코드에 통합되었다는 사실을 변화시키지 않음을 지적.
-
콘텐츠 회사들의 수익 창출 기대
- NYT를 포함한 콘텐츠 회사들이 LLM 훈련에 자신들의 콘텐츠를 사용하는 것에 대해 수수료를 기대함.
- Reddit, Discord, Twitter 등이 AI 훈련용 콘텐츠 판매를 고려하거나 이미 진행 중임을 언급.
-
NYT의 LLM 사용에 대한 법적 주장
- NYT가 LLM의 훈련에 사용되는 방식이 저작권 침해에 해당한다고 주장하는 것에 대한 분석.
- 대형 기업이 LLM 접근을 판매하는 것에 대한 비판과 개인이나 학술 연구 목적으로 사용하는 것에 대한 관용적 태도를 비교함.
-
미래의 LLM 사용에 대한 예측
- 미래에 LLM이 물리적 세계와 상호작용하는 기계체에 통합될 때, 저작권이 있는 자료를 읽는 것이 불법이 될 것이라는 주장.
- 로봇이 TV 시청, 도서관 책 읽기, 인터넷 검색 등을 통해 저작권이 있는 콘텐츠를 기억할 수 없게 될 것이라는 관점 제시.
-
LLM이 '변형적 작업'으로 공정 이용에 해당해야 한다는 의견
- LLM이 변형적 작업으로 공정 이용에 해당한다고 주장하는 개인적 의견.
- 법적 시스템이 이에 대해 어떤 판단을 내릴지에 대한 관심 표현.