3P by neo 2달전 | favorite | 댓글 2개
  • 뉴욕 타임즈가 OpenAI와 마이크로소프트를 저작권 침해 혐의로 고소
  • 이들 회사가 뉴욕 타임즈의 수백만 기사를 복사하여 ChatGPT와 Copilot을 구동하는 언어 모델을 훈련시켰다고 주장
  • 이로 인해 뉴욕 타임즈의 독자와의 관계가 손상되고, 구독, 라이선싱, 광고, 제휴 수익이 감소했다고 함

고소장 주장 내용

  • 고소장에 따르면, 이 AI 모델들이 뉴욕 타임즈의 콘텐츠를 그대로 인용하거나, 요약하고, 표현 스타일을 모방하여 고품질 저널리즘을 위협함
  • 뉴욕 타임즈는 몇 달간 협상을 시도했으나 해결책에 도달하지 못했다고 주장
  • OpenAI 대변인은 AI 기술과 새로운 수익 모델로부터 콘텐츠 제작자들이 혜택을 받을 수 있도록 노력하고 있다고 밝힘

관련 소식

  • 뉴욕 타임즈는 OpenAI의 웹 크롤러를 차단하여 사이트에서 콘텐츠를 계속 스크랩하는 것을 방지함
  • BBC, CNN, 로이터 등 다른 뉴스 매체들도 OpenAI의 웹 크롤러를 차단함
  • 반면, Axel Springer는 OpenAI와 협약을 맺고 ChatGPT가 _Politico_와 _Business Insider_의 정보를 직접 사용할 수 있도록 함

GN⁺의 의견

  • 이 사건은 AI 기술의 발전과 저작권 문제가 충돌하는 현대적 이슈를 반영함.
  • 저작권 침해 소송은 AI가 인간의 창작물을 어떻게 활용해야 하는지에 대한 중요한 법적, 윤리적 논의를 촉발할 수 있음.
  • 뉴욕 타임즈와 같은 대형 뉴스 매체가 AI 기업에 맞서는 것은 AI 기술의 미래와 콘텐츠 제작자의 권리 보호에 대한 중대한 전환점이 될 수 있음.

다른 기사에 따르면 고소장 내용에는 뉴욕타임즈의 자료를 사용하여 훈련한 모든 GPT 인스턴스의 삭제와 훈련에 사용된 데이터 셋의 파기를 요구 하고 있습니다. 또한 향후 유사한 행위를 방지하기 위해 영구적인 금지 명령도 요청하고요.
거기다 엄청난 비용을 요구하는 부분도 포함되어있습니다. "법정 손해배상, 보상적 손해배상, 배상, 징벌적 손해배상 및 법이나 형평성에 의해 허용될 수 있는 기타 모든 구제책"

Hacker News 의견
  • 뉴욕타임스(NYT)를 지지하는 입장

    • 창의적인 조직들이 현대 검색 엔진의 탄생 때와 마찬가지로 다시 한 번 경쟁에서 뒤처지는 것 같음.
    • OpenAI가 초기에 라이선스 계약 없이 모델을 훈련한 결정을 비난하지는 않음. 그렇게 하지 않았다면 AI 혁명은 일어나지 않았을 수도 있음.
    • 하지만 이제는 OpenAI가 콘텐츠 창작자들에게 빚진 것을 인정하고 바로잡아야 한다고 생각함. 그렇지 않으면 더 큰 손실을 입고 경쟁자에게 기회를 줄 수 있음.
  • 저작권 콘텐츠를 소비하고 새로운 것으로 재생산하는 LLM에 대한 복잡한 감정

    • 소프트웨어 개발자이자 저자로서, LLM의 발전은 흥미롭지만 저작물이 LLM에 의해 사용된 것에 대해 우려함.
    • 현재 LLM은 원본 연구 없이 콘텐츠를 재작성하는 하위 웹사이트와 유사함. 이는 기술적으로 합법적이지만 가치를 더하지 않는 기생적인 행위임.
    • 전문가들에게는 LLM의 오류와 인용 부족이 문제가 되며, 일반인들은 SEO를 위한 저노력 콘텐츠 생성에 LLM을 사용할 것이며, 이는 LLM의 품질 저하로 이어질 수 있음.
  • AI 훈련을 위한 공정 이용의 확장을 희망

    • AI 훈련을 위한 공정 이용은 단일 미디어 아웃렛보다 인류의 미래에 더 중요함.
    • NYT가 사라져도 대체할 수 있는 매체가 많지만, AI가 초기에 지적 재산권(IP) 분쟁으로 인해 손상되면 중요한 발전을 저해할 수 있음.
  • 뉴욕타임스 스타일 모방에 대한 약한 주장과 OpenAI에 대한 부정적인 전망

    • 뉴욕타임스의 콘텐츠를 그대로 내보내는 것은 OpenAI에게 불리함.
    • LLM이 특정 콘텐츠를 제거하는 것은 어려움이 있으며, 이는 LLM의 수명이 짧을 것임을 시사함.
  • LLM에 대한 저작권 침해를 기반으로 한 차단이 과학과 유용한 예술의 진보를 촉진하지 않음

    • LLM은 규제가 필요하지만, 저작권이 아닌 다른 형태의 규제가 필요함.
    • OpenAI의 초기 개방형 개념은 좋았지만, 이제는 공공의 개입이 필요함.
  • 한 기업이 모든 인간의 산출물을 독점하는 것에 대한 비판

    • 이러한 행위는 적어도 뻔뻔하고 잘못되었으며, 아마도 불명예스러울 수 있음.
    • OpenAI는 너무 많은 피해자가 있어 소송이 비현실적이므로 법원이 피해자에게 보상하지 않기로 사전에 결정할 것임.
  • 인터넷에 공개된 콘텐츠에 대한 자유로운 접근과 기계에 의한 데이터 사용의 정당성

    • 인간이 접근할 수 있는 콘텐츠는 기계도 접근할 수 있어야 함.
    • 기계는 인간이 할 수 있는 일을 대신하여 더 흥미로운 일에 시간을 할애할 수 있게 함.
  • LLM의 기생적인 행위와 특허 트롤과의 비교

    • LLM은 창작자가 사용하지 않던 텍스트 코퍼스의 언어 패턴을 활용하여 훈련에 사용함.
    • 이는 사회에 이득이 되지 않고 오직 트롤에게만 이익을 줌. 법원이 이를 강제할 이유가 없음.
  • 뉴욕타임스가 OpenAI와 마이크로소프트를 소송한 사건에 대한 언급

    • 뉴욕타임스가 자신들의 기사 수백만 건을 복사하고 사용하여 AI 모델을 구축했다고 주장함.