GN⁺: 창조적 AI를 위한 상황이 악화될 전망
(garymarcus.substack.com)창작 AI에 대한 전망 암울
- 창작 AI 시스템들은 저작권이 있는 자료들을 학습하여 저작권 침해 가능성이 있는 자료를 생성할 수 있음.
- OpenAI는 자신들의 시스템이 어떤 자료들을 학습했는지에 대해 투명하지 않음.
- 사용자들은 생성된 이미지의 출처에 대한 정보 없이 저작권을 침해할 수 있음.
시스템의 한계
- DALL-E와 ChatGPT와 같은 시스템은 본질적으로 '블랙박스'로, 출처를 추적하거나 제공하는 능력이 현재로서는 부족함.
- 출처 추적이 가능한 새로운 아키텍처가 개발되기 전까지는 사용자의 의도와 상관없이 저작권 침해가 계속될 것임.
법적 위험과 재정적 위험
- 뉴욕 타임즈의 소송은 창작 AI에 대한 많은 소송 중 첫 번째일 뿐이며, 해결되더라도 그 가치는 수백만 달러 이상일 것으로 예상됨.
- OpenAI 뿐만 아니라, Bing을 통해 Dall-E를 사용하는 Microsoft도 법적 위험에 처해 있음.
GN⁺의 의견
- 창작 AI 기술의 발전은 저작권 침해의 위험을 증가시키고 있으며, 이는 기술과 법적 체계 간의 긴장을 불러일으키는 중요한 문제임.
- 사용자들이 생성한 콘텐츠의 출처를 알 수 없다는 점은 AI 윤리와 투명성에 대한 논의를 촉발시키는 핵심 요소임.
- 이 기사는 AI 기술의 빠른 발전이 가져올 수 있는 예상치 못한 부작용과 관련 산업에 미칠 영향에 대한 흥미로운 통찰을 제공함.
Hacker News 의견
-
첫 번째 댓글 요약:
- 디즈니가 성공한 이유 중 하나는 세대를 거쳐 전해진 민담과 같은 기존의 이야기를 적응한 데 있음.
- 문화는 공동체의 재산으로서, 공동의 스토리텔링과 재해석을 통해 진화하고 성장함.
- AI와 저작권 침해에 대한 현재 논쟁은 이러한 문화적 진화의 근본적인 측면을 간과하는 경향이 있음.
- 창조적인 사회의 본질을 이해하는 데 있어 법적 함의와 문화적 스토리텔링의 역사적 맥락을 무시하면 안 됨.
-
두 번째 댓글 요약:
- 유럽연합(EU)에서는 "디지털 단일 시장 저작권 지침"의 제3조와 제4조가 이 문제를 이미 규제하고 있음.
- 상업적 기계학습(ML) 개발자를 포함한 모든 이들은 저작권자가 텍스트 및 데이터 마이닝 목적으로 사용을 명시적으로 예약하지 않은 경우에만 법적으로 접근 가능한 작품을 사용할 수 있음.
- "로봇.txt"와 같은 것을 사용하여 훈련용이 아닌 것을 표시하는 것이 논의되고 있으며, 최종 사용자는 생성된 콘텐츠의 사용에 주의해야 함.
-
세 번째 댓글 요약:
- 저작권이 있는 자료로 훈련된 AI가 유사한 결과물을 만들어낼 수 있다는 것은 이미 알려진 사실임.
- 대규모 기업들이 이미 이 방식을 채택하고 있으며, 이제는 이를 되돌릴 수 없는 상황임.
- AI의 제작 방식이나 저작권에 대해 일반 대중이 잘 알지 못하기 때문에, 이제 중요한 질문은 '이제 어떻게 할 것인가'임.
-
네 번째 댓글 요약:
- 저작권을 침해하지 않도록 보장하는 책임은 작품을 출판하는 사람에게 있음.
- ChatGPT나 다른 도구가 저작권이 있는 콘텐츠를 생성하지 않을 것이라고 가정하는 것은 순진한 생각임.
-
다섯 번째 댓글 요약:
- 예술과 출판의 핵심 목적은 문화와 사회에 영향을 미치는 것이어야 하며, 단지 돈을 벌기 위한 것이 아님.
- 창작물은 보호가 필요하지만, 공공 도메인으로의 이전이 훨씬 빨리 이루어져 창의성과 영감을 불어넣어야 함.
-
여섯 번째 댓글 요약:
- 문제 해결은 그리 어렵지 않아 보임.
- "비디오 게임 배관공"과 같은 표현은 특정한 엔티티를 지칭하는 약어로, 대부분의 사람들이 이를 "마리오"와 동일시함.
- AI 도구를 사용하여 마리오와 유사한 이미지를 설명하고, "비디오 게임 배관공"을 요청하는 결과에서 이러한 결과를 제거하는 것은 어렵지 않음.
-
일곱 번째 댓글 요약:
- 생성 AI에 대한 법적 선례는 구글이 웹사이트를 스크랩하여 검색을 위해 색인화하는 것과 같음.
- 구글이 웹사이트의 원본 콘텐츠를 그대로 표시하는 것이 저작권 침해라고 말하는 사람은 없음.
- 생성 AI가 문화적 참조와 인기 있는 지적 재산(IP)을 모두 제거해야 한다면 무용지물이 될 것임.
-
여덟 번째 댓글 요약:
- 세션 뮤지션을 고용하여 유명한 곡의 일부를 연주하게 하고, 이를 샘플로 사용하는 경우의 저작권 침해 문제에 대한 고려임.
- 누가 저작권 침해에 대한 책임을 져야 하는지에 대한 질문이 제기됨.
-
아홉 번째 댓글 요약:
- 뉴욕 타임즈가 자신들의 데이터로 훈련된 모든 대규모 언어 모델(LLMs)의 파괴를 요구하는 관련 진행 중인 스레드에 대한 언급임.
-
열 번째 댓글 요약:
- Llama2 모델이 텍스트를 얼마나 잘 압축하는지에 대한 실험을 통해, 해당 모델이 해리 포터 책의 첫 장을 상당 부분 포함하고 있음을 발견함.