우리는 모두 표절자가 되었는가?
(economist.com)- AI 시대에 지적 재산 도용의 기준이 모호해지면서 표절의 정의와 허용 범위에 대한 논쟁이 격화되고 있음
- 표절은 문학과 음악, 연설 전반에 걸쳐 오랜 역사 속에서 반복되어 왔으며, 유명 작품조차 쉽게 통과된 사례가 존재함
- 명확한 정의 부재로 인해 표절은 직역 복사부터 개념 차용까지 폭넓게 해석되며, 기술 발전으로 탐지와 복제가 동시에 쉬워짐
- 창작과 독창성의 경계는 오래전부터 모호했으며, Chaucer, Shakespeare, Swift 등 문학 거장들도 표절 혐의를 받은 바 있음
- Anthropic은 700만 권의 불법 복제 도서 사용에 대해 작가들에게 15억 달러를 지급하기로 합의
- 창의성과 독창성이 항상 모방과 긴장 관계에 있었으며, AI로 인해 이 오래된 문제가 개인과 사회 전반의 이슈로 확장됨
유명 문학 작품과 표절의 관대함
- 제인 오스틴의 『Pride and Prejudice』 일부를 약간 변형해 신작으로 제출했음에도 다수 편집자가 이를 알아채지 못한 사례 존재
- 명문 문장의 인지 여부조차 독자의 맥락과 기대에 따라 달라짐을 보여주는 사례임
표절의 역사와 현대적 의미
- Roger Kreuz의 신간은 음악(Bob Dylan), 문학(Dylan Thomas), 연설(Joe Biden) 등 20세기에 걸친 다양한 표절 사례를 다룸
- Bob Dylan의 노벨문학상 수상 연설이 "Moby Dick"을 언급하면서 SparkNotes와 유사한 표현이 발견됨
- 표절이라는 단어 자체가 로마 시인 Martial의 시에서 차용된 것으로, 라틴어 plagiarius는 "유괴범" 을 의미
- 로마법에 따르면 표절자는 "첫 번째 공개 행사에서 맹수에게 던져져야" 하는 범죄자로 규정
AI 시대에 다시 부상한 표절 논쟁
- 표절 개념이 오래되었지만 AI 학습과 생성으로 인해 개인적·법적 차원에서 새롭게 중요해짐
- AI로 자기소개서나 연애 편지 작성의 윤리성 문제
- 저작권 자료 학습에 대한 AI 기업의 법적 책임 문제
- 지적 절도와 영감의 경계가 AI로 인해 더욱 흐려짐
정의하기 어려운 표절과 기술의 영향
- 표절은 단어 그대로의 복사부터 아이디어 차용까지 스펙트럼이 넓음
- 디지털 기술로 복제는 쉬워졌지만 탐지도 동시에 강화됨
- 과거 필사와 활자 인쇄 시대와 달리 복사 비용의 급감이 표절 빈도를 높임
AI와 표절의 새로운 국면
- ChatGPT, Claude 같은 LLM이 방대한 저작권 자료로 학습되면서 창작자들의 저작물을 도용한다는 비판도 제기됨
- 한 소송에서 원고들은 AI 기업들이 "대규모 조직적 도용" 을 저지르고 있다고 주장
- 2026년 1월 15일, 두 출판사가 GoogleAI를 상대로 "역사상 가장 광범위한 저작권 침해" 를 주장하며 집단소송 참여 신청
- Anthropic이 700만 권의 불법 도서를 학습에 사용해 15억 달러 지급 합의
- Kreuz는 ChatGPT 사용이 단일 원본에서 베끼는 것이 아니므로 표절이 아니라고 주장
- 그는 LLM을 인정받지 못한 "대필" 에 비유했으나, 많은 이들은 이를 "AI 공범과 함께하는 표절"로 봄
- 비판적 시각에서 이는 이중 범죄: AI가 학습 자료의 단어를 훔치고, 사용자가 그 단어를 자신의 것으로 이익을 취함
창작과 표절의 오랜 경계
- Chaucer, Shakespeare, Swift 등 문학 거장들이 표절 혐의를 받았으며, "문학계 명사록" 이나 다름없음
- Shakespeare는 "Antony and Cleopatra"의 바지선 장면을 Plutarch에서 차용했으나 손으로 직접 베껴야 했음
- Dickens의 모방작 "Martin Guzzlewit", "Oliver Twiss" 등을 만들려면 시간과 조판 작업이 필요했음
- Ctrl+C 키의 등장 이후 표절이 더 쉬워졌고 통제도 어려워짐
- Laurence Sterne은 250년 전 표절자들을 약제사에 비유하며 비난했으나, 그 표현 자체가 Robert Burton에서 가져온 것으로 밝혀짐
- Mark Twain은 "인간의 발화에는 표절 외에는 거의 아무것도 없다"고 언급
영감과 표절의 구분
- T.S. Eliot의 유명한 말: "미숙한 시인은 모방하고, 성숙한 시인은 훔친다"
- 하지만 후반부는 덜 알려져 있음: "나쁜 시인은 가져온 것을 훼손하고, 좋은 시인은 더 나은 것 또는 다른 것으로 만든다"
- Anthropic 소송에서 판사는 회사를 "작가가 되고자 하는 독자" 에 비유하며 새로운 창작물을 만든다고 판단
저작권 제도의 탄생과 기술의 영향
- 18세기 저작권 제도 확립으로 복제 권리가 명확해지고 복제 위반이 더 명확히 기소될 수 있게 됨
- Oxford 영문학 교수 Robert Douglas-Fairhurst: "저작은 직업이므로 자신의 재산을 지켜야 함"
- Charles Dickens는 복제물을 찍어낸 인쇄업자들을 저작권 분노와 금전적 이유로 고소
AI 탐지 기술의 발전
- 대학들이 AI 작성 과제물 탐지를 위해 AI를 활용하는 추세
- 학생들은 Dumb it Down 같은 서비스로 AI 작성물을 더 자연스럽게 보이도록 변환
- 표절 탐지 서비스 Turnitin의 CEO Chris Caren: 표절된 글은 "베이지색" 처럼 잘 쓰여졌지만 역동적이지 않음
- AI 작성물의 언어적 특징: "holistic" 같은 지루한 단어와 "notably" 의 빈번한 사용
모두의 문제가 된 표절
- 뉴욕타임스에서 표절 언급 빈도가 1950년대 대비 8배 증가함
- 표절 사건이 증가했을 수도 있지만, 완벽한 비극적 서사 구조(결함 있는 영웅의 몰락)를 따르기 때문에 대중의 관심을 끌기도 함
- AI 시대에 표절 논쟁이 작가를 넘어 사회 전반의 문제로 확장됨
결론적 시사점
- 기사 전체는 표절이 예외가 아닌 보편적 행위로 변한 시대를 풍자적으로 묘사
- 소제목인 “steal industry is booming(도용 산업의 호황)”은 표절이 일상화된 문화 현상을 비판적으로 표현
- 문학뿐 아니라 문화 전반에서 창작의 진정성과 독창성이 도전받고 있음을 암시
- “우리는 모두 표절자가 되었는가?”라는 질문은 창작의 윤리와 가치 재정립의 필요성을 제기
Hacker News 의견들
-
내 생각은 단순함
긴 문장이나 단어를 그대로 재사용하면서 출처를 밝히지 않으면 좋지 않음
기존 이야기를 다른 말로 재해석하는 건 괜찮음
누군가를 속이려는 의도로 거의 동일한 그림을 베끼는 건 안 됨
하지만 스타일이나 내용의 모방은 다른 접근이라면 괜찮음
사람들은 새로움에 너무 집착함. 누군가 내 작품에서 영감을 받아 재구성하거나 다시 표현한다면 그건 멋진 일임
예를 들어 Star Wars는 전형적인 영웅 서사 구조를 그대로 따르지만 여전히 가치가 있음. 대부분의 현대 판타지도 Middle Earth의 팬픽 같은 존재지만 존재 자체로 좋음
누군가 평생 무작위로 음을 찍어낸다고 해서, 그 이후 수십 년간 만들어진 모든 음악을 소유할 수는 없지 않음- 법도 대체로 같은 입장임
비변형적 사용은 문제지만, 변형적 사용은 괜찮음
출처를 속이려는 의도가 있으면 안 되고, 단순히 스타일을 흉내 내는 건 괜찮음 - 영웅 서사는 실제 이야기가 아니라 The Hero With a Thousand Faces라는 책에서 이야기 구조를 분석한 서사 프레임워크임
대부분의 훌륭한 이야기가 이 구조를 어느 정도 따르지만, 각자의 구현 방식이 이야기를 특별하게 만듦
마치 “React를 그대로 복제한 웹앱”이라 해도, 실제로는 완전히 다른 것과 같음 - 학교가 ‘완전한 독창성’을 과도하게 강조하는 경향이 있음
- “Everything Is A Remix”라는 말처럼, 완전히 새로운 창작은 거의 신화적 이야기에 가까움. 뉴턴과 사과 이야기처럼 어느 정도는 꾸며진 전설임
- 법도 대체로 같은 입장임
-
AI로 작성된 글을 탐지하려는 대학들이 늘고 있음
하지만 Turnitin의 AI 탐지 정확도는 약 90% 수준이라는 연구 보고서가 있음
완벽하게 탐지된다고 보긴 어려움- 여러 도구를 써봤지만, 이 문제는 본질적으로 불가능한 경우가 많음
어떤 사람은 글쓰기 스타일이 AI와 비슷할 수 있고, AI가 인간처럼 쓸 수도 있음
AI가 일부 문장만 도와줬을 때도 전체가 AI로 판정될 수 있음
결국 인간과 AI의 경계가 모호해짐 - 사실 대부분의 학생 글 자체가 ‘밋밋하고 역동적이지 않음’
그래서 AI가 쓴 글과 구분하기 어렵고, 학습 증명의 수단으로서 글쓰기의 의미가 사라지고 있음
이제는 구두 발표나 토론이 유일한 학습 증명 수단일지도 모름 - 나는 의심스러운 과제를 Turnitin과 여러 LLM에 넣어 AI 생성 확률을 비교함
확률이 높으면 인용문을 검증하고, 여전히 의심되면 학생을 불러 직접 질문함
결국 인간의 판단이 필요함 - 90% 정확도라 해도, 실제로는 AI 탐지율 86% , 인간 글 오탐률 거의 0% 로 설계됨
거짓 양성보다 거짓 음성을 줄이는 방향으로 조정된 결과임
원한다면 더 균형 잡힌 탐지기로 조정할 수도 있음 - “90% 효과적”이라는 표현은 오해임
실제로는 민감도 90% , 특이도 100% 임
즉, 100명의 AI 부정행위자 중 10명은 잡히지 않지만, 인간이 쓴 글은 잘못 판정되지 않음
- 여러 도구를 써봤지만, 이 문제는 본질적으로 불가능한 경우가 많음
-
힘들게 만든 작품이 기계에 의해 무한히 재활용되고, 출처도 없이 반복되는 건 씁쓸한 일임
- 하지만 나 역시 평생 다른 사람의 아이디어를 흡수하고 재구성해왔음
그걸 내 창작물이라 부르며 자부심을 느끼는 건 인간의 본성임 - 기계가 내 작업을 흡수해 수많은 사람에게 새로운 아이디어를 확산시킨다면, 그 자체로 가치가 있음
지식재산권(IP)은 도덕보다 심리적 동기부여 장치에 가까움
이상적인 세상에서는 개인 이익이 아닌 순수한 탐구심으로 연구가 이루어지겠지만, 현실은 그렇지 않음 -
노동(work) 과 산출물(work product) 은 다름
고용인은 노동에 대한 보상을 받고, 결과물은 회사가 소유함
반면 자영업자는 결과물을 소유하지만 노동에 대한 급여는 없음
만약 ‘공유 정신’으로 공개했다면, 그건 스스로 자본을 무료로 배포한 것임
대가를 원한다면 유료화하거나, 브랜드와 명성으로 보상받아야 함 -
지식재산권 자체가 허구라고 생각함
AI의 등장 이후 오히려 더 많은 사람이 저작권을 옹호하게 된 현실이 아이러니함 - 나는 수학자라서 그런지, 이런 문제에 개인적으로는 개의치 않음
- 하지만 나 역시 평생 다른 사람의 아이디어를 흡수하고 재구성해왔음
-
창작자의 권리를 약화시키면 유통업자(distributor) 의 권력이 커짐
대부분의 경제적 이익이 중간 유통자에게 흘러가는 구조가 됨- 하지만 저작권을 강화하면, 유통사가 저자에게서 권리를 강제로 양도받는 계약을 만들기도 함
독일처럼 저작권 양도가 불가능한 제도가 이를 막는 데 도움이 됨 - 실제로 이런 흐름은 계속되어 왔음
석유 산업처럼, 중간 단계에서 부를 흡수하는 구조가 사회 전반에 퍼져 있음
AI 열풍도 결국 “내 몫을 어떻게 챙길까”라는 탐욕의 연장선 같음 - 인터넷 시대에는 배포 비용이 거의 없기 때문에, 오히려 저작권이 유통업자를 강화함
창작자는 유한한 생산 능력을 가지지만, 유통사는 무한히 저작권을 축적할 수 있음
- 하지만 저작권을 강화하면, 유통사가 저자에게서 권리를 강제로 양도받는 계약을 만들기도 함
-
소설과 논문에서의 표절 개념은 다름
소설은 아이디어를 차용해도 괜찮지만, 학문에서는 아이디어 자체가 핵심 자산이므로 출처 표기가 필수임
단순히 문장을 바꾸는 건 가장 교묘한 형태의 표절임
좋은 논문은 인용과 참고문헌이 가득하고, 그 위에 새로운 통찰을 더함- “재표현하되 인용하라”는 게 올바른 교육임
인용 없이 문장을 그대로 쓰면 표절이고, 패러프레이즈 + 인용은 올바름
다만 ‘공통 지식(common knowledge)’의 경계가 모호해 혼란이 생기기도 함 - 하지만 어떤 사람은 ‘아이디어의 도둑질’ 자체가 허구라고 봄
AI 시대의 진짜 비극은 사람들이 저작권 개념을 비판 없이 받아들이게 된 것임
- “재표현하되 인용하라”는 게 올바른 교육임
-
RiP!: A Remix Manifesto와 YouTube 영상을 추천함
20년 전 작품이지만, 인간도 결국 리믹스 기계임
LLM은 인간 창의성의 일부를 기술적으로 구현한 첫 사례라 생각함
감정은 없지만, 인간이 최종 필터로서 품질과 감정을 부여함 -
엔지니어들이 지식재산권(IP) 을 이해하기 어려워하는 이유는, 이 법이 의도(intent) 를 중심으로 하기 때문임
법원이 ‘의도’를 추정해 판단하는 구조가 엔지니어의 사고방식과 맞지 않음- 혹은 ‘창작자’ 계층이 자신의 수입이 걸려 있어서, 아이디어의 사유화를 정당화하는 구조에 스스로 갇혀 있음
-
“플래저리즘 스토리”는 비극적 영웅 서사처럼 흥미로운 이야기임
하지만 ‘테크 기업’은 콘텐츠를 직접 만들지 않고 접근만 중개하던 존재였음
이제는 생성형 AI로 직접 콘텐츠를 생산함
그 과정에서 대규모 저작권 자료를 무단 사용했는지가 쟁점이며, 법원이 판단할 문제임
결국 이들 중개 기업은 여전히 데이터를 수집하고 감시하며, 그 정보를 자유롭게 활용함 -
AI 시대의 표절과 영감의 경계는 모호함
ChatGPT를 쓰는 게 표절인지, 아니면 ‘AI 공동 저자’ 와의 협업인지 논쟁이 있음
심지어 기사 낭독용 AI 음성도 실제 사람의 목소리 특성을 학습한 결과라면, 그 또한 저작권 문제와 다르지 않음 -
“만약 아무도 SF를 쓴 적이 없다면, AI가 과연 SF를 쓸 수 있을까?”라는 질문을 던짐
- 사실 SF는 인류 최초의 서사부터 존재했음
길가메시 서사시나 라마야나에도 이미 공상 요소가 있음
장르는 너무 포괄적이라 소유할 수 있는 개념이 아님
영감은 표절이 아님 - 오래된 자료로만 학습한 LLM에 새로운 스타일을 설명해 소설을 쓰게 하면, 실제 스타일과 얼마나 다른지 실험해볼 수 있을 듯함
- 결국 AI는 훈련 데이터가 있어야만 새로운 장르를 생성할 수 있음
아무런 기반 없이 SF를 만들어내긴 어려움 - AI는 입력 프롬프트 없이는 아무것도 쓰지 않음. 그 점을 잊지 말아야 함
- 사실 SF는 인류 최초의 서사부터 존재했음