이 일로 Zuckerberg가 각 침해 건마다 법정 최저 손해배상액인 750달러라도 물게 된다면 기뻐할 사람이 많을 듯함
이전 Anthropic 침해 사건에서는 AI 학습 자체는 변형적 이용이고 그 자체로 침해가 아니지만, 그 목적을 위해 저작물을 불법 복제한 행위는 명백히 침해라고 봤음
합의금이 15억 달러였고, 불법 복제한 50만 건당 거의 3천 달러꼴이었으니 Zuckerberg가 “수백만” 건을 불법 복제했다면 60억 달러 합의도 꽤 그럴듯함
DJT가 대통령인 동안에는 Zuckerberg나 Meta에게 아무 일도 안 생길 것 같음
법을 어겨도 되는 최고의 보호막을 사둔 셈임
이 정도로는 전혀 인상적이지 않음. 그렇게 해놓고도 어떻게 계속 AI 독점자/패권자로 남을 수 있는지 모르겠음
사실상 묻지도 않고 전부 강제 인수해 놓고, 나중에 가격 흥정을 하는 꼴임. 형사 기소는 어디 갔고, 자유가 아니라면 최소한 지분 자산 박탈이라도 어디 갔나 싶음
결국 지식재산권 변호사를 응원하게 될 줄은 몰랐음
맥락상 Zuckerberg의 순자산은 약 2,200억 달러임
예전에 MP3를 내려받기만 하고 재배포도 안 한 학생들에게 온갖 소송을 걸었음
공정 이용으로 볼 만한 변형도 없고 그냥 파일 다운로드였다는 이유였는데, 배운 교훈은 그 학생들이 차라리 수백만 건을 훔쳤어야 했다는 것임
그건 정보 여론 조성 캠페인이었을 수도 있음
최종 이용자도 기소될 수 있으면 담론 자체가 긍정에서 부정으로 바뀌고, 권력을 가진 쪽이 그 행동을 억제하기 쉬워짐
진짜 구분 기준은 엄청난 부자냐 아니냐임
몇 주 전에 개인 cgit 서버에서 Meta의 ASN을 차단해야 했음. robots.txt를 무시하고 서버를 태워 먹고 있었음
서로 다른 네트워크 블록에 퍼져서 IP 기반 제한을 피하려는 게 분명해 보였고, 그들 때문에 접근 로그만 수백 MB가 쌓였음. 믿기 어려웠음
작년에도 같은 일을 겪었음. 존재하지 않는 무작위 URL을 쉬지 않고 크롤링했음
사용자 질의를 검색 엔드포인트로 프록시하려는 것처럼 보였고, ASN이 일치해서 누가 Meta인 척한 것도 아니었음
ASN 기반 차단이 훨씬 더 흔해야 한다고 봄. 다만 흔한 도구들에서 1급 설정 옵션으로 지원하지 않는 경우가 많아 아쉬움
이런 회사를 어떻게 식별하는지 궁금함. 어느 회사가 내 사이트를 긁어 갔는지 알아보는 서비스가 있나?
갑자기 사람들이 Elsevier 편을 드는 게 웃김. 현행법상 AI 학습은 변형적 공정 이용이라는 게 명확해 보임
어쩌면 이 사건이 그걸 입증하는 판례가 될 수도 있음
AI 지지자들이 지난 20년간 저작권 산업에 맞서 온 사람들까지, AI 산업에 반발한다는 이유로 갑자기 입장을 바꾼 것처럼 몰아가는 게 거슬림
개인 사용을 위한 소량의 대마 비범죄화나 합법화에는 찬성하지만, 그게 경제를 왜곡할 정도로 거대한 산업적 마약 생산과 모든 제품에 메스암페타민을 넣으려는 회사들을 지지한다는 뜻은 아님
나도 웃기다고 봄. 다른 스레드와 글[0]에서도 이렇게 말했음
“그들은 그 훔친 과실을 다시 복사했다”라고 하는데, 도대체 무엇이 “훔친” 것인가? 원 소유자는 도난당했다는 것을 여전히 가지고 있지 않나?
Dowling v. United States, 473 U.S. 207 (1985)에서 대법원은 저작권 있는 음악 저작물의 음반을 무단 판매한 것이 National Stolen Property Act상 “도난, 전용, 사기 취득” 물품에 해당하지 않는다고 판결했음
설령 논증을 위해 훔친 것이라고 해도, 저작권의 목적은 “저자와 발명가에게 제한된 기간 동안 각자의 저작과 발견에 대한 독점권을 보장함으로써 과학과 유용한 예술의 발전을 촉진”하는 것임
LLM이 예술과 과학을 발전시키지 않았다고 입증하기는 매우 어려울 테니, 최소한 변형적 이용, 즉 공정 이용에 해당한다고 봄
[0] https://news.ycombinator.com/item?id=48026207#48029072
“AI 학습이 현행법상 변형적 공정 이용”이라는 정도까지도 갈 필요가 없다고 봄. 이건 완전히 새로운 제품임
키보드를 판 사람이 그 키보드로 만든 소프트웨어에 대해 로열티를 요구하는 것과 비슷함
책을 쓴 사람이 LLM 학습이라는 새로운 사용 사례를 예측하지 못했다는 건 중요하지 않음. 그 책이 LLM 안에 들어 있는 것도 아니고, LLM과 함께 판매되는 것도 아님. LLM을 만드는 데 쓰인 수십억 개 도구 중 하나일 뿐임
AI 회사가 Disney 같은 불쌍한 지식재산권 보유자에게서 가치를 뽑아낸다는 식으로 포장하는 게 미칠 노릇임. 그 콘텐츠는 우리의 문화유산이고 이미 우리 것임. 단지 어떤 바보에게 평생 독점 착취권이 주어졌을 뿐임
LLM은 우리가 이미 소유한 데이터로 학습됨. Disney 등은 수십 년 전 만들어진 것들에서 새 기술을 이용해 돈을 더 뜯어내려는 것임
최악으로 보더라도 역공학이고, 미국에서는 공정 이용으로 보호되어야 했지만 그 보호가 어느 정도 침식된 듯함
보통 쟁점은 변형 여부가 아니라 저작권 자료를 불법으로 취득했다는 데 있음
Elsevier도, 저자의 동의 없이 상업 배포 AI 학습 목적으로 지식재산을 가져가는 사람들도 모두 합법이어야 한다고 봄
개인 책임이 어떻게 될지 기대됨
회사에서는 책임이 너무 자주 증발하는데, 그 법률적 정당화가 뭔지 궁금했음. 지금까지 남은 이유는 “어깨 으쓱”과 “관련 조항이 적용되지 않는 듯하다” 정도인데, 둘 다 좋은 이유는 아님
Aaron Swartz의 시신에 자석을 붙이면, 지금쯤 얼마나 빠르게 돌고 있을지 생각하면 강력한 에너지원이 되겠다는 농담을 하려 했음
하지만 솔직히 그는 자기 사건이 처리된 방식과 그 뒤로도 별로 나아진 게 없다는 점을 보면 이런 일을 예상했을 것 같음
Aaron Swartz 사건 처리는 참사였지만, 그는 불법 복제 혐의로 기소된 게 아니었음
혐의는 사기, 보호된 컴퓨터에 대한 불법 접근, 컴퓨터 손상이었음
시간이 지나며 사건의 근거가 잊히고 불법 복제 사건이라는 가정으로 대체됐지만, 실제로는 불법 접근에 관한 사건이었음
다른 현실의 Aaron Swartz는 성인화되지 않고, 지금쯤 YC 동문 친구들과 함께 학습 데이터를 업로드하면 돈을 주는 AI/암호화폐 스타트업을 운영하고 있을지도 모름
Zuckerberg가 이 일로 심하게 처벌받지 않는다면, 적어도 다른 모든 사람도 똑같이 해도 면책된다는 법적 선례가 생겼으면 함
미래의 모든 Aaron Swartz들이 과학 논문을 전 세계에 자유롭게 공유할 수 있어야 함
그들은 로비로 규제 포획을 만들고, 작은 참가자들에게는 다리를 올려버릴 가능성이 높다고 봄
법적 문제가 많다는 걸 알면서도, 회사에 변호사가 있는 이유가 있다며 어떤 일을 하라고 지시받은 엔지니어를 개인적으로 알고 있음
소송이 걸렸을 때 증거개시 절차에서 그런 게 드러나면 좋겠지만, 아마 절대 나오지 않을 것 같음
내부고발도 요즘 경제 상황에서는 좋은 선택지가 아니지만, 그래도 더 많은 사람이 했으면 함
그러니까 “빠르게 움직이고 물건을 훔쳐라”인가?
AI 수집기들이 막 시작했을 때 기본적으로 그렇게 생각했음. 사람들이 무슨 일이 벌어지는지 깨닫고 차단하기 전에 가능한 한 전부 긁어 모으려는 계획이었던 듯함
그들이 사이트를 훑고 긁어가는 속도는 합법적인 크롤러라고 불리는 것들과 비교해도 훨씬 과했고, 그게 가장 논리적인 설명처럼 보였음
빠르게 움직이고 법을 깨라
처음부터, 맨 위에서 시작된 일임
노동계급에게서 일어난 사상 최대의 절도임
물건을 훔쳤다고? 이게 또 “차를 불법 복제하진 않겠죠” 논리인가? 그건 이미 한참 전에 넘어선 줄 알았음
CEO가 승인했든 다른 고위 인사가 승인했든, 회사의 책임은 바뀌지 않을 것 같음
답해야 할 질문은 그런 일이 있었는지, 있었다면 공정 이용으로 보호되지 않는 저작권 침해인지이지, 어느 회사 임원이 승인했는지가 아님
Aaron Swartz는 과학 저널 논문을 내려받아 세상에 무료로 공유하려 했다는 이유로, 그것도 이익을 낸 것도 아닌데 수년의 징역형에 직면했고 결국 스스로 생을 마감했음
그런데 수십억 달러짜리 기업이 수백만 건의 저작권 있는 창작물을 내려받아, 그 데이터셋으로 새로운 유형의 인공지능 모델을 학습시키고 노동시장 전체를 재편하려는 건 그냥 Silicon Valley식 혁신이고, 훈장이라도 줘야 한다는 분위기임
한 사람이 저작권 자료를 불법 다운로드하면 범죄임. 다국적 기업이 저작권 자료를 불법 다운로드하면 미국 경제에 남은 유일한 성장 영역이자 국가안보에 필수적인 일이 됨
Aaron이 로컬 사본을 삭제하자 Jstor는 소송을 취하했음. DOJ는 취하하지 않았음
Meta가 로컬 사본을 삭제했을 것 같지는 않음
Aaron Swartz는 부당한 대우를 받았고, 그 이유는 저작권법이 형편없기 때문임
그런 법과 처우에 반대해야지, 상대를 응징하는 도구로 휘둘러서는 안 됨
모두가 똑같이 부당하게 대우받아야 한다고 주장하는 건 잘못임. 나쁜 법과 구조를 없애자고 주장하는 편이 낫다
Hacker News 의견들
이 일로 Zuckerberg가 각 침해 건마다 법정 최저 손해배상액인 750달러라도 물게 된다면 기뻐할 사람이 많을 듯함
이전 Anthropic 침해 사건에서는 AI 학습 자체는 변형적 이용이고 그 자체로 침해가 아니지만, 그 목적을 위해 저작물을 불법 복제한 행위는 명백히 침해라고 봤음
합의금이 15억 달러였고, 불법 복제한 50만 건당 거의 3천 달러꼴이었으니 Zuckerberg가 “수백만” 건을 불법 복제했다면 60억 달러 합의도 꽤 그럴듯함
그런데 이 사람은 존재하는 거의 모든 미디어를 훔쳐 쓰고도, 기소될 수 없을 만큼 부자라서 그대로 빠져나갈 것 같음
[1] 예: https://en.wikipedia.org/wiki/Oink%27s_Pink_Palace#Legal_pro...
법을 어겨도 되는 최고의 보호막을 사둔 셈임
사실상 묻지도 않고 전부 강제 인수해 놓고, 나중에 가격 흥정을 하는 꼴임. 형사 기소는 어디 갔고, 자유가 아니라면 최소한 지분 자산 박탈이라도 어디 갔나 싶음
예전에 MP3를 내려받기만 하고 재배포도 안 한 학생들에게 온갖 소송을 걸었음
공정 이용으로 볼 만한 변형도 없고 그냥 파일 다운로드였다는 이유였는데, 배운 교훈은 그 학생들이 차라리 수백만 건을 훔쳤어야 했다는 것임
최종 이용자도 기소될 수 있으면 담론 자체가 긍정에서 부정으로 바뀌고, 권력을 가진 쪽이 그 행동을 억제하기 쉬워짐
몇 주 전에 개인 cgit 서버에서 Meta의 ASN을 차단해야 했음. robots.txt를 무시하고 서버를 태워 먹고 있었음
서로 다른 네트워크 블록에 퍼져서 IP 기반 제한을 피하려는 게 분명해 보였고, 그들 때문에 접근 로그만 수백 MB가 쌓였음. 믿기 어려웠음
사용자 질의를 검색 엔드포인트로 프록시하려는 것처럼 보였고, ASN이 일치해서 누가 Meta인 척한 것도 아니었음
갑자기 사람들이 Elsevier 편을 드는 게 웃김. 현행법상 AI 학습은 변형적 공정 이용이라는 게 명확해 보임
어쩌면 이 사건이 그걸 입증하는 판례가 될 수도 있음
개인 사용을 위한 소량의 대마 비범죄화나 합법화에는 찬성하지만, 그게 경제를 왜곡할 정도로 거대한 산업적 마약 생산과 모든 제품에 메스암페타민을 넣으려는 회사들을 지지한다는 뜻은 아님
“그들은 그 훔친 과실을 다시 복사했다”라고 하는데, 도대체 무엇이 “훔친” 것인가? 원 소유자는 도난당했다는 것을 여전히 가지고 있지 않나?
Dowling v. United States, 473 U.S. 207 (1985)에서 대법원은 저작권 있는 음악 저작물의 음반을 무단 판매한 것이 National Stolen Property Act상 “도난, 전용, 사기 취득” 물품에 해당하지 않는다고 판결했음
설령 논증을 위해 훔친 것이라고 해도, 저작권의 목적은 “저자와 발명가에게 제한된 기간 동안 각자의 저작과 발견에 대한 독점권을 보장함으로써 과학과 유용한 예술의 발전을 촉진”하는 것임
LLM이 예술과 과학을 발전시키지 않았다고 입증하기는 매우 어려울 테니, 최소한 변형적 이용, 즉 공정 이용에 해당한다고 봄
[0] https://news.ycombinator.com/item?id=48026207#48029072
키보드를 판 사람이 그 키보드로 만든 소프트웨어에 대해 로열티를 요구하는 것과 비슷함
책을 쓴 사람이 LLM 학습이라는 새로운 사용 사례를 예측하지 못했다는 건 중요하지 않음. 그 책이 LLM 안에 들어 있는 것도 아니고, LLM과 함께 판매되는 것도 아님. LLM을 만드는 데 쓰인 수십억 개 도구 중 하나일 뿐임
AI 회사가 Disney 같은 불쌍한 지식재산권 보유자에게서 가치를 뽑아낸다는 식으로 포장하는 게 미칠 노릇임. 그 콘텐츠는 우리의 문화유산이고 이미 우리 것임. 단지 어떤 바보에게 평생 독점 착취권이 주어졌을 뿐임
LLM은 우리가 이미 소유한 데이터로 학습됨. Disney 등은 수십 년 전 만들어진 것들에서 새 기술을 이용해 돈을 더 뜯어내려는 것임
최악으로 보더라도 역공학이고, 미국에서는 공정 이용으로 보호되어야 했지만 그 보호가 어느 정도 침식된 듯함
개인 책임이 어떻게 될지 기대됨
회사에서는 책임이 너무 자주 증발하는데, 그 법률적 정당화가 뭔지 궁금했음. 지금까지 남은 이유는 “어깨 으쓱”과 “관련 조항이 적용되지 않는 듯하다” 정도인데, 둘 다 좋은 이유는 아님
Aaron Swartz의 시신에 자석을 붙이면, 지금쯤 얼마나 빠르게 돌고 있을지 생각하면 강력한 에너지원이 되겠다는 농담을 하려 했음
하지만 솔직히 그는 자기 사건이 처리된 방식과 그 뒤로도 별로 나아진 게 없다는 점을 보면 이런 일을 예상했을 것 같음
혐의는 사기, 보호된 컴퓨터에 대한 불법 접근, 컴퓨터 손상이었음
시간이 지나며 사건의 근거가 잊히고 불법 복제 사건이라는 가정으로 대체됐지만, 실제로는 불법 접근에 관한 사건이었음
Zuckerberg가 이 일로 심하게 처벌받지 않는다면, 적어도 다른 모든 사람도 똑같이 해도 면책된다는 법적 선례가 생겼으면 함
미래의 모든 Aaron Swartz들이 과학 논문을 전 세계에 자유롭게 공유할 수 있어야 함
법적 문제가 많다는 걸 알면서도, 회사에 변호사가 있는 이유가 있다며 어떤 일을 하라고 지시받은 엔지니어를 개인적으로 알고 있음
내부고발도 요즘 경제 상황에서는 좋은 선택지가 아니지만, 그래도 더 많은 사람이 했으면 함
그러니까 “빠르게 움직이고 물건을 훔쳐라”인가?
그들이 사이트를 훑고 긁어가는 속도는 합법적인 크롤러라고 불리는 것들과 비교해도 훨씬 과했고, 그게 가장 논리적인 설명처럼 보였음
CEO가 승인했든 다른 고위 인사가 승인했든, 회사의 책임은 바뀌지 않을 것 같음
답해야 할 질문은 그런 일이 있었는지, 있었다면 공정 이용으로 보호되지 않는 저작권 침해인지이지, 어느 회사 임원이 승인했는지가 아님
Aaron Swartz는 과학 저널 논문을 내려받아 세상에 무료로 공유하려 했다는 이유로, 그것도 이익을 낸 것도 아닌데 수년의 징역형에 직면했고 결국 스스로 생을 마감했음
그런데 수십억 달러짜리 기업이 수백만 건의 저작권 있는 창작물을 내려받아, 그 데이터셋으로 새로운 유형의 인공지능 모델을 학습시키고 노동시장 전체를 재편하려는 건 그냥 Silicon Valley식 혁신이고, 훈장이라도 줘야 한다는 분위기임
Meta가 로컬 사본을 삭제했을 것 같지는 않음
그런 법과 처우에 반대해야지, 상대를 응징하는 도구로 휘둘러서는 안 됨
모두가 똑같이 부당하게 대우받아야 한다고 주장하는 건 잘못임. 나쁜 법과 구조를 없애자고 주장하는 편이 낫다