나를 위한 웹 스크래핑, 그러나 너를 위해서는 아닌

(blog.ericgoldman.org)

1P by GN⁺ 2023-08-26 | ★ favorite | 댓글 1개

공개 웹 데이터가 생성형 AI와 플랫폼 경쟁의 핵심 자원이 되면서, 누가 데이터를 가져가도 되는지가 법·계약·시장 지배력의 문제로 커짐
LinkedIn·Facebook 같은 플랫폼이 보호하려는 데이터는 대체로 사용자 생성 콘텐츠라, 플랫폼이 직접 재산권을 주장하기 어려운 영역에 놓여 있음
스크래핑 억제 수단은 초기 동산 침해와 2000년대 CFAA에서, hiQ Labs v. LinkedIn 이후 계약 위반 청구 중심으로 이동함
Twitter/X의 Bright Data 소송처럼 최근 분쟁은 이용약관을 앞세워 계약 위반, 계약 방해, 부당이득을 묻는 방식으로 좁혀짐
기업은 자기 사이트 데이터는 “proprietary”라고 막으면서도 남의 공개 데이터는 가져가려 할 수 있고, 생성형 AI 학습 데이터 사건이 이 모순의 다음 시험대가 됨

스크래핑은 데이터 접근 문제임

웹 스크래핑은 인터넷에 공개된 지식을 대규모로 획득하는 방식이며, 누가 어떤 목적으로 데이터에 접근하고 사용할 수 있는지가 핵심 쟁점임
인터넷상의 일부 데이터는 저작권, 상표권, 기타 지식재산권으로 보호될 수 있지만, 많은 데이터는 보호하려는 주체가 쉽게 지식재산권을 주장하기 어려움
소셜 미디어 기업들은 스크래핑 소송을 적극적으로 제기해 왔지만, LinkedIn과 Facebook이 지키려는 콘텐츠는 대체로 사용자 생성 콘텐츠임
- 이용약관은 플랫폼에 사용자 콘텐츠 사용 라이선스를 주지만, 보통 저작권상 이해관계는 사용자에게 있음
- 플랫폼은 약관에서 해당 데이터에 대한 재산권을 부인하면서도, 실제로는 그 데이터를 자기 재산처럼 취급함

스크래핑을 막는 법적 수단의 이동

초기 인터넷에서는 동산 침해 이론이 스크래핑 억제 수단으로 쓰임
- 원치 않는 대량 데이터 요청이 사유의 유형 재산인 컴퓨터 서버를 침해한다는 논리임
- 손해 요소가 필요했으며, 1990년대 후반과 2000년대 초반에는 서투른 스크래퍼가 웹사이트에 부담을 주거나 사이트를 중단시키는 일이 있었음
기술 환경이 바뀌면서 이 이론의 설득력은 약해짐
- 서버 용량이 크게 증가함
- 많은 스크래퍼가 요청량을 제한해 호스트 서버에 감지되기 어렵거나 영향이 미미한 수준으로 동작함
- 서버나 유형 재산에 대한 실제 손해를 입증하기가 드물어짐
2000년대 초부터 2017년까지는 Computer Fraud and Abuse Act(CFAA) 가 주요 억제 수단이었음
- CFAA는 “보호된 컴퓨터”에 무단으로 접근하는 것을 금지함
- 스크래핑에서는 중지 요청서나 안티봇 조치로 권한이 철회된 뒤의 접근이 “무단”인지가 핵심이었음

hiQ Labs v. LinkedIn의 복잡한 결과

2001년부터 2017년까지는 권한 철회 뒤에도 계속 접근하면 CFAA 책임이 생긴다는 단순한 해석이 흔했음
2017년 hiQ Labs, Inc. v. LinkedIn Corp. 사건은 공개 LinkedIn 데이터 접근에 대해 스크래퍼인 hiQ Labs 측의 권리를 인정하는 방향으로 주목받음
- Ninth Circuit은 LinkedIn 같은 회사가 자신이 소유하지 않고 공개적으로 제공하며 스스로도 수집·사용하는 데이터에 대해 수집·사용 주체를 마음대로 정하면 정보 독점이 생길 위험이 있다고 봄
하지만 이 결과는 피로스의 승리에 가까웠음
- 이후 지방법원은 “LinkedIn의 User Agreement가 스크래핑과 스크래핑된 데이터의 무단 사용을 명확히 금지한다”고 판단함
- LinkedIn은 이를 근거로 hiQ Labs에 대해 영구금지명령과 손해배상을 얻음
이후 스크래핑을 막는 주된 수단은 CFAA보다 계약 위반 청구가 됨

계약법이 사실상 데이터 재산권처럼 작동함

최근 Twitter/X Corp.는 Bright Data를 포함한 여러 스크래퍼를 상대로 소송을 제기함
- Bright Data는 세계 최대급 웹 스크래핑 회사로 꼽힘
- Twitter가 Bright Data를 상대로 제기한 청구는 계약 위반, 계약 방해, 부당이득 3가지였음
10년 전 스크래핑 소송에서는 원고가 10~15개 법적 청구를 제기하며 여러 이론을 시험하는 경우가 흔했지만, 최근에는 법원이 계약 위반 청구를 집행할 것이라는 확신이 커짐
이 구조에서는 온라인 이용약관을 통해 호스트 웹사이트가 데이터에 대한 권리를 원하는 방식으로 정의할 수 있음
Mark Lemley의 2006년 Minnesota Law Review 글 Terms of Use는 재산법에서 계약법으로 이동하면 웹사이트 소유자의 권리 범위를 법이 아니라 사이트 소유자가 정하게 된다고 봄
법원은 일반적인 데이터 이용 규칙이나 기존 지식재산권 규칙 대신, 온라인 계약이 사이트 데이터에 대한 임시적 지식재산권처럼 작동하는 체계를 허용해 왔음
- 단, 저작권 보호와 완전히 동일한 방식으로 구성하면 문제가 될 수 있음

기업들의 이중적 스크래핑 태도

계약 위반을 재산권처럼 쓰는 법적 체계에는 일관성 요구가 없음
- 기업은 자기 사이트에서는 무엇이 “proprietary”인지 강하게 주장할 수 있음
- 동시에 다른 사이트에서는 무엇이 자유롭게 가져갈 수 있는 데이터인지 주장할 수 있음
Microsoft는 최근 일반 이용약관을 업데이트해 AI 서비스에 대한 스크래핑, 수확, 유사 추출 방식을 금지함
같은 시기 Microsoft 관계사 OpenAI는 인터넷을 스크래핑하도록 설계된 GPTbot을 공개함
OpenAI의 이용약관도 스크래핑을 금지함
Microsoft 자회사 LinkedIn은 미국에서 가장 주목받은 웹 스크래핑 소송 중 하나에서 승리를 선언했고, 전 경쟁사가 공개·비공개 데이터를 영구적으로 스크래핑하거나 접근하지 못하도록 영구금지명령을 얻음
Meta도 공개 콘텐츠를 스크래핑해 판매한 회사를 상대로 소송을 제기했지만, 과거 같은 스크래퍼에게 공개 데이터 스크래핑 비용을 지급한 사례가 있음

법원과 다음 시험대

이런 이중적 태도는 기업만의 문제가 아니라, 법원이 그렇게 할 수 있는 구조를 허용했기 때문에 가능하다는 비판을 받음
비판 대상에는 Register.com v. Verio, Inc., Southwest Airlines 관련 소송을 가능하게 한 Northern District of Texas, hiQ Labs 사건에서 CFAA 예비금지명령과 계약 위반 영구금지명령의 불일치를 설명하지 않은 법원이 포함됨
온라인 부합계약을 통해 사기업이 지식재산권을 발명하도록 허용하면, 공익의 문제여야 할 데이터 접근 판단이 사적 결정권자에게 좌우될 수 있음
계약은 온라인 계약을 포함해 주법 이슈이기 때문에 단순한 해결책을 상상하기 어려움
현재 법 상태와 무관하게, 다음 시험대는 생성형 AI 학습 데이터 사건들이며 이 영역의 법적 불일치는 앞으로도 논쟁을 낳을 수 있음

GN⁺ 2023-08-26 [-]

Hacker News 의견들

HiQ 대 LinkedIn 사건이 어디에 멈춰 있는지 헷갈림. 내가 알기로는 LinkedIn이 HiQ를 고소했고, 제9순회항소법원이 HiQ 편을 들었으며, LinkedIn이 대법원까지 갔지만 대법원이 Van Buren을 인용해 파기환송했고, 제9순회항소법원이 다시 검토해 같은 결론을 냈음
이후 LinkedIn이 HiQ 차단 금지 가처분 해제를 받아냈고, 2022년 11월에는 엇갈린 판결 뒤 결국 비공개 합의로 끝난 듯함. 다들 이 사건을 자주 인용하지만 세부를 잘 안 다룸
2022년 11월 판결 요약을 읽어보면 HiQ가 사람들이 로그인하게 해서 이용약관이 적용된 게 쟁점 같고, 결국 법원이 HiQ가 LinkedIn 이용약관을 위반했다는 LinkedIn 쪽 주장을 받아들인 것처럼 보임
https://www.natlawreview.com/article/court-finds-hiq-breache...
- 다시 읽어보니 흐름은 이렇게 정리하는 게 맞아 보임. hiQ가 북부 캘리포니아 연방지방법원에서 LinkedIn을 상대로 금지명령 구제를 청구했고 CFAA 청구에서 이겼으며, LinkedIn이 제9순회항소법원에 항소했지만 거기서도 hiQ가 CFAA 쟁점에서 이김
  hiQ의 독점금지 청구는 각하 신청 단계에서 패소했고, 그 사이쯤 hiQ는 폐업했지만 돈 많은 후원자가 소송비를 계속 냈음. LinkedIn은 계약 위반 등 다른 청구를 이어가 각하 신청에서 이겼고, 대법원은 Van Buren 이후 사건을 제9순회항소법원으로 돌려보냈으며, 제9순회항소법원은 CFAA 쟁점에서 다시 hiQ 편을 들었음
  이후 가처분은 해제됐고, hiQ는 약식판결에서 거의 전면 패배했으며, 결국 백기를 들고 LinkedIn 요구 대부분을 받아들이는 영구 금지명령에 동의하고 LinkedIn에 50만 달러를 지급함
- 2022년 11월의 엇갈린 판결이라기보다는 hiQ Labs의 대패였음. 법원이 내린 영구 금지명령을 읽어보면 됨
- 엇갈린 판결의 법적 선례라는 게 뭔지 모르겠음. 그런 게 가능한지도 몰랐음
약관형 “계약”이 늘어나고, 현대 사회에서 거기에 동의하지 않고 살기 거의 불가능해지면서 이 문제는 매일 더 나빠지고 있음. 새 SSD 하나 사는 일에도 약관 동의가 따라붙는 수준임
법은 점점 덜 중요해지고, 우리는 점점 더 거대 기업이 일방적으로 밀어붙이는 편면적 계약에 지배당하고 있음
- 좋은 표현임. 웹페이지를 바라보는 방식은 두 가지가 있다고 봄. 하나는 웹페이지가 광고판이라는 관점이고, 다른 하나는 웹페이지가 팸플릿이라는 관점임
  광고판이라면 내가 마음에 들지 않는 부분을 덧칠하는 것, 즉 광고 차단기를 쓰는 것은 도덕적으로 잘못된 일이 됨. 웹페이지를 소유한 쪽은 통제를 원하므로 이 관점을 선호하고, 일반 사용자처럼 웹페이지 모습을 바꿀 수 없는 쪽도 대체로 그렇게 받아들임
  팸플릿이라면 나는 그것을 잘라내고 마음대로 재배치할 자유가 있음. 기술적으로는 이쪽이 더 맞음. 웹페이지는 나에게 전달된 몇 비트의 정보일 뿐이고, 내 컴퓨터를 내가 통제하는 한 그 비트를 잘라내 내가 원하는 방식으로 볼 수 있음
  Amazon.com이 Amazon의 웹페이지를 담고 있고 Amazon이 그 페이지를 소유한다고 말할 수는 있음. 하지만 나는 Amazon 소유가 아닌 내 기기나 다른 사람의 기기로만 Amazon.com을 봐왔음. Amazon.com은 광고판 위에 존재하지 않고, 다른 사람들이 소유한 전자기기를 필요로 함. 그렇다면 그 전자기기 소유자에게는 어떤 권리가 있는가? 내 화면의 픽셀이 어느 순간부터 당신의 보호 공간이 되는가?
- 이런 계약들이 물리 세계에도 나타나는 게 가장 황당한 예임. 실제로 매장에 들어가면 계약 조건을 수락한 것으로 간주한다는 표지판을 붙여둔 가게들이 있음
  계약을 읽으려면 휴대폰으로 QR 코드를 스캔하라는 식임. 공원에서도 비슷한 걸 봤는데, 입장하면 공원을 고소하지 않거나 게시된 규칙을 따르는 법적 합의에 묶인다는 식이었음
- 이에 맞서려면 고객 쪽에도 자기 약관형 계약이 있어야 함. 회사가 나를 고객으로 받아들이면 회사의 자체 계약은 무효라는 내용이면 됨
  고객 조합이나 보험 같은 조직에 매달 돈을 내고 법무팀이 뒷받침하면 됨. 이 계약도 회사 계약만큼 집행 가능하거나 불가능할 테니 균형이 맞춰짐. 그러면 회사가 작은 글씨로 뭘 써놨든 읽을 필요가 없어짐
  회사가 고객의 계약을 받아들이지 않거나 자기 약관을 우회하게 해주지 않으면 그냥 떠나면 됨. 거래는 성사되지 않고, 다른 회사가 고객을 가져가게 됨
- 현대의 계약법은 사유재산권을 지속적으로 침해함. 강제 중재 조항은 그걸 더 악화시킴
위선처럼 보이는 느낌은 이것을 협력이나 평등한 공동체가 아니라 경쟁으로 보면 어느 정도 사라짐. 실제로도 경쟁임. 축구팀에게 “네가 내게 골을 넣으려는 건 괜찮지만, 내가 골을 넣으려 하니 갑자기 공을 막는 거냐?”라고 하지는 않음
당연히 그들은 “웹 스크래핑은 자원을 쓰니 그만하라”고 하면서도 뒤에서는 계속 웹 스크래핑을 할 것임
분명 나쁜 행동이긴 하지만 위선적 행동은 아니라고 봄. 끊임없이 싸우는 비도덕적 기업들이 자기 이익은 극대화하고 남의 이익은 최소화하려는 모습과 완전히 일치하기 때문임
- 흥미로운 비교지만, 올바른 틀인지는 모르겠음. 스크래핑을 기술적으로 어렵게 만드는 건 골을 넣으려는 시도에 해당하므로, 세상 전체에는 별로 좋지 않아도 위선은 아닐 수 있음
  하지만 특정 행동을 법적 수단으로 막으려는 건, 자기는 같은 플레이를 하면서 심판에게 특정 플레이 유형을 금지해달라고 요구하는 것에 더 가까움. 스포츠에서도 이런 일은 자주 있지만, 일반적으로 위선으로 보임
- “웹 스크래핑은 자원을 쓰니 그만하라”는 말은 공개 인터넷에 뭔가를 게시할 때 예상해야 하는 비용임. 사람들은 그것에 접근할 것임. 대중이 보라고 올려둔 것에 사람들이 접근한다고 불평할 권리는 없음
  물론 스크래퍼도 짜증나는 짓을 할 수 있음. 게으르게 서버를 끝없이 두드리거나 실수로 같은 콘텐츠를 반복해서 내려받을 수 있음. 하지만 그걸 위해 소송이 필요하진 않음. 서비스 거부 공격 수준이면 기존 법으로도 이미 다룰 수 있음
  일부 기업들이 모두를 더 나쁘게 만들고 자기들만 부유하게 한다면, 그런 기업에 법인격 특권을 계속 줘야 하는지 다시 생각해야 함. 우리 비용으로 원하는 걸 가져가는 기생충과 약탈자를 허용할 필요는 없음
- 위선은 자신이 말하는 이상을 선의로 믿지만 실제로는 지키지 못할 때만 성립하는 게 아님. 축구팀 비유로 흐려도, 남에게는 기준을 강요하면서 자신에게는 같은 기준을 적용하지 않는다는 사실은 바뀌지 않음
  그들이 비도덕적으로 악의에서 그렇게 하더라도 여전히 위선임. 오히려 그럴수록 더 그렇다. 중요한 건 어떤 정책을 내세우느냐이고, 진심으로 믿지 않는다고 해서 면제되는 건 아님
- “비도덕적 기업은 원래 그런다”는 논리의 문제는, 기업이 존재를 허용받는 이유가 사회 전체에 순편익을 준다는 전제에 있기 때문임. 그 전제가 사라지면 사회가 기업을 굶주린 러브크래프트식 악몽으로 보고 불과 증기선으로 없애지 않을 이유도 사라짐
- 축구에서는 공정한 경기를 만들기 위해 규칙이 아주 많이 조정되어 왔음. 회사법에서도 그런 조정을 좀 더 해야 할 듯함
이게 왜 위선을 보여주는지 모르겠음. 공개적으로 접근 가능한 웹을 크롤링하는 것과, 인증된 웹 애플리케이션이나 API를 스크래핑하는 것 사이에는 큰 차이가 있음. 합법적 검색엔진은 공개 웹 크롤링을 항상 함
- 위선은 여기서 나옴. OpenAI 등은 공개 웹을 스크래핑해서 모델을 학습시키고 만들었고, 그 모델로 구독을 팔아 돈을 벌지만 학습 데이터의 창작자에게는 아무것도 돌아가지 않음
  그러면서 자신들이 했던 일을 다른 사람에게는 금지함
  검색엔진과 비교하면 다름. 검색엔진은 공개 웹을 긁어 검색 색인을 만들고, 그 색인으로 검색 결과와 광고를 제공함. 중요한 건 검색 결과가 대체로 긁어온 웹사이트로 사람들을 보내며, 그 사이트들이 돈을 벌 기회를 제공한다는 점임
- Microsoft가 OpenAI에 투자한 건 맞지만, OpenAI를 통제하는 것은 아님
두 가지 문제가 보임. 웹 스크래핑은 분명 사업 모델 문제이고, 그 일부는 규모 때문임
콘텐츠를 무료로 제공하고 광고로 유지하려 한다면, 다른 사람이 광고를 보지 않고도 콘텐츠 가치를 가져가는 순간 그 모델은 무너지기 시작함. 광고 차단기, Google 검색 결과에 포함된 답변, Stack Overflow 클론, ChatGPT 같은 것들이 예임
다른 문제는 규모인데, 이걸 어떻게 해결할지는 모르겠음. 정부가 공원에서 삽을 써도 된다고 우호적 정책을 만들 때는 캠핑객 같은 사람에게 유용하리라 생각할 수 있음. 하지만 전문 노천 채굴팀이 나타나면 이야기가 달라짐
좋은 정보를 무료로 제공하고 책 판매나 전문 서비스로 돈을 버는 사이트라면 괜찮은 생계가 될 수 있음. 답변이 Google 답변 상자에 들어가더라도 더 복잡한 내용이나 분석은 여전히 방문해서 읽어야 하고, 거기서 팔로워가 생길 수 있음
하지만 ChatGPT 같은 것이 내 글을 “읽고” 가치의 80%를 출처도 모르게 나눠줄 수 있다면 끝장임. 사업 모델이 더 이상 작동하지 않음. 좋은 정보를 무료로 나눠주는 모든 모델이 실패함. 지금 예술가들이 겪는 문제와 같음
어떤 금지 없이는 고칠 방법을 모르겠음. 하지만 모든 나라가 이를 집행하지 않는 한 최저 공통분모에 맞춰야 하고, 결국 모든 콘텐츠를 잠가야 함. 웹 검색도, Google 답변도, ChatGPT도 안 됨. robots.txt에 “스크래핑하지 말아 주세요”라고 써도 작동하지 않을 것임
- 흥미로운 건 이게 본질적으로 전통적인 저작권 논의와 거의 똑같다는 점임. 차이는 책 저자들이 보통 자기 개인 웹사이트에서 책을 무료로 배포하지 않는다는 것뿐임
  저작권은 복사하기 아주 쉽고 싼 것을 판매하려는 저자의 사업 모델을 보호하려는 시도임. 웹 스크래핑을 법적으로 제한하려는 시도는 복사하기 쉽고 싼 것을 무료로 주되, 반드시 창작자에게 직접 와서 무료 사본을 받아가게 하려는 창작자의 사업 모델을 보호하려는 시도임
- 맞음. 그래서 스크래핑은 모두에게 무제한이고 합법이어야 함. 인터넷에서 접근 가능한 모든 정보는 가공해도 합법이어야 함
  따라서 우리가 GPT 서비스를 사용해 자체 모델을 학습시키거나 공개 접근 가능한 무엇이든 스크래핑하는 것도 가능해야 함. 우리의 유일한 방어는 어떤 범용 대규모 언어 모델보다 데이터를 더 잘 가공하는 경쟁 서비스임. 해법은 거의 언제나 규제가 아니라 공정한 경쟁임
- 유료 장벽이 이걸 해결할 것 같지는 않음. 스크래퍼에게는 유료 계정 하나면 충분함. 새 글이 나오는 대로 “읽는” 정도라면 속도 제한도 사실상 어렵다
  데이터를 얻은 뒤에는 배포할 수 있음. 그대로 게시하는 것이 저작권 침해라면, AI 뒤에 숨겨 흐리게 만드는 방식으로 충분히 우회될 것임
무료 대출 도서관과 웹 검색 색인이 존재하지 않았다가 오늘 새로 만들려고 했다면, 소송으로 완전히 박살났을 것임
이런 사건들이 기대고 있는 주된 근거는 계약 합의에 대한 모호한 이해임. 내 생각은 두 가지임. EULA는 회사들이 서명하라고 만든 문서가 아니고, 애초에 EULA는 쓰레기라고 봄
완전히 일방적이고, 대부분은 실제로 누군가 싸울 자원이 있다면 불법이거나 법정에서 버티지 못할 것임
EULA를 읽고 이해했는지 보장할 책임은 그것을 만든 회사에 있어야 하며, 사이트 접근 전에 그 사람이 EULA를 전부 이해했다는 걸 입증하지 못하면 집행할 수 없어야 한다고 봄. EULA는 사업 계약이 아님. 회사가 제품 사용에 붙이려는 일종의 기업식 사이비 법임
세상 어떤 제품이 이렇게 사용법에 대한 긴 규칙 목록을 딸려 보내고, 어기면 소송당할 수 있다고 하는가?
그래서 이게 “회사 대 회사 스크래핑”으로 돌아오면, 웹에 올려뒀고 그 콘텐츠에 진짜 저작권이 없다면, 즉 직접 만든 게 아니라면, 그걸 “도둑질”로부터 보호할 권리는 없음
물론 John Deere가 고객이 자기 트랙터를 수리하지 못하게 한다는 건 알지만, 그것도 헛소리임
- 이런 온라인 합의는 회사들이 방어할 자원을 많이 갖고 있더라도 자주 집행 가능함
링크된 Register.com 대 Verio 사건이 흥미로웠음. 법원이 약관형 계약에 대해 흔히 알려진 것보다 더 미묘한 결정을 내렸다고 봄
이 사건에서 Verio는 Register가 금지한 목적을 위해 Register의 API를 호출했음. 그런데 Register는 제한을 선언한 “계약” 문구를 호출이 끝난 뒤에야 제공했음. 아마 API 응답의 일부였던 듯함
법원은 실제로 이것이 너무 늦었다고 봤음. API 호출 조건을 알 수 있는 유일한 방법이 그 API를 호출하는 것이라면, 이는 슈링크랩 계약이고 조건은 무효라는 것임
다만 법원은 이 판단을 첫 API 호출에만 적용했음. Verio에는 상식을 기대할 수 있는 직원들이 있었고, 첫 호출 이후에는 문구를 읽고 제한을 알 기회가 있었기 때문임. 따라서 그 뒤의 모든 API 호출에서는 Verio 직원들이 Register가 명시적으로 금지한 일을 한다는 사실을 알고도 했으므로, 법원은 이를 계약 위반으로 판단함
중요한 점은 법원이 계약을 체결하려면 개인이 계약 조건을 알아야 한다는 원칙을 포기하지 않았다는 것임. 이 사건은 실제로는 조건을 알면서도 모르는 척하는 상황을 배척한 것에 가까움
[1] https://en.m.wikipedia.org/wiki/Register.com_v._Verio
지난주 논의된 Allen Institute 사례가 좋은 예임
https://news.ycombinator.com/item?id=37181415
그들은 퍼블릭 도메인 자료를 긁어 만든 데이터셋을 “공개”하면서, 사람들이 그것을 어떻게 쓸 수 있는지 제한하는 라이선스를 붙였음
“그들이 보호하려는 콘텐츠는 그들의 것이 아니라 사용자들의 것”이라는 말은 어느 정도만 맞음. Facebook은 콘텐츠가 사용자에게 속한다고 말함. 그래야 불법 콘텐츠가 있을 때 자기들이 책임 없다고 설명하기가 쉬움
하지만 사용자도 Facebook에 “Facebook에 게시하거나 Facebook과 관련해 게시한 모든 지식재산 콘텐츠를 사용할 수 있는 비독점적, 양도 가능, 재라이선스 가능, 로열티 없는, 전 세계 라이선스”를 부여하는 데 동의함
예를 들어 사용자가 자기 콘텐츠를 삭제해도 Facebook은 여전히 그것을 사용하고 친구들에게 보여줄 수 있음. 그래서 “어느 정도”라고 봄
- 그건 콘텐츠가 누구에게 속하는지를 바꾸지 않음. 단지 Facebook에 일부 권리를 줄 뿐임. 사실 “영구적”이나 “철회 불가능” 같은 표현이 없다면, 삭제한 뒤에도 계속 사용할 수 있다거나 권리 부여를 철회할 수 없다는 뜻이 되지는 않음
- 라이선스는 소유권이 아님. 어쨌든 글의 그 부분은 맥락 설명일 뿐이고, 여기서 설명한 내용은 논의된 소송이나 판결의 법적 근거가 아님. 왜 재산법이 사용되지 않았는지를 설명하는 부분임
- 게시된 표지를 읽었나? “내 사유지 밖 도로에서 걷기 금지”라고 되어 있었음
- 사용자가 자기 콘텐츠를 삭제해도 Facebook이 계속 사용하고 친구들에게 보여줄 수 있다는 말은 맞지 않는 것 같음. Facebook에 플랫폼에서 내 데이터를 삭제해달라고 요청했는데 1개월 안에 삭제하지 않으면, Facebook은 GDPR 위반이 되고 아마 CCPA 등도 위반하게 될 것임

답변달기

나를 위한 웹 스크래핑, 그러나 너를 위해서는 아닌

스크래핑은 데이터 접근 문제임

스크래핑을 막는 법적 수단의 이동

hiQ Labs v. LinkedIn의 복잡한 결과

계약법이 사실상 데이터 재산권처럼 작동함

기업들의 이중적 스크래핑 태도

법원과 다음 시험대

함께 보면 좋은 글 β

댓글과 토론

Hacker News 의견들