1P by neo 2023-08-26 | favorite | 댓글 1개
  • 웹 스크래핑에 대한 법적 복잡성과 위선에 대한 기사
  • Meta와 Microsoft와 같은 대기업들이 자신들의 플랫폼에서 웹 스크래핑을 금지하면서 동시에 다른 회사의 플랫폼에서 데이터를 수집하는 방식
  • 인터넷에서 데이터를 접근하고 사용할 수 있는 법적 문제와 그 목적에 대한 복잡성. 저작권이나 다른 지적 재산권으로 보호받는 데이터 형태가 있지만, 인터넷의 대부분 데이터는 쉽게 보호받지 못함
  • LinkedIn과 Facebook과 같은 소셜 미디어 회사들이 웹 스크래핑 소송을 가장 공격적으로 추구. 그러나 그들이 보호하려는 콘텐츠는 사용자가 생성한 것이며, 그들 자신의 재산이 아님
  • 인터넷 초기에 회사들이 물건에 대한 침입으로서의 웹 스크래핑을 중단시키기 위해 법적 이론을 사용. 즉, 원치 않는 대량의 데이터 요청이 개인의 유형 재산, 즉 컴퓨터 서버에 대한 침입 형태라고 주장
  • 2000년대 초부터 2017년까지, Computer Fraud and Abuse Act (CFAA)가 웹 스크래핑을 방지하는 주요 법적 이론이었음. CFAA는 "보호된 컴퓨터"에 대한 무단 접근을 금지함
  • 2017년 hiQ Labs, Inc. 대 LinkedIn Corp. 사건에서 웹 스크래퍼의 CFAA에 따른 공개 LinkedIn 데이터 접근 권리를 확인, 이를 공개 데이터를 스크래핑할 수 있는 긍정적인 권리로 해석하는 이들이 많아짐
  • 현재 웹 스크래핑을 중단시키는 주요 방법은 계약 위반 주장을 통한 것. 이를 통해 회사들이 계약법을 통해 데이터 사용 및 접근에 대한 재산권을 주장할 수 있게 함
  • 재산법에서 계약법으로의 이동은 웹사이트 소유자들이 온라인 이용 약관을 통해 온라인 데이터에 대한 권리를 정의할 수 있게 함
  • Microsoft와 같은 회사의 위선을 강조하는 기사. 최근에 AI 서비스의 스크래핑을 금지하는 이용 약관을 업데이트했지만, 그들의 계열사인 OpenAI는 인터넷 전체를 스크래핑하도록 설계된 제품을 출시함
  • 저자는 법원이 사적 회사들이 접착 계약을 통해 지적 재산권을 창출하도록 허용하는 것을 비난, 이러한 결정들은 공공의 이익에 관한 문제가 되어야 한다고 주장
  • 기사는 현재의 웹 스크래핑에 대한 법적 체제가 생성적 AI 사례로 시험될 것이라고 제안하며, 법의 일관성이 유지될 수 없으며 앞으로 몇 년 동안 중요한 법적 발전이 이루어질 것이라고 예측
Hacker News 의견
  • 최근 AI와 LLM 경쟁은 웹 스크래핑에 대한 우려를 높이고 있으며, 주요 기술 인물들과 기업들이 인식된 위협에 대한 방어를 강화하고 있다.
  • 데이터 스크래핑 주변의 공포를 완화하기 위해 상업적 AI 응용 프로그램에 대한 새로운 저작권 해석이 필요하다.
  • HiQ 대 LinkedIn 사건은 웹 스크래핑에 대한 논의에서 자주 인용되지만, 사건의 세부 사항은 복잡하고 종종 무시된다.
  • 데이터를 스크래핑하면서 자신들의 데이터 스크래핑을 금지하는 회사들의 인식된 위선은 경쟁 전략으로 이해될 수 있으며, 모순이 아니다.
  • 재산법에서 계약법으로의 전환은 웹사이트 소유자들이 자신들의 권리를 정의할 수 있게 해주었으며, 이로 인해 대기업들로부터 일방적인 "계약"이 확산되었다.
  • Microsoft가 인터넷을 스크래핑하도록 설계된 제품을 출시하면서 스크래핑을 금지한 최근의 사례는 기업의 위선의 예로 지적되었다.
  • 웹 스크래핑은 특히 규모 때문에 비즈니스 모델 문제로 간주되며, 광고 수익에 의존하는 무료 콘텐츠 제공자들은 광고를 우회하는 스크래핑에 의해 위협받고 있다.
  • Facebook과 같은 플랫폼에서 사용자가 생성한 콘텐츠의 소유권은 복잡하며, 사용자들은 소유권을 유지하면서 플랫폼에 광범위한 사용 권리를 부여한다.
  • 웹 스크래핑에 대한 법적 장애물은 일반적으로 해로운 것으로 간주되지만, 스팸 이메일과 같은 스크래핑으로부터 부정적인 영향을 경험한 개인들도 있다.