▲GN⁺ 2025-01-19 | parent | ★ favorite | on: 아마존 AI 크롤러로 불안정해진 내 Git 서버(xeiaso.net)Hacker News 의견 변호사에게 "명확한 중지 및 중단" 서신을 작성하도록 요청하여 Amazon에 전달함으로써 문제 해결을 시도할 수 있음 Amazon이 중단하지 않으면 형사 고발을 통해 주의를 끌 수 있음 웹사이트에 사람이 방문하지 않을 링크를 추가하고 robots.txt에 이를 금지하여 AI 크롤러를 차단하는 방법 제안 IP 주소가 해당 링크를 방문하면 24시간 차단함 AI 및 SEO 봇들이 robots.txt를 거의 준수하지 않으며 차단하기 어려움 AI 크롤러가 접근을 원한다면 규칙을 따르거나 비용을 지불해야 함 Amazon이 아닌 다른 주체가 AI 크롤러로 위장할 가능성 있음 회전하는 주거용 IP와 변경되는 사용자 에이전트 문자열이 의심스러움 개인 서버에서 AI 크롤러로 인해 CPU 사용량이 급증하는 문제 발생 robots.txt와 사용자 에이전트 기반 차단 목록으로 문제를 줄였으나 지속 여부는 불확실함 AI 크롤러를 차단하는 대신 유해한 콘텐츠를 제공하여 문제를 해결할 수 있을 것이라는 의견 Amazon이 이를 발견하면 문제 해결을 위해 비용을 지출할 가능성 있음 Amazon으로 위장한 DDoS 공격일 가능성 제기 주거용 IP에서 요청이 오는 것이 의심스러움 Pinboard 사이트도 AI 크롤러로 인해 트래픽이 급증하여 사이트가 다운됨 IP 범위로 차단할 수 없어 캡차를 사용해야 함 Amazon이 AWS 크레딧을 제공하여 트래픽 초과 비용을 보상해주길 바라는 의견 광고 수익으로 이를 상쇄할 수 있을 것이라는 기대 Nginx를 구성하여 차단하기 전, Bytespider와 Amazonbot이 전체 트래픽의 80%를 차지함 ClaudeBot이 Redmine에 5년간의 트래픽을 한 달 만에 초과시킴
Hacker News 의견
변호사에게 "명확한 중지 및 중단" 서신을 작성하도록 요청하여 Amazon에 전달함으로써 문제 해결을 시도할 수 있음
웹사이트에 사람이 방문하지 않을 링크를 추가하고 robots.txt에 이를 금지하여 AI 크롤러를 차단하는 방법 제안
AI 및 SEO 봇들이 robots.txt를 거의 준수하지 않으며 차단하기 어려움
Amazon이 아닌 다른 주체가 AI 크롤러로 위장할 가능성 있음
개인 서버에서 AI 크롤러로 인해 CPU 사용량이 급증하는 문제 발생
AI 크롤러를 차단하는 대신 유해한 콘텐츠를 제공하여 문제를 해결할 수 있을 것이라는 의견
Amazon으로 위장한 DDoS 공격일 가능성 제기
Pinboard 사이트도 AI 크롤러로 인해 트래픽이 급증하여 사이트가 다운됨
Amazon이 AWS 크레딧을 제공하여 트래픽 초과 비용을 보상해주길 바라는 의견
Nginx를 구성하여 차단하기 전, Bytespider와 Amazonbot이 전체 트래픽의 80%를 차지함