5P by GN⁺ 5시간전 | ★ favorite | 댓글 2개
  • 18,000 GitHub 스타를 보유한 NanoClaw의 개발자가, 프로젝트명을 Google에 검색하면 가짜 웹사이트가 공식 사이트보다 상위에 노출된다고 공개
  • 누군가 프로젝트 README를 스크래핑해 자동 생성한 가짜 사이트(nanoclaw[.]net) 가 Google 검색 결과 2위를 차지하고 있으며, 실제 공식 사이트는 5페이지 이후에도 나타나지 않음
  • SEO 최적화, Google Search Console 제출, 주요 IT 매체 보도 링크 확보 등 모든 정당한 조치를 취했음에도 Google 검색 결과는 변하지 않음
  • 가짜 사이트에 악성 코드나 피싱 링크가 삽입될 수 있어, 보안 중심으로 설계된 프로젝트의 가장 큰 보안 취약점이 Google 검색 자체가 된 상황
  • 모든 신호가 명백히 하나의 답을 가리킬 때조차 Google이 올바른 결과를 보여주지 못한다면, 인터넷 정보의 관문으로서 Google의 신뢰성 자체에 의문이 제기됨

NanoClaw 프로젝트와 가짜 사이트 문제의 발단

  • NanoClaw는 보안 우선 설계의 오픈소스 프로젝트로, 모든 에이전트가 격리된 컨테이너에서 실행되며 안전한 샌드박스 런타임을 핵심으로 삼음
  • 2월 2일 출시 후 빠르게 성장했으며, CNBC, VentureBeat, The Register 등 주요 매체에 보도됨
  • 출시 초기에는 별도 웹사이트 없이 GitHub 저장소가 곧 프로젝트 그 자체였으며, 기능 개발과 커뮤니티 구축에 집중
  • 2월 8일경 누군가 nanoclaw[.]net 도메인을 확보하고, README에서 스크래핑한 내용으로 자동 생성 사이트를 만듦
  • 초기에는 올바른 GitHub 링크를 포함하고 있어 큰 문제로 인식하지 않았음

가짜 사이트로 인한 피해 확산

  • 프로젝트가 성장하면서 점점 더 많은 사용자가 "당신 웹사이트에 오류가 있다", "사이트에 광고가 있느냐", "모바일에서 왜 이렇게 보이느냐" 등의 문의를 보내기 시작
  • 해당 사이트는 프로젝트에 대한 사실과 다른 정보를 게재하고 있으며, 게시 날짜까지 위조
  • 수천 명의 사용자가 이 사이트를 공식 사이트로 착각하고 있었고, NanoClaw에 대한 첫인상이 광고 투성이의 조잡한 페이지로 형성됨
  • 매일 피해가 누적되고 있으며, 이미 수십만 명이 잘못된 정보에 노출되었을 가능성

공식 사이트 구축과 SEO 대응 노력

  • 2주 전 공식 웹사이트 nanoclaw.dev를 구축하고 가능한 모든 조치를 수행
    • GitHub 저장소에서 공식 사이트 링크 연결
    • 구조화된 데이터, 적절한 SEO 최적화 적용
    • Google Search Console에 약 15회 제출
    • The Register, VentureBeat, The New Stack 등 매체 기사에서 실제 사이트로 링크 확보
    • Hacker News 1위를 기록한 블로그 포스트 게시
    • 사이트를 15개 언어로 번역
    • 모든 소셜 프로필에서 nanoclaw.dev로 연결
    • Google, Cloudflare, 도메인 등록업체 spaceship.com에 삭제 요청(takedown notice) 제출
  • 인터넷상의 모든 신호가 nanoclaw.dev를 공식 사이트로 가리키고 있으나, Google 검색 결과는 변하지 않음

Google 검색의 구조적 문제

  • Google 검색 1위인 NanoClaw GitHub 저장소의 웹사이트 필드에 nanoclaw.dev가 명시적으로 기재되어 있음
  • 그럼에도 Google은 여전히 가짜 사이트를 공식 사이트보다 상위에 노출
  • SEO 전문가들은 "SEO에서 이기면 된다", "Google Ads를 구매하라"고 조언했으나, 오픈소스 프로젝트 개발자가 자기 프로젝트명에 대해 SEO 전쟁을 벌여야 하는 상황 자체가 문제
  • 이것은 SEO 문제가 아니라 Google의 문제

보안 위험

  • NanoClaw는 에이전트 런타임의 안전성과 샌드박싱에 집중하는 보안 중심 프로젝트
  • 현재 프로젝트의 가장 큰 보안 취약점은 Google 검색 자체
  • 가짜 사이트 운영자는 언제든 해당 페이지에 암호화폐 사기, 피싱 페이지, 악성 다운로드 링크를 삽입할 수 있음
  • GitHub 저장소를 포크하여 악성 코드를 주입하고, Google이 정당한 사이트로 제공하는 가짜 사이트에서 링크할 수도 있음
  • Google이 이 상황을 실시간으로 가능하게 하고 있는 활성 보안 위험

Google 신뢰성에 대한 근본적 의문

  • 프로젝트 자체가 정답을 명확히 선언하고, 모든 신호가 일치하며, 답이 모호하지 않은 질문에서조차 Google이 올바른 결과를 제공하지 못함
  • 선거, 백신, 의료, 금융 등 중요한 정보에 대해 Google을 신뢰할 수 있는지 근본적 의문 제기
  • 메타 태그나 파비콘 형식이 완벽한지 스스로를 탓하는 것을 멈춰야 하며, Google이 풍부하고 명확한 신호를 가지고도 틀린 결과를 보여주는 것은 Google의 책임
  • Google이 인터넷 정보의 관문으로서 위치를 유지하려면, 이런 기본적인 문제를 해결할 수 있어야 함

SEO 스패머들은 정말 열심히 사는군요.
지금은 검색해보니 안 나오긴 하는데, 자신이 만든 제품들은 계속 검색해서 확인하는게 필요하긴 합니다.
저도 긱뉴스의 검색어 유입 순위는 매번 챙기고 있어요. 웹사이트 운영중이라면 서치콘솔 보시는 것은 필수.

Hacker News 의견들
  • 몇 년 전 John Reilly가 HN에 “How I ruined my SEO”라는 글을 올렸을 때 내가 무료로 도와줬음
    그가 그 과정을 블로그에 정리함
    원한다면 이번에도 도와줄 의향이 있음
    가장 빠른 해결책은 .net 사이트의 백링크 맵핑을 해서, 잘못된 링크를 건 매체에 이메일을 보내는 것임
    “이 링크는 가짜 사이트로 연결돼요, 진짜는 여기예요”라고 하면 의외로 많은 곳이 수정해줌
    그거 하나만으로도 상황이 바뀔 수 있음
    추가로 nanoclaw.dev에 구조화 데이터와 schema를 추가하면 검색엔진과 LLM이 더 잘 인식함
    실질적인 조언을 정리하자면

    1. Google Search Console에 nanoclaw.dev를 등록하고 sitemap 제출
    2. 가짜 사이트의 백링크가 많지 않아 충분히 회복 가능
    3. GitHub repo의 백링크 품질이 높으니, 그쪽에 연락해서 실제 사이트 링크를 추가하도록 요청
      백링크 목록 스프레드시트 참고
    4. Twitter/X, LinkedIn 등 공식 소셜 프로필을 만들어 Google의 knowledge graph를 강화
    5. 마지막으로, 이 HN 스레드에서 nanoclaw.dev로 직접 링크를 걸었다면 SEO에 큰 도움이 됐을 것임
    • 정말 너그러운 제안이라고 생각함
      하지만 저자 입장에서는 Google이 만든 문제를 본인이 직접 해결해야 하는 상황이 억울하게 느껴질 것 같음
      수십억 달러를 가진 회사가 GitHub에 명확히 있는 공식 링크조차 구분 못 해서, 결국 개인이 시간을 써야 한다는 게 불공평하게 느껴짐

    • 이런 불필요한 SEO 작업을 해야 한다는 게 허무하게 느껴짐

    • 이런 문제는 한 사이트만의 일이 아님
      수많은 오픈소스 프로젝트가 같은 문제를 겪고 있음
      근본적으로는 Google이 고쳐야 할 문제임

    • 훌륭한 조언임

    • 좋은 피드백임

  • 제3자의 시점에서 보면 .net 버전이 The RegisterThe New Stack 같은 고권위 매체의 링크를 받았기 때문에 상위에 노출된 것 같음
    아직 일주일밖에 안 됐으니 Google이 제대로 인식할 시간을 줘야 함
    Google은 주제를 먼저 다룬 사이트에 편향되는 경향이 있음
    따라서 시간이 지나면 순위가 조정될 가능성이 높음
    그동안은 GitHub 대신 공식 웹사이트로 링크를 걸어주는 게 좋음

    • 직접 확인해보니 The Register만 잘못된 페이지를 인용했고, 다른 기사들은 GitHub를 참조하고 있었음
      The Register 아카이브
      VentureBeat 아카이브
      The New Stack 아카이브

    • 인터넷에 복제 콘텐츠가 너무 많아서 ‘먼저 게시한 곳이 원본’이라는 기준이 항상 맞지는 않음을 보여줌

    • 그래서 아직도 검색하면 Java 8 문서가 상위에 뜨는 이유임. 꽤 짜증나는 현상임

    • 문제의 핵심은 ‘아직 일주일밖에 안 됐다’는 점임
      Google의 알고리즘은 수많은 authority, quality 가중치로 얽혀 있어서 단기간에 바꾸기 어려움

    • 개발자라면 각 프로젝트마다 자체 웹사이트 페이지를 만들어두는 게 좋음
      가능하면 repo도 self-hosting 하는 게 안전함

  • 나는 Kagi 유료 사용자지만, 최근엔 Kagi도 AI 생성 저품질 결과가 많아져서 실망스러움
    nanoclaw 검색 결과도 Google과 거의 동일했음

    • 나도 비슷한 느낌임
      Kagi의 커스터마이징 기능은 좋지만, 웹 자체가 너무 저품질 정보로 가득해서 결국 어떤 검색엔진이든 한계가 있음

    • 요즘은 어떤 검색엔진도 마음에 들지 않음 :(

    • Kagi에서 nanoclaw를 검색해보니
      1위는 nanoclaw[dot]net,
      2위는 qwibitai의 GitHub 리포지토리(가짜로 보임),
      3위는 광고성 영상,
      4위는 진짜로 보이는 gavrielc의 GitHub,
      5위는 nanoclaw.dev지만 제목이 “Don’t trust AI agents”로 표시됨
      6위는 또 다른 fork였음

  • 여러 검색엔진과 AI를 테스트해본 결과를 정리함
    Google과 Brave는 공식 GitHub → 가짜 도메인 순,
    DuckDuckGo와 Bing은 가짜 도메인 → 공식 GitHub 순,
    Mojeek은 제3자 기사 중심, Qwant는 최악이었음
    반면 ChatGPT, Gemini, Grok 등 AI 검색 모드는 대부분 공식 사이트를 정확히 인식했고, 일부는 가짜 사이트 경고까지 표시함
    결론적으로 AI가 전통 검색보다 훨씬 정확했음

    • 하지만 사용자마다 결과가 다름
      내 Google에서는 .net이 1위, GitHub가 2위로 나옴
      ChatGPT 5.2 Auto 모드는 여전히 .net을 공식 사이트로 착각했지만, Thinking 모드와 Claude는 올바르게 .dev를 우선으로 보여줌

    • AltPower Search도 같은 문제를 보였음
      nanoclaw.dev가 아직 새 도메인이라 인덱싱이 덜 된 듯함
      AltPower, Archive, Cloudflare Radar 참고

    • 어떤 프롬프트로 AI를 테스트했는지 궁금함

  • 상단 댓글의 구조화 데이터 조언이 핵심임
    나도 Organization과 SoftwareApplication schema를 추가했더니 Google이 사이트를 완전히 다르게 인식하기 시작했음
    문제는 Google이 이미 모든 신호를 갖고 있음에도 여전히 도메인 나이와 백링크 수를 더 중시한다는 점임
    결국 시스템은 진짜 제작자보다 먼저 도메인을 선점한 사람을 보상함

    • 이 댓글이 너무 자연스러워서 내 사이트 SEO에 참고하려 했는데, 읽다 보니 LLM이 쓴 글 같아서 혼란스러웠음
      누가 진짜 사람인지 확인 가능한지 궁금함
  • 오늘 nanoclaw를 검색하다가 또 다른 가짜 사이트 nanoclawS.io를 발견했음
    이메일을 수집하고 있어서 위험함
    이런 경우 Google 순위보다 사이트 자체를 호스팅 차원에서 차단하는 게 낫다고 봄
    DMCA 요청을 걸 수 있는 저작권 요소가 있다면 시도해볼 만함

    • 기사에 따르면 이미 Google, Cloudflare, registrar spaceship.com에 takedown 요청을 제출했다고 함
  • 모든 오픈소스 개발자에게 조언하자면, 프로젝트를 공개하면 남용될 가능성을 항상 염두에 둬야 함
    세상이 그런 식으로 돌아감
    오픈소스는 고맙지만, 먼저 자신을 보호하는 게 중요함

    • 특히 MIT 라이선스라면, Amazon 같은 대기업이 포크해서 수익을 내도 당신은 한 푼도 못 받을 수 있음
      자선 코딩과는 다른 차원의 문제임

    • 관련된 법칙으로 Hyrum’s Law가 있음
      “API 사용자가 충분히 많아지면, 시스템의 모든 동작은 누군가에게 의존 대상이 된다”는 내용임

  • SEO에서 지는 건 주식시장에서 돈을 잃는 것과 비슷함
    시스템은 너무 효율적이고 냉정해서 개인의 불만에는 전혀 반응하지 않음
    결국 전략을 재정비하고 시장을 이해하는 방향으로 접근해야 함

  • @Gavriel에게 제안하자면, NanoClaw 상표 등록을 고려해볼 만함
    등록 또는 출원만으로도 도메인 등록자나 Cloudflare, Google에 대한 법적 대응력이 커짐
    UDRP 분쟁에서 상대방의 악의적 등록을 입증하기 쉬워짐

  • Claw 트렌드에 올라타는 게 유행이었는데, 이제는 누군가가 당신의 이름을 이용해 올라타는 상황이 된 셈임

    • 원래 Claw 프로젝트도 다른 제품의 인기에 편승했다가 이름을 바꿨다는 걸 생각하면 아이러니함

    • 나도 같은 생각이었음
      이건 “정직한 사이트가 사기꾼에게 피해를 입은 사건”이라기보다, 관심 경쟁의 무한 게임 속에서 길을 잃은 사례로 보임