Google의 AI 요약에서 내 웹사이트를 제외하는 방법
(teruza.com)- 구글은 검색 결과에 AI 생성 요약(AI Overviews) 을 도입했으며, 이는 종종 사이트 콘텐츠를 끌어와 트래픽을 빼앗는 효과를 내고 있음
- 사이트 운영자는 스니펫 차단(max-snippet:0, nosnippet)이나 부분적 차단(data-nosnippet) 같은 극단적 선택만 가능해 사실상 출구 없는 딜레마에 빠져 있음
- 사용자 측에서는 Search Labs 설정 비활성화, URL 파라미터, 확장 프로그램 등 제한적이고 불완전한 회피책만 존재함
- EU와 영국 규제 당국은 현재 구글 AI Overviews의 반경쟁적 성격과 퍼블리셔 피해를 조사 중이며, 트래픽 공유·공정한 옵트아웃 같은 규제를 고려하고 있음
- 당분간 퍼블리셔가 취할 수 있는 유일한 실질적 대응은 max-snippet:0이지만, 이는 클릭률 저하라는 치명적 단점이 있어 구글의 다크 패턴적 설계라는 비판이 제기됨
구글 AI 요약(AI Overviews) 문제
- 최근 Google은 검색 결과에 AI가 자동으로 생성한 AI 요약(SGE: Search Generative Experience) 를 도입
- 이 기능은 웹사이트의 본문 내용을 분석해 간략하게 요약하여 직접 표시함으로써, 사용자 경험을 향상시키는 것을 목표로 함
- 그러나 이에 따라 많은 웹사이트 오너들은 원본 사이트를 방문하지 않고 요약 콘텐츠만 소비되는 문제에 직면하고 있음
- 이는 결과적으로 웹사이트의 유기적 트래픽(organic traffic) 감소로 이어지고 있음
Google AI 요약의 영향
- AI 요약은 웹사이트 소유자의 동의 없이 콘텐츠를 자동 요약해 검색 상단에 제공함
- 사용자는 요약만 보고 원본 사이트를 클릭하지 않는 경향이 강해짐
- 이에 따라 전통적인 SEO 전략의 효과가 약화되고, 사이트 운영자에게 불리하게 작용함
웹마스터 대응 방법
- 1. max-snippet:0
-
<meta name="robots" content="max-snippet:0">
- 모든 스니펫과 AI 요약을 차단하여 검색 결과에는 제목+URL만 노출
- 이는 클릭률(CTR) 을 크게 낮출 수 있는 단점이 있음
- 현재로서는 가장 효과적인 방법이지만, 완벽한 해결책은 아님
-
- 2. nosnippet
-
<meta name="robots" content="nosnippet">
- max-snippet:0과 동일한 효과로, 검색 결과에서 설명이나 요약이 완전히 제거
- 결과적으로 검색 목록이 단조로워져 매력도가 떨어질 수 있음
- AI 요약을 방지하지만, 검색 가시성 저하로 이어질 가능성
-
- 3. data-nosnippet
-
<span data-nosnippet>…</span>
- 특정 콘텐츠를 선택적으로 제외할 수 있는 방법
- 하지만 구글이 다른 텍스트를 여전히 요약에 사용할 수 있어 완전한 통제 불가능
- HTML 요소(span, div, section)에 적용 가능
-
- 4. 사용자 측 대안 (개인 계정에만 영향)
-
Search Labs 옵트아웃: 로그인한 사용자는 “AI Overviews and more” 를 비활성화 가능
- 이는 사용자 계정에만 적용되며, 웹사이트의 타인 노출 방식에는 영향 없음
- URL 수정자: 검색 쿼리에 &udm=14, -AR, -noai 추가
-
브라우저 확장: Bye Bye Google AI 같은 도구 사용 가능
- 구글 업데이트 시 작동하지 않을 수 있음
-
Reddit 해킹: 비속어를 추가해 AI 요약을 우회하는 방법 제안
- 실용적이지 않은 임시 방편
- iOS에서는 Google 앱에서 Gemini 표시를 끄거나, Web 탭 사용, 또는 Safari, DuckDuckGo 같은 대체 브라우저 활용 가능
-
Search Labs 옵트아웃: 로그인한 사용자는 “AI Overviews and more” 를 비활성화 가능
- 5. 규제적 희망: EU와 UK의 조사
-
EU
- ndependent Publishers Alliance, Movement for an Open Web, Foxglove Legal 등이 EU 집행위에 반독점 제소
- AI Overviews가 콘텐츠 남용, 트래픽 유출, 공정한 옵트아웃 부재를 초래한다고 주장
-
영국
- 경쟁시장청(CMA) 이 AI 요약의 경쟁 억제와 출판사 피해 여부를 조사중
- 의무적 출처 표시, 트래픽 공유, 구글 자체 선호 제한 등을 검토
-
EU
문제의 본질
- 퍼블리셔의 딜레마: 스니펫을 차단하지 않으면 AI가 콘텐츠를 추출해 트래픽 손실 발생, 차단하면 검색 가시성 저하
- 사용자 제어 부족: 대안들은 불편하고 불완전하며 일관성 없음
-
다크 패턴 비판: 구글의 구조적 설계는 퍼블리셔들이 중요한 것을 포기하도록 강요하는 조작적 디자인으로 간주
- 이는 퍼블리셔에게 불리한 선택을 강제하는 전형적인 다크 패
결론
- 규제 당국이 변화를 강제할 때까지, 현재 퍼블리셔의 유일한 선택지는 max-snippet:0이지만, 이는 심각한 노출 손실을 동반
- 웹사이트 소유자는 AI 요약 차단과 가시성 손실 사이에서 불공정한 선택을 해야함
- 구글의 정책은 출구 없는 강제 선택 구조, 즉 전형적인 다크 패턴
- EU와 영국 규제의 향후 결정이 상황을 바꿀 수 있는 유일한 희망이지만, 즉각적인 해결책은 아님
Would you consider this a fair feature—or a classic example of dark pattern engineering? Let us know in the comments.
정말 본문에 댓글을 남기라는 말이 있는데 사이트에는 댓글 기능이 없어 보이네요
AI를 막으려는 글을 AI로 쓴 거라면 참 모순적인 글입니다.
관련해서는 SEO 시대의 끝? AI 에이전트를 위한 마케팅 최적화의 시작 글을 같이 보시면 좋습니다.
SEO 관련 reddit 보면, 구글 노출량은 그대로인데 Zero click 때문에 유입은 많이 줄어서 걱정을 토로하는 글이 많이 올라오긴 하더라고요.
Hacker News 의견
-
지난 수십 년간 모든 분야에 퍼지고 있는 "포털/브로커" 현상임을 느끼고 있음. 소비자와 생산자 사이에 제3자 레이어가 들어서면서 양쪽 모두 편해졌지만, 이제는 이 레이어에 의존해야만 함. 아마존에서 주문할 때 더 이상 직접 판매자와 소통하지 않고, 음식 주문도 식당에 직접 돈을 내지 않음. 웹에서 정보를 찾을 때도 개별 작성자의 스타일, 네비게이션, 광고 등은 더 이상 상대하지 않음. 콘텐츠 소유자 입장에서 보면, 이런 구조는 페이지 방문이 줄어 광고 수입에 타격을 주며, 아마존이나 배달앱과는 달리 구글 요약으로 인한 광고 손실은 보상이 없음. 온라인 콘텐츠의 대부분이 광고로 운영되는 상황에서 구글도 결국 광고 수입이 생명인데, 그럼에도 미래를 위해 어쩔 수 없이 이런 진화를 밀어붙이는 중임. 구글은 미래에 자리를 유지하는 데만 집중하는 것으로 보임
- 사실 이 변화가 양쪽 모두에게 이익이 된다는 표현이 인상적임. 전환 과정에서 한 쪽이 피해를 보는 게 맞지만, 결국 소비자와 플랫폼이 얻는 이득이 크다고 생각함
-
내 소프트웨어 제품 웹사이트의 저작권 자료를 구글이나 다른 AI들이 허락도 없이 긁어가고 재가공하는 게 불만임. 하지만 만약 차단하면, 내 콘텐츠가 그들의 AI 요약에 언급될 확률이 거의 없어짐
- 이런 식으로 차단하면 내 제품이나 회사에 대한 결과에서, AI 요약이 순위 2위의 아닌 정보를 참조하게 될 수 있어서 실제로는 더 나쁠 수 있음. 예를 들어 'PayPal에서 출금하는 방법' 검색에서 2순위 사이트가 'PayPal sucks' 같은 부정적인 도메인일 때, 공식 사이트가 요약에서 제외되면 더 골치 아픔. 결론적으로 퍼블리셔들은 그냥 허용하는 게 나음. 트래픽 감소가 걱정이라면, 요약에 나오는 'source' 링크가 다른 어떤 결과보다 먼저 보임. 허위 정보가 걱정이면 정확성 보고나 콘텐츠 수정으로 해결 가능함. 또 구글이 AI 요약과 스니펫을 별개로 opt-out할 수 있게 해야 하며, AI 요약을 걱정한다면 스니펫도 마찬가지로 신경 쓸 사안임
- 앞으로 구글이 내 경쟁사보다 긍정적으로 묘사해주길 원하면 돈을 내라고 하거나, 억울하게 생성된 허위 정보를 지우고 싶으면 돈 내라는 연락이 올 수도 있다는 불안감 있음
- 직접 뭔가를 판매하는 웹사이트라면 AI 요약에 노출되는 게 오히려 바람직하다고 생각함
-
이런 AI 요약 기능이 구글의 미래 수익을 잠식하지 않는다는 게 이해가 안 됨. 구글은 광고를 통해 사이트로 유입시키는 데서 돈을 버는데, 이런 요약 서비스로 웹사이트 자체를 불필요하게 만들고 있음. 그렇다면 누가 방문자 없는 사이트를 만들겠음
- AI 요약에 제품·서비스 광고를 삽입하는 기술도 이미 구글이 보유하고 있음. 실제 사례로 '휴가' 검색 시 호텔과 항공사가 각자 언급된 예시를 연구에서 설명했음. 이 논문 링크는 여기임
- 수익의 99%는 "buy macbook"이나 "book trip to dc" 같은 구매 의도가 분명한 검색어에 집중되고 있음. 정보성 검색어에서는 광고 수입이 거의 없음
- 실제로 수익을 내는 쿼리는 극소수며, 대부분의 검색어에는 광고 입찰 자체가 없다는 점에서 확인 가능함
- 사실 구글은 ChatGPT와 같은 기술이 자리를 대체할 것을 더 두려워함. 그래서 사용자가 원하는 정보를 즉각적으로 제공해주는 것이 자리를 지키는 최선임. 내 생각에 LLM은 불완전하지만, 모호한 질문이나 정보 통합, 번역 등에서 검색 엔진보다 훨씬 뛰어난 기술임. 특정 페이지를 찾기보다 정보를 얻고 싶을 때 LLM 쪽이 이상향에 가까움. 앞으로 10년 안에 검색 엔진이 사라져도 이상하지 않을 거라고 봄
- 어쩌면 구글도 이런 변화를 억지로 도입했을 것이며, LLM 서비스에 점점 잠식당하는 현실 때문임. 구글이 AI 요약을 광고 위에 올려둔 걸 보면 얼마나 절박한지 느낄 수 있음
-
내 개인 사이트를 아파치 설정으로 인덱스, 스니펫, 번역, 이미지 인덱스 다 차단하도록 했음. 그럼에도 불구하고 Internet Archive만은 무시하고 긁어갔으며, 여러 번 삭제 요청을 해도 절대 들어주지 않음. 지금은 Anubis로 추가적인 스크래핑도 막는 중임. (이 사이트는 2000년에 시작한 공개 일기라서, 검색되지 않길 바라는 것임)
- 인터넷에 공개해놓고 백업되지 않기를 바란다는 게 이해 안 됨. 만약 도메인이 사라져도 언젠가 그걸 다시 보고 싶을 때 Internet Archive에 남아있는 건 오히려 다행임. 인터넷에 올려둔 이상 본질적으로 공개임
- 내 요청을 Internet Archive가 아예 답하지 않는 게 가장 속상함. 불법적인 콘텐츠(명예훼손, 국가기밀, 특정 음란물 등)는 예외로 지울 수 있지만, 스스로 공개한 것이라면 역사 기록에서 삭제를 허용하면 안 된다는 게 일반 원칙임. 내가 진짜 개인정보를 숨기고 싶다면 로그인 뒤에 두었을 것임. 사이트는 여전히 존재하고, 누군가 계속 크롤링함
- 스냅샷에는 'why?'라는 필드가 있음. 실제로는 Internet Archive 외에도 Common Crawl, Archive Team 등이 내 사이트를 푸시했을 수 있음. 이유를 확인해서 대상을 정확하게 파악할 필요가 있음
- robots.txt로 Internet Archive에서 삭제 또는 제외 요청을 해볼 것. 이 정책은 몇 번 바뀌었지만 최근 몇 년 사이에는 다시 robots.txt를 존중하는 중임. FAQ 참고
-
어떤 면에서는 퍼블리시란, 무언가를 공개해서 사람들이 일정 자유를 갖고 활용하도록 하는 것임. 그 자유가 사이트에 도움이 될 수도, 안 될 수도 있음. 구글 같은 대형 플랫폼이 변화할 때마다 콘텐츠 퍼블리셔들은 항상 적응해왔음. AI 요약도 그 변화의 흐름임
- 내 생각에 이건 다소 특권의식적인 시각임. 나는 소프트웨어를 라이선스 조건 하에 퍼블리시한 적이 있음. 그저 공개한다고 해서 모두가 아무 목적으로든 쓸 수 있다는 뜻이 아님
- 나는 내 콘텐츠의 저작권을 보유한 상태로 퍼블리시한다는 전제임. 누군가 상업적으로 재발행하는 자유까지 주겠다는 게 아님. 어쩌면 콘텐츠를 로그인 뒤로 숨기면 되는 미래가 올지도 모르겠는데, 웹의 씁쓸한 미래임
- 1710년 Anne법(최초 저작권 법) 이후, 공개적으로 배포하는 정보에도 규칙이 적용됨
- 나는 내 글을 사람들이 직접 읽기 바라는 마음으로 퍼블리시하는 것이지, 구글이 허술하게 AI 요약하도록 하려는 게 아님. 구글의 결정은 결국 구글에 이익이 돌아가는 방향임
- 퍼블리싱이란, 모든 권리를 다 내어주는 게 아니어야 함. 많은 이들이 자신과 비슷한 독자층을 모으기 위해 글을 씀. 그 사이에 중개자가 끼어들면 오히려 독자와 저자의 연결이 손상됨. 요약하고 싶다면 내가 원하는 방식으로 할 수 있지만, 대부분의 작가는 LLM 요약을 원하지 않음. 또 LLM은 편향이 많고, 정작 중요한 문단을 자체 필터로 삭제하는 등 엉뚱하게 요약될 수 있음. 내 의견이 왜곡된 약화 버전으로 전달되는 것만큼 아이디어에 치명적인 건 없음
-
이 블로그 글, 마지막 문장에 '댓글을 남겨달라'고 되어 있는데, 실제 댓글 영역이 안 보여서 혹시 AI로 생성된 게 아닌지 궁금함
-
Perplexity, OpenAI, Claude 등에서도 이 기능이 동작하는지 궁금함
-
Google은 Perplexity처럼 출처를 명확하게 인용해주면 모두에게 좋은 결과라고 생각함. 원본에 링크와 크레딧도 주고 UX도 향상될 텐데 아쉬움
- 구글도 인용을 하긴 하지만, 너무 눈에 안 띄게 ‘링크’ 모양의 1글자짜리 유니코드 기호로 표시함. 클릭해도 직접 소스 페이지로 가는 게 아니라, 옆 패널이 열리고, 그 안에 여러 소스가 들어있는 경우가 많음. 기술적으로는 이 인용이 결과 페이지 내 첫 번째 링크지만, 실제로 내 페이지로 가려면 2번 클릭해야 함. 인용을 더 눈에 띄게, 페이지 타이틀을 앵커 텍스트로 삼아 바로가기 링크로 제공하면 좋겠음. 인용이 여러 개면 옆 패널을 처음부터 열어놓거나, 모두 메인 페이지에 드러나게 노출하면 좋겠음
-
앞으로 내 전문 분야가 기업 웹사이트를 LLM이 잘 요약하도록 만드는 방법임. 이런 상세한 충실한 안내 콘텐츠가 필요함
-
이 글의 제목과 도메인을 붙여넣었더니 결과가 다르게 나옴. 참조 이미지