Google, 웹에 전쟁을 선포하다

(tante.cc)

12P by GN⁺ 2달전 | ★ favorite | 댓글 1개

Google Search는 링크로 사용자를 보내던 방식에서 처리된 답변 중심으로 이동하며, 웹 위에 통제 가능한 새 계층을 만들고 있음
AI Overviews는 약 10%의 경우 틀린 답변을 낸다는 분석이 있고, Search는 정보 출처로 가는 링크 제공을 상당 부분 내려놓고 있음
“AI”와 “agentic” 포장 뒤의 핵심은 정보를 탈맥락화하고 출처를 제거한 뒤 LLM 응답으로 대체하는 방식임
웹사이트와 창작물은 공유되는 문화적 산물보다 Google의 합성 텍스트 압출기를 위한 무급 원재료에 가까워짐
대응책은 De-googlifying, Chrome 회피, 대체 검색엔진 사용이며, 그렇지 않으면 Google이 관련 있다고 판단한 정보만 보게 될 수 있음

Google Search가 웹 위에 만드는 새 추상화 계층

Google I/O 키노트는 웹의 남은 부분을 향한 공격으로 읽힐 수 있으며, Google의 설명은 Search를 링크 제공보다 처리된 답변 중심으로 더 밀어붙이는 방향을 담고 있음
현재 Search의 AI snippets인 AI Overviews는 약 10%의 경우 틀린 답변을 낸다는 분석이 있으며, Google은 정보 출처로 가는 링크를 제공하던 기존 패러다임을 상당 부분 포기하고 있음
“AI”, “agentic” 같은 포장 뒤의 핵심은 정보를 탈맥락화하고 출처 링크를 제거한 뒤 LLM 생성 응답을 내놓는 방식임
Google은 웹사이트와 창작물을 사용자가 직접 방문하고 공유하는 대상으로 두기보다, Google 표면 뒤에 숨기는 방향으로 웹 위에 통제 가능한 새 추상화 계층을 만들고 있음

창작물은 문화적 산물이 아니라 원재료가 됨

웹사이트, 글, 예술은 여전히 어느 정도 중요하지만, 그 가치는 Google의 합성 텍스트 압출기를 위한 무급 원재료로서의 가치에 가까워짐
창작자는 무료로 작업하고, Google은 정보 흐름을 더 강하게 통제하며 사람들이 받는 응답을 Google이 원하는 방향에 맞출 수 있음
창작물은 다른 사람과 공유할 수 있는 중요한 문화적 산물이 아니라, Google이 처리해 재조합하는 입력값으로 밀려남

참여형 웹에 반하는 변화

이 변화는 참여형 웹을 향한 혁명이 아니라, 참여형 웹과 사용자 자신에 반하는 반혁명으로 규정됨
목표는 웹을 빼앗고 사람들을 Google이 통제·조정하는 웹 위의 추상화 계층으로 유도하는 데 있음
이는 정보 접근을 독점하는 문제이며, 열린 표준과 각자가 필요와 욕망에 맞춰 웹의 한 구석을 만들 수 있는 능력에서 벗어난 진짜 Metaverse로 묘사됨
Google의 웹 표준 영향력이 강하기 때문에, 이런 방향은 웹을 구축하는 기술적 지형의 표준 형태까지 바꿀 수 있음

“안전한 웹”이라는 이름의 통제 가능성

다음 단계에서는 Google이나 같은 영역의 다른 회사들이 기존 웹을 더럽고, 통제되지 않고, 위험하고, 나쁜 것으로 표시하는 새로운 폄하 용어를 만들고 배포할 수 있음
이런 명명은 “Dark Web”과 유사하게 작동하며, Google의 추상화된 표면을 안전한 웹으로 자리 잡게 만들 수 있음

대응: Google 의존 줄이기

웹과 사람들이 단순한 수동 소비자를 넘어 웹에 참여할 수 있는 능력을 중요하게 여긴다면, 이 변화를 심각하게 받아들여야 함
정신적 장치에서 Google을 제거하는 De-googlifying이 더 긴급해짐
다른 검색엔진을 찾고, Chrome 브라우저를 쓰지 않는 선택이 제안됨
그렇지 않으면 정보 접근이 Google의 합성 텍스트 압출기가 관련 있다고 판단하는 것에 제한되는, 슬롭화된 AOL 같은 환경에서 깨어날 수 있음

GeekNews Weekly에 포함된 글입니다. 에디터 코멘트 보기

GN⁺ 2달전 [-]

Hacker News 의견들

AI가 이제는 “예술·코드·음악·글쓰기를 만들고 싶으면 자기 만족으로는 해도 되지만, 더는 돈을 벌 수는 없다”는 단계까지 온 느낌임
콘텐츠로 돈을 버는 건 대기업만 가능하고, 뭔가 창작물을 공개하면 결국 기계에 다시 먹여져 계속 복제될 뿐임
- “돈 찍는 기계는 뭘 먹고 그걸 배설하나? 젊음, 즉흥성, 삶, 아름다움, 무엇보다 창의성을 먹는다. 품질을 먹고 수량을 배설한다.” - William S. Burroughs
- 음악을 직업으로 만들면서 IT에서도 일하다 보니, 생성형 AI가 전개되는 모습과 그 주변 문화가 갈라지는 걸 보는 게 꽤 흥미로움
  세상이 거의 두 “사회”로 나뉘는 것 같음: AI + 대기업 + 매우 빠른 혁신과 파괴를 좋아하는 쪽, 수공예적 작업 + 소규모 사업 + 느리지만 더 지속 가능한 혁신을 좋아하는 쪽
  개인적으로는 두 번째 사회에서 살고 싶지만, 둘 다 각자의 방식으로 계속 존재하고 발전할 수 있다고 봄
  물론 서로 다른 사회는 결국 상호작용하고 영향을 주게 마련임
- 예술가와 기업이 모두 돈을 벌려고 하지만, AI가 경쟁 지형을 기업 쪽에 유리하게 기울인 것에 가까울 수도 있음
  호텔 쪽에서 비슷한 효과를 봤음. 호텔, booking.com, Google 모두 돈을 벌고 싶어 하지만, 고객은 보통 “어디 호텔”을 Google에 검색하고, Google은 그 검색어에 광고를 팔아 최고 입찰자가 대부분의 이익을 가져가게 만듦
- 이 구조는 뒤집어야 함
  다른 사람들의 노력에서 나온 과도한 기술 기업 이익에 세금을 매기고, 그 돈으로 살아 있는 예술가들을 지원해야 함
  예전에 불법 복제 보전을 위해 공테이프에 부과금을 매기던 것과 어렴풋이 비슷함. 다만 돈은 레이블이나 출판사가 아니라 실제 예술가에게 직접 가야 함
- 적어도 미술에서는, 진짜 미술을 즐기는 사람이 AI가 만든 그림을 벽에 걸어두는 일은 별로 없을 것 같음
  그런 “고객”이라면 모나리자 포스터를 액자에 넣어 거는 것과 다르지 않음
  예술가가 위협받는다기보다, AI 때문에 오리지널 작품이 더 귀하고 즐거워질 수도 있음
이를 막으려고 한두 달 전쯤 내 Amazon Redshift 연구 웹사이트 대부분을 기본 인증 사용자명/비밀번호 뒤에 넣었음
여전히 모두 무료지만, 사용자명과 비밀번호를 받으려면 내게 이메일을 보내야 함
시간을 들여 콘텐츠를 만들었는데 OpenAI 같은 회사들이 그걸 복사해 LLM을 통해 팔고, 그 결과 아무도 내 사이트에 오지 않는다면 내가 그 콘텐츠를 만들 이유가 없어짐. 그러면 OpenAI가 가져갈 것도, 다른 사람이 읽을 것도 사라지고 모두가 손해를 봄
이건 기생적이고, 겉보기에는 숙주를 죽이는 행위처럼 보임. 사실상 사유재산 개념의 폐기처럼 느껴짐
AI 회사들은 내 동의 없이 내가 만든 것을 가져가 이익을 위해 팔 수 있고, 그 이익은 원래 내 노력의 대가로 상당 부분 내게 오던 것으로 보임
AI 회사들에게 내 콘텐츠를 제거하라고 표시하는 방법을 찾아봤지만, 제공된 방식은 명목상 장치에 불과하고 부담을 내게 떠넘김. 게다가 실제로 제거됐는지 알 수도 없음. “프롬프트로 당신 콘텐츠가 나온다는 걸 보여주면, 그 콘텐츠가 나오지 않도록 조치를 시도하겠다”는 식임
사용자명/비밀번호 장벽을 세운 결과 Google이 사이트 순위를 크게 낮췄고, 이제 검색에서 거의 발견되지 않는다고 봄
- 사용자명/비밀번호를 이메일로 받아야 한다면 신규 사용자에게 마찰이 생기고, 발견 가능성도 낮아지며, 콘텐츠에 접근하려는 사람에게 추가적인 개인정보 우려도 생김
  AI 회사들에게 콘텐츠 제거 의사를 표시하려는 것도, 원본 출처에 대한 기여 표시와 링크를 제공하는 곳까지 포함하는 건지 궁금함. 예를 들어 Perplexity는 그 부분을 꽤 잘함
  로그인 없이는 콘텐츠 접근을 막는다면 검색 엔진 색인도 막는 것이므로, Google에서 순위가 내려가는 건 당연함
  최종 목표가 무엇인지 조금 헷갈림. 웹에 무료로 콘텐츠를 올리는 상황에서, AI 색인을 막아 얻는 게 무엇인지 모르겠음. 특히 AI든 전통 검색이든 실제 사용자까지 막고 있다면 더더욱 그럼
  AI 도구가 내 콘텐츠를 소화한 뒤 사이트와 연결하지 않고 사용자에게 반복해 보여주는 데서 오는 좌절감은 이해함. 하지만 AI와 무관하게 사람들은 늘 그런 일을 해왔음. 글을 읽고 사실을 배우거나 새로운 생각을 이해한 뒤, 그 정보의 출처를 반드시 인정하거나 기억하지 않은 채 자기 작업에 녹여 냄
  AI가 그 과정을 가속하고 더 눈에 띄게 만들었기 때문에 좌절감의 이유는 알겠지만, 내 작업의 하류에서 일어나는 모든 일이 항상 나에게 귀속될 것이라는 기대 자체가 애초에 합리적이지 않았을 수 있음
- 맞음. 이건 권력의 대규모 이동이고, 모두 중앙집중화되고 있음
  말한 것처럼 그들도 좋은 데이터가 필요하다는 걸 아니까, 실제로 어떤 균형점을 찾으려 할 수도 있음
  그렇지 않다면 LLM에 먹일 새로운 가치 있는 콘텐츠를 AI 연구소가 내부에서 직접 만들게 될 수도 있음. 미친 소리처럼 들리지만 Netflix도 자체 콘텐츠를 만듦
  AI 연구소들은 너무 커져서 단순히 LLM 추론을 제공하는 것 이상의 역할을 맡게 될 것 같음. 현재의 많은 국민국가 정부만큼, 혹은 그보다 더 강력해질 수도 있음
- 최근 많은 레시피 웹사이트도 같은 방식으로 바뀌는 걸 봤음. 큰 사이트들도 이제 모두 계정을 요구함
- 사용자명과 비밀번호를 요청하는 이메일이 인간에게서 온 것인지 어떻게 확신할 수 있을까?
- 어두운 숲에 온 걸 환영함
여기서의 최종 국면을 이해하기 어려움. 웹사이트들은 트래픽을 받는 대가로 Google이 콘텐츠를 크롤링하게 해줬음
Google이 그걸 완전히 끊어버린다면, 웹사이트들이 Google 크롤러를 차단하지 않을 유인이 뭐가 남는지 모르겠음
Google이 직접 답변을 제공하는 다른 AI 제품들에서 실존적 위협을 느끼는 건 이해하지만, 웹과의 공생 관계도 이해하고 있어야 함
- 최종 국면은 소비자가 더 이상 Google을 떠나지 않고, 그들에게는 웹이 Google과 동의어가 되는 것임
  어떤 무작위 웹사이트에서 쇼핑하겠나, Gemini가 대신 사줄 수 있는데? Wikipedia에서 정보를 찾을 이유가 있나… 무슨 말인지 알 것임
  앞으로 몇 년은 웹에 결정적일 것 같음. Facebook도 앱이 힘을 얻었을 때 비슷한 전략을 시도했지만 결국 실패했음. Google도 실패하길 바람
- 정말 이해가 안 되는 건 다음 세대 학습 자료가 어디서 나오느냐임
  웹사이트가 더 이상 게시되지 않거나 크롤링되지 않는다면, 기계는 계속 무엇을 먹고 굴러갈 수 있을까
- 내가 일하는 곳의 임원들은 우리가 계속 글을 쓰고, LLM이 그걸 긁어가며, 그 결과가 각자의 Google/ChatGPT 같은 것에서 사람들이 보는 내용에 영향을 준다고 보는 듯함
  그러니 그들 머릿속에서는 바뀌는 게 없고, 독자가 인간이 아니라 봇일 뿐임. 글 쓰는 입장에서는 끔찍함
- 장기적인 결과보다 권력을 가진 사람들의 단기 이익이 더 중요하게 취급됨
- 웹은 중국처럼, 담장 친 정원들의 집합이 될 것임
우리는 오래전에 웹사이트로 트래픽을 보내는 일을 Google에 맡겨버렸음
주로 Google이 너무 잘했기 때문에 대안들이 훨씬 덜 유용해졌기 때문임
이제 Google이 말하자면 “자체 완결형”이 되는 데 집중하고 있으니, 웹사이트로 트래픽을 보내는 더 나은 방식을 찾아야 함. 이상적으로는 단일 기업의 통제 아래 있지 않은 방식이어야 함
StumbleUpon 그리운 사람 있음?
- 탈중앙 검색이 없다는 게 이상하게 느껴짐
  문제의 성격상 그럴 가능성이 크다는 건 알지만, 예전에는 말도 안 되게 부적합한 탈중앙식 헛소리들도 많이 나왔었음
- 데스크톱과 모바일 브라우저에서 매끄럽게 작동하는 방식으로 웹사이트 목록을 교환하고, 저장하고, 내보낼 수 있는 개방형 방법이 있으면 꽤 괜찮을 듯함
- 이런 변화가 reddit 같은 사이트에 더 많은 힘이나 가치를 줄까?
  잘 정리된 링크 모음 사이트는 새로운 웹사이트를 찾는 데 훨씬 유용함
- 구식 마케팅도 있음. 들리려면 자기 청중을 직접 찾아가야 함
웹사이트 운영자로서 조회수는 크게 늘어난 걸 직접 봤지만, AI 요약이 틀렸는데 내 사이트가 출처로 붙어 있는 걸 보면 정말 타격이 큼
모든 것에 AI를 밀어붙이는 흐름은 결국 세상의 숙련도를 낮출 것 같고, 막을 방법도 없어 보여 걱정됨
- “세상의 숙련도를 낮춘다”는 말이 와닿음
  오늘 개발자에게 우리 제품이 어떤 상황을 어떻게 처리하도록 프로그래밍되어 있는지 물었더니, 그가 이제 쓰기 시작한 내부 AI 비서의 요약만 보내줬음
  예전에는 정말 좋고 사려 깊은 답을 줬는데, 이제는 그냥 AI 답변 복사/붙여넣기임
정작 자기들이 긁히는 건 반대하는 듯함: https://serpapi.com/blog/google-v-serpapi-motion-to-dismiss-...
웹이 애초에 이렇게 썩어 있지 않았다면 더 슬펐을 것 같음
평균적으로 아무 사이트나 들어가면 광고를 던지고 구독하라고 괴롭히려는 곳일 뿐임
- “뉴스레터를 구독하세요” 모달을 특히 경멸함. 웹페이지를 본 지 총 3초도 안 됐을 때 뜨면 더더욱 그럼
  그런 모달이 왜 팝업으로 간주되지 않는지 이해가 안 됨
- 썩은 정도는 더 깊고, 광고만의 문제가 아님
  검색 엔진의 유인 구조가 좋은 콘텐츠보다 최신 콘텐츠를 선호하는 쪽으로 되어 있어서, 모든 웹사이트가 계속 생성된 쓰레기처럼 느껴지는 것을 쏟아냄
  이제는 검색 결과에 최근 2년 안의 타임스탬프가 있으면 쓰레기라고 판단하고 클릭하지 않게 됨
  답은 아마 Kagi로 가는 것일 수 있음. 거기서는 내가 상품이 아니라 고객임
  솔직히 모든 웹사이트가 그런 건 아니고, 아직 좋은 곳도 있음. 하지만 검색 엔진은 절대 그런 곳으로 안내하지 않음. 하루 종일 오물만 보여줌
- 물론 그런 상태를 만드는 데 Google은 전혀 아무 관련이 없었겠지
- 그 썩음은 Google이 돈을 전부 벌어들인 광고 경제의 직접적인 결과임
  Google이 안 했더라도 누군가 했을 수는 있지만, 실제로 한 건 Google이고, 우리가 모두 마시는 우물을 오염시켰음
- 어떤 무기력한 Google 뉴스 팬 블로그에서 I/O 소식을 읽으려 했음
  글 중간쯤 갔더니 거대한 배너 광고 3개가 위, 오른쪽, 아래를 차지해 본문보다 더 많은 공간을 먹고 있었고, 오른쪽 아래에는 자동 재생 동영상 광고가 떠다니며 배너 광고 하나 대부분을 가리고 있었음
  본문 중간의 “동적” 광고는 갑자기 커졌다 줄었다 하며 버벅여서 실제로 아무것도 읽을 수 없게 만들었음
  이 정도가 현대 블로그 비슷한 것들을 읽을 때 비교적 나은 경험 중 하나임. 거의 수상한 포르노 사이트 수준에 가까워졌음
  슬프고 한심함
이런 선언은 내게 별로 말이 안 되는 경우가 많음. 내가 보는 문제 모델과 맞지 않기 때문임
나는 블로그를 쓰는 사람, 지금 말로는 “콘텐츠 생산자”이면서 동시에 사용자이기도 함
사용자로서는 내 브라우저 사용자 에이전트가 나를 대신해 웹페이지를 표시하길 원하고, 검색 에이전트가 여러 출처에서 정보를 추출해 적절한 출처 표시와 함께 종합해 주길 원함
내 콘텐츠 생산이 취미라서 플랫폼에 중개되는 것에 무심할 수 있다는 반론은 가능함. 어느 정도 사실임. 이걸 생계로 삼았다면, 내 생계를 해치는 행위가 “웹”에 대한 전쟁이라고 결론낼 수도 있음
다만 중립적인 관찰자라면, 그것이 전쟁이라 해도 수익·명성·보상 목적의 콘텐츠 창작이라는 나의 웹 참여 방식에 대한 전쟁이라고 봐야 함
사용자로서는 각 웹사이트와 제작자에게 사실 큰 관심이 없음. 그 안의 정보는 유용하지만, 사이트들의 이질성은 대체로 정보 접근의 장애물임
검색과 요약 에이전트가 이 웹사이트들이 말하는 바를 정확히 종합해 내 현실 모델을 더 정확하게 해준다면 훨씬 만족스러움
그래서 Google의 변화가 정확한 콘텐츠가 만들어질 가능성을 낮추고, 내가 더 자주 오도될 것이라는 주장에는 설득될 수 있음. 하지만 이건 도구이고, 내 세계 모델은 현실에 의해 자주 검증될 것임
검색·종합 기계가 유용한 결과를 내지 못하면 알게 될 것이고, 치명적인 결과가 나지 않도록 그 지식을 대하는 방식을 조정해야 함. 하지만 이미 지금도 마찬가지임
Google 검색 결과가 내 의견을 바꾸도록 조정된 심어진 결과가 아니라고 알 수 없고, Google이 Internet Archive와 결탁해 만들어낸 합의가 진짜처럼 보이게 하지 않는다고도 알 수 없음
사용자로서 이미 많은 결정을 내려야 하고, 검색 결과를 힘들게 읽으며 직접 종합하는 것은 에이전트를 쓰는 것보다 훨씬 덜 유용함
그래서 웹에 대한 전쟁이 있다면, 나는 기꺼이 그 전쟁에 참여하겠음. 웹에 반대하는 쪽으로
- 검색과 요약 에이전트가 웹사이트들이 말하는 바를 정확히 종합해 주면 좋다는 데 동의하지만, 내 목적은 오직 전체 페이지를 읽을지 결정하는 것뿐임
  줄거리 요약이 어떤 영화를 볼지 결정하는 데 도움은 되지만, 실제로 영화를 보는 것의 대체물이 아닌 것과 같음
  “50 usd in eur”나 “current weather in Paris” 같은 검색에 AI가 답을 주는 건 괜찮음. 그보다 복잡한 것은 실제 출처 링크를 받는 편을 훨씬 선호함
- 웹에 반대하는 편에 선다는 말에는 동의할 수밖에 없음
  낙관적인 부분은 이것이 “웹”이 이미 오래전부터 가던 방향, 즉 사용자가 정직하고 효율적으로 올바른 정보를 얻고 주의력 예산과 선택권을 보존하는 것을 방해하던 방향을 더 밀어붙이는 움직임으로 보인다는 점임
  지금까지는 금전적 유인을 위해 소음을 늘리는 방식이었고, 이제는 금전적 유인을 위해 소음을 잘라내는 방식임
  낙관적인 이유는, 지금까지는 단일한 적이 없어서 어느 정도 흩어진 시스템과 싸우기 어려웠지만, 이제 Google이 상황을 더 나쁘게 밀어붙이며 자신들과 소수의 다른 기업을 명확한 표적으로 만들고 있기 때문임
  이게 더 많은 사람들에게 인내의 한계를 넘기게 해서, Google과 광고 네트워크가 바꿔놓기 전의 “옛 웹” 쪽으로 되돌리거나, 서로와 콘텐츠를 더 자유롭게 접하는 새로운 방식을 찾게 만들길 바람
  작거나 쉬운 싸움은 아닐 것임. 상당 부분은 현재 자본주의 상태 자체에 맞서고, 우리의 주의력·비판적 사고·선택권을 되찾는 싸움임
자기들이 데이터를 쓰는 웹사이트 소유자들에게 돈을 내야 함
이제는 이게 나쁜 일인지도 잘 모르겠음
웹이 검색엔진최적화 쓰레기로 너무 넘쳐나서, Google이 떠나며 Usenet식 정화가 일어나는 게 필요할 수도 있음
- 소비자로서는 현재 Google 검색이 사실 꽤 마음에 듦
  AI 기능이 보통 원하는 것을 바로 알려주고, 사실 확인을 하고 싶으면 대개 출처 링크도 달아줌. 전통적인 링크 방식도 작동함
  쓸 수 없다고 말하는 사람들은 보통 실제로 찾지 못한 구체적인 예를 잘 못 듦
  나도 약한 영역은 몇 군데 봤음. 오래되고 모호한 자료는 대부분의 검색 엔진이 한계가 있는 것 같고, 불법 복제 관련 자료는 Yandex를 쓰면 됨

답변달기

Google, 웹에 전쟁을 선포하다

Google Search가 웹 위에 만드는 새 추상화 계층

창작물은 문화적 산물이 아니라 원재료가 됨

참여형 웹에 반하는 변화

“안전한 웹”이라는 이름의 통제 가능성

대응: Google 의존 줄이기

함께 보면 좋은 글 β

댓글과 토론

Hacker News 의견들