지난 수십 년간 모든 분야에 퍼지고 있는 "포털/브로커" 현상임을 느끼고 있음. 소비자와 생산자 사이에 제3자 레이어가 들어서면서 양쪽 모두 편해졌지만, 이제는 이 레이어에 의존해야만 함. 아마존에서 주문할 때 더 이상 직접 판매자와 소통하지 않고, 음식 주문도 식당에 직접 돈을 내지 않음. 웹에서 정보를 찾을 때도 개별 작성자의 스타일, 네비게이션, 광고 등은 더 이상 상대하지 않음. 콘텐츠 소유자 입장에서 보면, 이런 구조는 페이지 방문이 줄어 광고 수입에 타격을 주며, 아마존이나 배달앱과는 달리 구글 요약으로 인한 광고 손실은 보상이 없음. 온라인 콘텐츠의 대부분이 광고로 운영되는 상황에서 구글도 결국 광고 수입이 생명인데, 그럼에도 미래를 위해 어쩔 수 없이 이런 진화를 밀어붙이는 중임. 구글은 미래에 자리를 유지하는 데만 집중하는 것으로 보임
사실 이 변화가 양쪽 모두에게 이익이 된다는 표현이 인상적임. 전환 과정에서 한 쪽이 피해를 보는 게 맞지만, 결국 소비자와 플랫폼이 얻는 이득이 크다고 생각함
내 소프트웨어 제품 웹사이트의 저작권 자료를 구글이나 다른 AI들이 허락도 없이 긁어가고 재가공하는 게 불만임. 하지만 만약 차단하면, 내 콘텐츠가 그들의 AI 요약에 언급될 확률이 거의 없어짐
이런 식으로 차단하면 내 제품이나 회사에 대한 결과에서, AI 요약이 순위 2위의 아닌 정보를 참조하게 될 수 있어서 실제로는 더 나쁠 수 있음. 예를 들어 'PayPal에서 출금하는 방법' 검색에서 2순위 사이트가 'PayPal sucks' 같은 부정적인 도메인일 때, 공식 사이트가 요약에서 제외되면 더 골치 아픔. 결론적으로 퍼블리셔들은 그냥 허용하는 게 나음. 트래픽 감소가 걱정이라면, 요약에 나오는 'source' 링크가 다른 어떤 결과보다 먼저 보임. 허위 정보가 걱정이면 정확성 보고나 콘텐츠 수정으로 해결 가능함. 또 구글이 AI 요약과 스니펫을 별개로 opt-out할 수 있게 해야 하며, AI 요약을 걱정한다면 스니펫도 마찬가지로 신경 쓸 사안임
앞으로 구글이 내 경쟁사보다 긍정적으로 묘사해주길 원하면 돈을 내라고 하거나, 억울하게 생성된 허위 정보를 지우고 싶으면 돈 내라는 연락이 올 수도 있다는 불안감 있음
직접 뭔가를 판매하는 웹사이트라면 AI 요약에 노출되는 게 오히려 바람직하다고 생각함
이런 AI 요약 기능이 구글의 미래 수익을 잠식하지 않는다는 게 이해가 안 됨. 구글은 광고를 통해 사이트로 유입시키는 데서 돈을 버는데, 이런 요약 서비스로 웹사이트 자체를 불필요하게 만들고 있음. 그렇다면 누가 방문자 없는 사이트를 만들겠음
AI 요약에 제품·서비스 광고를 삽입하는 기술도 이미 구글이 보유하고 있음. 실제 사례로 '휴가' 검색 시 호텔과 항공사가 각자 언급된 예시를 연구에서 설명했음. 이 논문 링크는 여기임
수익의 99%는 "buy macbook"이나 "book trip to dc" 같은 구매 의도가 분명한 검색어에 집중되고 있음. 정보성 검색어에서는 광고 수입이 거의 없음
실제로 수익을 내는 쿼리는 극소수며, 대부분의 검색어에는 광고 입찰 자체가 없다는 점에서 확인 가능함
사실 구글은 ChatGPT와 같은 기술이 자리를 대체할 것을 더 두려워함. 그래서 사용자가 원하는 정보를 즉각적으로 제공해주는 것이 자리를 지키는 최선임. 내 생각에 LLM은 불완전하지만, 모호한 질문이나 정보 통합, 번역 등에서 검색 엔진보다 훨씬 뛰어난 기술임. 특정 페이지를 찾기보다 정보를 얻고 싶을 때 LLM 쪽이 이상향에 가까움. 앞으로 10년 안에 검색 엔진이 사라져도 이상하지 않을 거라고 봄
어쩌면 구글도 이런 변화를 억지로 도입했을 것이며, LLM 서비스에 점점 잠식당하는 현실 때문임. 구글이 AI 요약을 광고 위에 올려둔 걸 보면 얼마나 절박한지 느낄 수 있음
내 개인 사이트를 아파치 설정으로 인덱스, 스니펫, 번역, 이미지 인덱스 다 차단하도록 했음. 그럼에도 불구하고 Internet Archive만은 무시하고 긁어갔으며, 여러 번 삭제 요청을 해도 절대 들어주지 않음. 지금은 Anubis로 추가적인 스크래핑도 막는 중임. (이 사이트는 2000년에 시작한 공개 일기라서, 검색되지 않길 바라는 것임)
인터넷에 공개해놓고 백업되지 않기를 바란다는 게 이해 안 됨. 만약 도메인이 사라져도 언젠가 그걸 다시 보고 싶을 때 Internet Archive에 남아있는 건 오히려 다행임. 인터넷에 올려둔 이상 본질적으로 공개임
내 요청을 Internet Archive가 아예 답하지 않는 게 가장 속상함. 불법적인 콘텐츠(명예훼손, 국가기밀, 특정 음란물 등)는 예외로 지울 수 있지만, 스스로 공개한 것이라면 역사 기록에서 삭제를 허용하면 안 된다는 게 일반 원칙임. 내가 진짜 개인정보를 숨기고 싶다면 로그인 뒤에 두었을 것임. 사이트는 여전히 존재하고, 누군가 계속 크롤링함
스냅샷에는 'why?'라는 필드가 있음. 실제로는 Internet Archive 외에도 Common Crawl, Archive Team 등이 내 사이트를 푸시했을 수 있음. 이유를 확인해서 대상을 정확하게 파악할 필요가 있음
robots.txt로 Internet Archive에서 삭제 또는 제외 요청을 해볼 것. 이 정책은 몇 번 바뀌었지만 최근 몇 년 사이에는 다시 robots.txt를 존중하는 중임. FAQ 참고
어떤 면에서는 퍼블리시란, 무언가를 공개해서 사람들이 일정 자유를 갖고 활용하도록 하는 것임. 그 자유가 사이트에 도움이 될 수도, 안 될 수도 있음. 구글 같은 대형 플랫폼이 변화할 때마다 콘텐츠 퍼블리셔들은 항상 적응해왔음. AI 요약도 그 변화의 흐름임
내 생각에 이건 다소 특권의식적인 시각임. 나는 소프트웨어를 라이선스 조건 하에 퍼블리시한 적이 있음. 그저 공개한다고 해서 모두가 아무 목적으로든 쓸 수 있다는 뜻이 아님
나는 내 콘텐츠의 저작권을 보유한 상태로 퍼블리시한다는 전제임. 누군가 상업적으로 재발행하는 자유까지 주겠다는 게 아님. 어쩌면 콘텐츠를 로그인 뒤로 숨기면 되는 미래가 올지도 모르겠는데, 웹의 씁쓸한 미래임
1710년 Anne법(최초 저작권 법) 이후, 공개적으로 배포하는 정보에도 규칙이 적용됨
나는 내 글을 사람들이 직접 읽기 바라는 마음으로 퍼블리시하는 것이지, 구글이 허술하게 AI 요약하도록 하려는 게 아님. 구글의 결정은 결국 구글에 이익이 돌아가는 방향임
퍼블리싱이란, 모든 권리를 다 내어주는 게 아니어야 함. 많은 이들이 자신과 비슷한 독자층을 모으기 위해 글을 씀. 그 사이에 중개자가 끼어들면 오히려 독자와 저자의 연결이 손상됨. 요약하고 싶다면 내가 원하는 방식으로 할 수 있지만, 대부분의 작가는 LLM 요약을 원하지 않음. 또 LLM은 편향이 많고, 정작 중요한 문단을 자체 필터로 삭제하는 등 엉뚱하게 요약될 수 있음. 내 의견이 왜곡된 약화 버전으로 전달되는 것만큼 아이디어에 치명적인 건 없음
이 블로그 글, 마지막 문장에 '댓글을 남겨달라'고 되어 있는데, 실제 댓글 영역이 안 보여서 혹시 AI로 생성된 게 아닌지 궁금함
Perplexity, OpenAI, Claude 등에서도 이 기능이 동작하는지 궁금함
Google은 Perplexity처럼 출처를 명확하게 인용해주면 모두에게 좋은 결과라고 생각함. 원본에 링크와 크레딧도 주고 UX도 향상될 텐데 아쉬움
구글도 인용을 하긴 하지만, 너무 눈에 안 띄게 ‘링크’ 모양의 1글자짜리 유니코드 기호로 표시함. 클릭해도 직접 소스 페이지로 가는 게 아니라, 옆 패널이 열리고, 그 안에 여러 소스가 들어있는 경우가 많음. 기술적으로는 이 인용이 결과 페이지 내 첫 번째 링크지만, 실제로 내 페이지로 가려면 2번 클릭해야 함. 인용을 더 눈에 띄게, 페이지 타이틀을 앵커 텍스트로 삼아 바로가기 링크로 제공하면 좋겠음. 인용이 여러 개면 옆 패널을 처음부터 열어놓거나, 모두 메인 페이지에 드러나게 노출하면 좋겠음
앞으로 내 전문 분야가 기업 웹사이트를 LLM이 잘 요약하도록 만드는 방법임. 이런 상세한 충실한 안내 콘텐츠가 필요함
Hacker News 의견
지난 수십 년간 모든 분야에 퍼지고 있는 "포털/브로커" 현상임을 느끼고 있음. 소비자와 생산자 사이에 제3자 레이어가 들어서면서 양쪽 모두 편해졌지만, 이제는 이 레이어에 의존해야만 함. 아마존에서 주문할 때 더 이상 직접 판매자와 소통하지 않고, 음식 주문도 식당에 직접 돈을 내지 않음. 웹에서 정보를 찾을 때도 개별 작성자의 스타일, 네비게이션, 광고 등은 더 이상 상대하지 않음. 콘텐츠 소유자 입장에서 보면, 이런 구조는 페이지 방문이 줄어 광고 수입에 타격을 주며, 아마존이나 배달앱과는 달리 구글 요약으로 인한 광고 손실은 보상이 없음. 온라인 콘텐츠의 대부분이 광고로 운영되는 상황에서 구글도 결국 광고 수입이 생명인데, 그럼에도 미래를 위해 어쩔 수 없이 이런 진화를 밀어붙이는 중임. 구글은 미래에 자리를 유지하는 데만 집중하는 것으로 보임
내 소프트웨어 제품 웹사이트의 저작권 자료를 구글이나 다른 AI들이 허락도 없이 긁어가고 재가공하는 게 불만임. 하지만 만약 차단하면, 내 콘텐츠가 그들의 AI 요약에 언급될 확률이 거의 없어짐
이런 AI 요약 기능이 구글의 미래 수익을 잠식하지 않는다는 게 이해가 안 됨. 구글은 광고를 통해 사이트로 유입시키는 데서 돈을 버는데, 이런 요약 서비스로 웹사이트 자체를 불필요하게 만들고 있음. 그렇다면 누가 방문자 없는 사이트를 만들겠음
내 개인 사이트를 아파치 설정으로 인덱스, 스니펫, 번역, 이미지 인덱스 다 차단하도록 했음. 그럼에도 불구하고 Internet Archive만은 무시하고 긁어갔으며, 여러 번 삭제 요청을 해도 절대 들어주지 않음. 지금은 Anubis로 추가적인 스크래핑도 막는 중임. (이 사이트는 2000년에 시작한 공개 일기라서, 검색되지 않길 바라는 것임)
어떤 면에서는 퍼블리시란, 무언가를 공개해서 사람들이 일정 자유를 갖고 활용하도록 하는 것임. 그 자유가 사이트에 도움이 될 수도, 안 될 수도 있음. 구글 같은 대형 플랫폼이 변화할 때마다 콘텐츠 퍼블리셔들은 항상 적응해왔음. AI 요약도 그 변화의 흐름임
이 블로그 글, 마지막 문장에 '댓글을 남겨달라'고 되어 있는데, 실제 댓글 영역이 안 보여서 혹시 AI로 생성된 게 아닌지 궁금함
Perplexity, OpenAI, Claude 등에서도 이 기능이 동작하는지 궁금함
Google은 Perplexity처럼 출처를 명확하게 인용해주면 모두에게 좋은 결과라고 생각함. 원본에 링크와 크레딧도 주고 UX도 향상될 텐데 아쉬움
앞으로 내 전문 분야가 기업 웹사이트를 LLM이 잘 요약하도록 만드는 방법임. 이런 상세한 충실한 안내 콘텐츠가 필요함
이 글의 제목과 도메인을 붙여넣었더니 결과가 다르게 나옴. 참조 이미지