위키피디아, AI 검색 요약 및 소셜 비디오로 인해 트래픽 감소
(techcrunch.com)- 온라인 백과사전 Wikipedia가 최근 AI 검색 요약과 소셜 미디어 영상으로 인해 사람들의 직접 방문이 줄고 있다고 발표함
- 위키미디어 재단은 인간 방문자 수가 전년 대비 8% 감소했다고 밝혔으며, 이는 봇 탐지 시스템 업데이트 이후 실제 인간 트래픽만 집계된 결과
- 생성형 AI 검색결과가 직접 답변을 제공하면서 웹사이트로의 클릭이 줄고, 젊은 세대는 TikTok 등 소셜 영상 플랫폼을 정보 탐색에 활용하는 추세라고 분석함
- 위키피디아는 자체적으로 AI 요약 기능 실험을 중단했으며, AI와 검색엔진 기업들이 출처 표시 및 방문 유도 책임을 져야 한다고 주장함
- “AI가 사용하는 지식의 근원은 여전히 인간이 만든 콘텐츠”라며, 신뢰할 수 있는 출처 확인과 인간 큐레이션 지식의 가치 인식을 강조함
위키피디아 트래픽 감소 현상
- 위키피디아는 신뢰할 수 있는 마지막 대표적 웹사이트로 자주 언급되는 인터넷 백과사전임
- 하지만 최근 위키미디어 재단에서 발표한 보고서에 따르면, 인간 사용자 페이지 뷰가 전년 동기 대비 약 8% 감소함
- 재단은 사람과 봇의 트래픽을 구분하기 위해 감시 시스템을 개선했고, 5~6월의 이례적으로 높은 트래픽 상당 부분이 감지를 회피하는 봇 트래픽이었음이 확인됨
- 재단의 Marshall Miller는 이 현상이 AI 검색 요약 기능과 소셜 미디어 영상 소비 증가로 인한 구조적 변화라고 설명함
- 검색엔진이 사이트로의 링크 대신 AI 생성 답변을 직접 표시하는 방식으로 전환 중임
- 젊은 세대는 오픈웹 대신 TikTok·YouTube Shorts 같은 영상 플랫폼을 정보 탐색에 이용함
- Google은 이에 대해 AI 검색이 트래픽을 줄이지 않는다고 반박함
위키피디아의 입장과 대응
- Miller는 “사람들이 새로운 방식으로 지식을 얻는 것은 긍정적”이라며,
위키피디아의 지식이 여전히 AI 모델의 학습 및 요약 자료로 활용되고 있음을 강조함 - 다만, 방문자 감소는 콘텐츠를 기여하고 관리하는 자원봉사자 수 감소,
그리고 기부금 감소로 이어질 수 있는 실질적 위험을 내포함 - 실제로 일부 편집자들은 AI가 생성한 요약의 품질 문제를 제기했고,
재단은 AI 요약 시범 프로그램을 일시 중단함
AI 기업과의 관계 재정립
- Miller는 AI·검색·소셜 플랫폼들이 위키피디아의 콘텐츠를 활용한다면,
반드시 출처 명시와 사이트 방문 유도를 통해 생태계에 기여해야 한다고 주장함 - 위키피디아는 콘텐츠 출처 표기 프레임워크를 새로 개발 중이며,
신규 독자층 확보를 위한 2개 전문 팀을 운영하고 있음 - 또한 자원봉사자 참여 확대를 위한 캠페인을 전개 중임
신뢰 기반 지식의 중요성
- Miller는 “AI가 요약한 정보의 근원에는 인간의 지식 노동이 존재한다”고 강조함
- 사용자는 검색 시 인용문을 확인하고 원문을 직접 방문해야 함
- 신뢰할 수 있는 인간 큐레이션 지식 생태계의 유지가 필요함
- 그는 “지식의 투명한 출처와 인간 참여의 지속성이 AI 시대의 핵심 가치”라고 언급함
Hacker News 의견
-
위키피디아는 꼭 필요하다고 생각함, 그리고 트래픽이 줄어드는 것 자체는 괜찮음
종이 백과사전은 위키피디아로 대체됐지만, AI는 결코 그 자리를 대체할 수 없는 존재임
AI는 단지 접근을 쉽게 해주는 도구일 뿐, 위키피디아만의 존재 목적과 가치는 따로 있다고 봄
위키미디어 재단의 자금 축적과 계속 늘어나는 연간 지출에 대해 항상 회의적이었음
지금이야말로 돈을 아끼고 투자를 통해 자립함으로써 1000년 이어지길 바라는 마음임
위키피디아는 공공의 선을 위한 존재이고 그렇게 운영되어야 한다고 생각함-
위키미디어 재단이 1000년 동안 지속되긴 어렵다고 봄
사회/경제 시스템 자체가 그렇게 오래 가지 않을 것이기 때문임
이미 미국 정부가 위키미디어에 불편한 움직임을 보이고 있음
한 나라에서 다른 나라로 옮겨봐야 그렇게 오래 지속되긴 힘들 것임
기술 문명과 데이터 저장의 취약성 때문에 위키피디아 자체도 그렇게 오래 존재할 수 있을지 불확실함
관련 기사 -
위키피디아는 데이터 덤프를 공개적으로 제공하므로 오프라인 사본이 많이 존재해야 한다고 생각함
아마 위키미디어가 트래픽 감소를 이야기하는 것은 광고 매출과 관련된 상업적 이유라기보다는
www 사용자가 정보를 찾는 방식이 바뀌었기 때문일 것임
광고를 위해 사용자를 팔아넘기지 않는 사이트라면 트래픽이 줄어도 전혀 문제되지 않음
그 사이트가 제공하는 정보 자체가 덜 가치 있다는 의미와는 무관함 -
장기적으로 살아남기 위해 성장할 때 자금과 투자를 쌓아두는 전략에 항상 궁금증이 있었음
그런 분산 투자로 외부 수입이 끊겨도 운영이 가능해지면,
분기별 실적에 얽매이지 않고 본래의 비전과 올바른 일에 집중할 수 있을 것임
돈을 계속 벌 수는 있겠지만, 본질을 지키는 선에서 장기적 운영 방안을 고민하는 것이 이상적임 -
위키피디아는 정말 대단한 것임
전 세계 누구나 주제 상관 없이 원하는 글을 쓸 수 있음
최고의 정보를 얻고 있다는 확신을 가질 수 있음 -
위키미디어 재단의 자금 사용이 궁금함
지출이 계속 늘어난다고 하는데 주로 어디에 쓰는 것인지,
여전히 다른 프로젝트로 확장하려는 시도를 계속하는 중임?
세계적인 대형 사이트라 호스팅 비용이 적지 않다는 것은 이해하지만,
그렇게까지 급증하고 있을까에 대한 의문이 있음
-
-
501(c)(3) 비영리 단체로서 웹 트래픽이 수익에 직접적 영향을 주지 않는다면
트래픽 감소를 꼭 나쁘게 볼 필요가 있을지 궁금함
급격한 성장 압박은 VC나 광고 의존 기업에 한정된 줄 알았음-
실제로는 위키피디아도 웹 트래픽에 크게 의존하고 있음
사람 방문자는 감소하나 AI 크롤러가 엄청나게 데이터를 긁어가면서 오히려 비용이 늘어나고 있음 -
트래픽 감소는 자원봉사자나 후원자 감소로 이어질 수 있음
직접 방문자가 줄면 콘텐츠를 다듬거나 후원할 사람들이 적어진다는 우려임 -
광고 매출 감소가 아니라, 결국 기부금도 줄 수 있다는 신호임
현재 많은 사람들이 AI 구독에는 돈을 내면서, 위키피디아 자체를 아예 보지 않는 현상이 생김
정보의 1차 출처가 중간 단계에서 소비되고 있음
과거 저작권 침해 논의와 비슷하지만, 이번엔 일반인이 아니라 대형 영리기업이 주체임
-
-
LLM(대형 언어 모델)이 위키피디아에서 찾아보던 정보의 90%를 대체했다고 느낌
훨씬 다양한 출처를 통합할 수 있기 때문임
동시에 여전히 위키피디아에 기여(편집)를 계속함
내가 편집한 정보가 위키피디아에서든 LLM 통해서든 소비되어
결국 누군가에게 도움을 주는 점이 중요함
사람들이 더이상 직접 사이트에서 정보를 소비하지 않아도 위키피디아는 사라지지 않을 것임- 위키피디아는 창작물을 무료로 모두에게 제공함
반면 LLM 기업들은 그렇지 않음
Google조차도 손실을 감수하고 운영하는 것임
진짜로 "사람을 돕는다"고 보긴 어렵고, 오히려 반대임
- 위키피디아는 창작물을 무료로 모두에게 제공함
-
냉정한 현실로 LLM이 결국 위키피디아를 완전히 대체하게 될 것이라고 봄
위키피디아의 엄격한 관료주의나 집착적 편집, 편향 등 문제는 차치하고
애초에 위키피디아는 2차 출처를 요약해서 합의점을 만드는 인간 중심 요약 엔진임
바로 이 부분이 LLM이 가장 잘하는 영역임
질 좋은 책 중심으로 학습하면 위키피디아 품질을 능가하는 것도 가능함
AI 요약문 첫 문장만 봐도 주요 주제부터 명확히 들어감
반면 위키피디아는 편집자들 간 정치적 논쟁 등으로 첫문장조차 불필요하게 복잡해지는 경향임-
만약 그 모든 말이 사실이라 해도 LLM은 이런 2차 출처 요약을 모은 저장소가 필요함
LLM이 실시간으로 수천 개의 2차 출처를 찾고 읽을 수 없음
이미 사라지거나 디지털화 안 된 자료도 많음
미래에 LLM 연구실이 위키피디아에 기부 및 AI 에이전트로 편집 제안과 팩트체크를 함께 하는 그림도 가능함 -
이런 생각(LLM이 대체한다는)은 위키피디아가 계속 존재해
사람들이 쉽게 속지 않는 비판적 사고력을 키워주는 역할을 하길 바라는 마음임 -
"질 좋은 책으로만 학습하면 된다"는 주장엔 동의 못함
실제 위키피디아의 많은 주제에는 아예 질 좋은 책 자체가 없음
그리고 그런 책의 기준은 누구 맘대로 정하는 것인지도 문제임
트래픽 감소는 위키피디아만의 문제가 아니라 다른 웹사이트에도 해당됨
AI는 자신이 의존하는 정보의 근원마저 사라지게 만들고 있음
지금이야말로 AI의 황금기임
다음 시대는 더 적은 좋은 원본, 더 많은 AI 생성 콘텐츠,
LLM에 악영향 주기 위한 사이트의 등장 시대로 전환될 것임
관련 토론
-
-
지식이란 그 자체로 존재하는 것이 아니라 사람들이 이를 어떻게 조직하느냐의 문제임
AI가 기존 지식을 채굴해 점점 더 편리하게 보여주지만,
정보와 지식 조직 방법의 근본은 크게 바뀌지 않을 것으로 봄
다만 AI가 아래와 같은 영역에서 조직 방식을 변화시킬 가능성은 있음- 팩트체크 및 출처 확인
- 새 항목 초안 작성
- 문장 다듬기 및 편집 등
이미 위키피디아는 많은 봇이 백그라운드에서 움직이고 있으니
만약 이 모든 작업을 AI가 하게 되어도 결국 남는 문제는 인간(혹은 또다른 AI)의 판단 영역임
-
사실관계에 여러 관점이 있으면 어떻게 균형 있게 표현할 것인가(수많은 편집자 토론 경험 떠오름)
-
스마트폰/소셜미디어 시대엔 수많은 평범한 사람들이 역사를 기록하는데, 어떻게 요약·정리할 것인가
-
인간/A I 모두에 적절히 기여를 유도하는 인센티브는 어떻게 설계할 것인가
-
위키피디아의 독립성을 어떻게 지킬 것인지(지정학적 이슈)
참고로 예전에 중국 위키 서비스를 리드해본 적 있는데
단순히 정보 검색이 아니라 왜 위키라는 형태가 필요하고 지속되어야 하는지
진지하게 고민하는 사람이 거의 없는 점이 가장 힘들었음 -
AI를 활용해 위키피디아를 더 낫게 만드는 게 마음에 듦
소규모 작업을 단순한 AI 에이전트가 처리할 수 있는 여지가 많음
예를 들어, 영어 위키의 모든 스페인 도시 문서로 가서
인구, 시장명 등의 데이터를 스페인어 위키와 비교해 더 정확한 정보로 교정하는 것임
이런 에이전트가 초안만 작성하고 인간 에디터가 검토한다면
효율적으로 미세한 정보 업데이트가 가능해짐
-
구글이 AI 요약을 제공하면서 거의 모든 웹사이트에서 비슷한 현상이 나타나고 있음
-
AI의 영향은 당연하다 쳐도 "소셜 비디오"는 무슨 의미인지 궁금함
사람들이 이제 Wikipedia 대신 TikTok을 본다는 건지,
아예 검색 자체를 안 하게 됐다는 의미인지 궁금함-
실제로 요즘 제일 핫한 검색 엔진은 유튜브와 틱톡임
-
Gen Alpha에서는 틱톡이 뉴스와 지식을 얻는 가장 주요한 매체임
-
-
모든 SEO(검색엔진 최적화)탑재 웹사이트에도 동일 현상이 벌어지길 바람
관련 토론- 모든 사이트에 해당됨
심지어 광고 없는 좋은 사이트에는 AI 크롤러가 쓸데없는 트래픽까지 더함
이로 인해 운영비 부담이 더 커짐
게다가 LLM에 악영향을 주기 위한 콘텐츠만 목적으로 한 사이트도 우후죽순 등장할 것임
결국 LLM 자신도 비용이 더 들거나 광고 삽입 등으로 바뀌게 될 것임
- 모든 사이트에 해당됨
-
그동안 위키피디아는 기여자가 점점 줄어든다는 경향이 지속됐음
직접 위키피디아를 읽는 사람이 줄면 기여자 감소는 더 심해질 것이라 예상함
아쉽지만 LLM을 활용해서 위키피디아를 보완/개선/검증하는 실험이 이뤄지고 있는지 궁금함
앞으로는 기존의 토론이나 편집 전쟁이
협업과 경쟁을 일부 병행하는 LLM 에이전트 간 대결 구도로 바뀔 수도 있을 것임-
기여자가 하는 다양한 작업도 AI 에이전트가 효율적으로 처리 가능해질 것임
핵심은 a) 사람의 참여와 감시, b) 악의적 행동 필터링 시스템이 중요함 -
지금의 운영 구조엔 문제점이 있음
기여자가 새 콘텐츠를 추가하면, 스팸러가 정상 문서의 링크를 빼고 스팸 링크로 바꿈
위키피디아 봇은 해당 콘텐츠를 삭제함
기여자는 결국 무관심해짐
-
-
위키피디아는 시대를 앞서간 마법 같은 도구였고,
지금도 최고의 정보 집약지라는 가치는 여전히 유효함
앞으로도 링크 집합체로서 오래 살아남을 듯함
실시간(읽을 때) 큐레이션이 훨씬 더 낫지만,
과거엔 그게 어려웠고 이제는 저렴하게 가능해서
위키피디아도 여러 실시간 큐레이션 툴의 데이터 소스로 남을 것임
이런 소스 데이터베이스가 있다는 것만으로도 많은 AI 도구의 효용이 높아짐
편집자 단일 시각이나 사심을 문제 삼는 목소리가 많은데, 충분히 이해함
하지만 LLM의 채팅 인터페이스 덕분에 상호작용하며 맥락을 파악하거나 더 깊이 들어갈 수 있음
개인적으로 이렇게 오픈된 지식 인프라를 만드는 과정에 참여하는 것이 즐거움
위키 문서의 작은 오류만 고치는 것만으로도 보람을 느끼는 중임
이런 식으로 쉽게 고칠 수 있는 부분이 많음
누군가 추가한 엉터리 내용도 쉽게 발견되고 바로잡을 수 있음
문서 예시- 읽을 때(실시간) 큐레이션이 확실히 더 낫지만
위키피디아를 폰에 넣고 즉각 검색하는 것은 정말 저렴함
LLM은 매우 무겁고 대부분의 사람은 로컬에서 돌릴 수 없으며
데이터 손실(요약 과정 등)도 있음
둘 다 폰에서 구동된다면 정말 좋겠지만
데이터 소유권 문제에도 걱정이 많음
- 읽을 때(실시간) 큐레이션이 확실히 더 낫지만