GN⁺: 인터넷, AI로 가득 찬 쓰레기 정보
(aftermath.site)인터넷은 이제 기계들끼리 대화하는 공간
- 인터넷은 사람들이 서로 질문하고 답변하는 단순한 사용법에서, 이제는 AI가 만들어낸 잘못된 정보로 가득 찬 공간으로 변화함.
- 구글 사용자들은 구글이 달걀이 녹을 수 있다고 잘못 알려주는 것을 발견함. 이는 구글이 웹사이트를 직접 보여주는 대신 페이지의 스냅샷을 드롭다운 메뉴로 제공하여, 사용자가 클릭하지 않고도 검색 결과를 읽을 수 있게 한 결과임.
- 최근에는 구글 검색의 무용성이 증가하고 있으며, 예를 들어 만성 부비동염 검색 결과가 염증이 있는 음경에 대한 결과를 반환하는 사례가 있음.
인터넷 트래픽 "강탈"과 스포츠 일러스트레이티드의 AI 기사 논란
- 어제, 한 트위터 사용자가 인터넷 트래픽 "강탈"을 주장함. 그는 경쟁 웹사이트의 사이트 인덱스를 보고 기사 URL을 추출한 뒤, AI를 사용하여 빠르게 기사를 작성함.
- 또한, 스포츠 일러스트레이티드가 AI로 작성된 기사를 게재하고, 실제로는 존재하지 않는 사람들의 이름으로 기사를 발행한 것으로 드러남. 이에 대한 문의가 있은 후 해당 콘텐츠는 삭제됨.
인터넷의 근본적인 파괴
- 인터넷은 더 이상 사람들 간의 소통의 장이 아니라, 기계들이 서로 대화하는 공간으로 변질됨.
- "구글에게 물어봐"라는 말은 이제 무의미해짐. 잘못된 정보나 완전한 허구를 반환할 가능성이 높아짐.
- 스포츠 일러스트레이티드와 같은 기업들은 독자들에게 서비스를 제공하기보다는 구글 검색 결과와 광고 수익을 높이는 데 더 관심을 가짐.
GN⁺의 의견
- 인터넷 상의 정보의 질이 점점 떨어지고 있으며, 이는 사용자들에게 혼란과 불편을 초래함.
- AI 기술의 발전이 가져온 부작용 중 하나로, AI가 생성한 잘못된 정보로 인해 신뢰할 수 있는 정보를 찾기 어려워짐.
- 이러한 변화는 사용자들이 인터넷에서 정보를 얻는 방식에 대해 다시 생각하게 만들며, 정보의 질을 보장하기 위한 새로운 접근법이 필요함을 시사함.
Hacker News 의견
-
대규모 언어 모델(Large Language Models, LLMs)의 확산으로 인해 나타난 문제점 중 하나는, 이전에는 철자나 문법 오류를 통해 가치 없는 게시물을 신속하게 걸러내는 유용한 휴리스틱이 있었으나, 이제 AI가 생성한 콘텐츠는 언어 구사 능력이 완벽하여 더 이상 그 방법이 통하지 않는다는 것임. 예를 들어, curl 프로젝트에서 AI가 생성한 가짜 버그 리포트로 인한 문제가 있었음. 이러한 문제는 앞으로 더욱 심각해질 것으로 예상됨.
-
인터넷의 변화에 대해 동의하면서도, GPT-4, 3, 2 이전과 인터넷이 크게 다르지 않다고 생각하는 의견도 있음. 인턴이나 인도의 가상 조수가 작성한 일반적인 주제의 기사들은 대부분 AI가 생성한 콘텐츠만큼 나쁘며 구별하기 어려움. 검색 엔진이 웹페이지의 텍스트와 쿼리의 일치 여부보다 명성을 기준으로 정렬하는 현상도 문제임. 사람들은 이제 웹보다 앱에서 생활하며, 웹의 질이 오랫동안 나빠져 왔지만 곧 중요하지 않게 될 것임. 인터넷이 앞으로 존재한다면, 새로운 익명화된 계층으로 이동하고, 저품질 콘텐츠 생성을 줄이기 위해 화폐 교환을 자주 요구하는 방향으로 발전하기를 바람.
-
클리어넷의 현재 상황이 심각한 가운데, Discord 내부에 정보가 격리되어 있는 것이 나쁘지 않게 보이는 의견도 있음. 검색 엔진에 의해 색인되지 않음으로써 AI 쓰레기와 함께 나타나거나 훈련 데이터로 사용되는 것을 피할 수 있음. 인터넷의 미래는 사람에게 달려 있으며, 기계는 더 이상 기본적인 작업조차 신뢰할 수 없게 됨.
-
BeamMP 프로젝트에서 AI가 생성한 가짜 버그 리포트와 PRs(풀 리퀘스트)의 경험을 공유함. 이러한 AI 생성물은 쉽게 식별할 수 있으며, 관련 코드를 변경하거나, 컴파일되지 않는 해결책을 제시하는 등의 특징이 있음. 진짜 사람들은 게으르기 때문에 불필요한 작업을 하지 않고, AI가 생성한 쓰레기는 시간 낭비이므로 병합하지 않음.
-
인터넷에서 진정성을 유지하는 것이 중요함. 서명된 콘텐츠만이 진정성을 보장할 수 있음. AI가 더 많은 것을 게시할 수 있는 상황에서, 누가 무엇을 게시했는지, 그들이 무엇을 말하고 있는지 알 수 있는 신뢰와 진정성에 의존하는 것이 필터링의 유일한 방법임. 신뢰의 웹(Web of Trust)은 시도되었지만 주류로 나오지 못했으며, 다시 시도할 때가 됐을 수 있음.
-
LLM이 가속화시킨 오래된 문제에 대한 의견도 있음. Google이 광고 수익과 광고 기술의 지배력을 늘리기 위해 노력함에 따라, 검색 결과에서 SEO가 만연하게 되었고, 이로 인해 객관적인 정보를 얻기 어려워짐. Reddit에서 정보를 먼저 검색하는 것이 해결책이 될 수 있지만, Reddit 역시 최근 몇 년 동안 조작된 콘텐츠로 가득 차 있음.
-
인터넷이 이미 SEO로 인해 인간이 생성한 쓰레기로 가득 차 있었기 때문에, "AI"의 등장으로 실제로 많은 것을 잃은 것은 아니라는 의견도 있음. 이러한 문제를 업계에서 오랫동안 지적해 온 사람들도 있음.
-
광고는 결국 돈을 벌기 위한 것이며, 봇이 신용카드를 가지고 있지 않는 한, 인간으로부터의 돈을 의미함. Google과 같은 회사들은 트래픽이 증가하더라도 그것이 인간의 지출로 전환되지 않는다면, 그 영향을 재정적으로 느낄 것임. 최근에 발생하는 기술 분야의 대규모 해고는 이러한 문제에 대한 대응이 시작되고 있음을 시사할 수 있음.
-
"Anathem"이라는 책을 읽었다면, 우리의 임무는 Reticulum에서 쓰레기를 걸러내는 것이라는 의견도 있음.