3P by GN⁺ | ★ favorite | 댓글 1개
  • Stack Overflow는 개발자 Q&A의 대표 공간이었지만 ChatGPT, Cursor, Claude 같은 코드 작성 AI 도우미 확산 뒤 질문과 트래픽이 급감함
  • 지난달 질문 수는 6,866개로 2008년 출시 초기 수준까지 내려갔고, Elon Musk는 이를 “LLM에 의한 죽음”이라고 부름
  • 포럼 참여도는 줄었지만 연매출은 약 1억 1,500만 달러로 거의 두 배가 됐고, 손실은 FY2023 8,400만 달러에서 2,200만 달러로 감소함
  • 수익 구조는 광고 중심에서 기업용 솔루션과 데이터 라이선스로 옮겨갔고, Stack Internal은 전 세계 25,000개 기업에서 사용 중임
  • 개발자 질문이 비공개 AI 채팅으로 이동해 새 공개 지식은 줄지만, LLM은 여전히 Stack Overflow 데이터를 필요로 하는 순환 구조가 됨

AI 도우미가 줄인 Stack Overflow 트래픽

  • Stack Overflow는 오랫동안 개발자가 기술적 도움을 찾는 대표 Q&A 포럼이었고, 팬데믹 기간에는 오래 활용될 정보를 찾는 개발자들 덕분에 영향력이 정점에 가까웠음
  • ChatGPT, Cursor, Claude, Google Gemini, Microsoft Copilot 같은 코드 작성 AI 도우미가 확산되면서 사이트 트래픽이 급감함
  • 2023년 7월 Elon Musk는 Stack Overflow의 상황을 “LLM에 의한 죽음”이라고 부름
  • 지난달 Stack Overflow에 올라온 질문 수는 6,866개였고, 이는 2008년 출시 초기의 일반적인 규모와 거의 비슷한 수준임

포럼은 줄었지만 회사 매출은 버팀

  • Stack Overflow의 Q&A 포럼은 약해졌지만, 회사는 방대한 과거 콘텐츠를 수익화하며 버티고 있음
  • ChatGPT가 2022년 등장한 뒤 참여도는 급락했지만, Stack Overflow의 연간 매출은 약 1억 1,500만 달러로 거의 두 배가 됨
  • 손실은 FY2023의 8,400만 달러에서 최근 회계연도 기준 2,200만 달러로 줄어듦
  • 대규모 해고 같은 강한 비용 절감도 수익성 개선에 기여함
  • Chegg 같은 지식 허브가 생성 AI의 타격을 받은 것과 달리, Stack Overflow는 과거 콘텐츠의 가치를 새로운 수익원으로 연결함

광고에서 기업용 솔루션과 데이터 라이선스로 이동

  • 과거 Stack Overflow는 활발한 포럼의 광고에 의존했지만, 현재 주요 수익원은 기업용 솔루션으로 바뀜
  • “Stack Internal”은 수년간 쌓인 수백만 개 질문과 답변을 기반으로 한 생성 AI 추가 기능을 제공함
  • Stack Internal은 전 세계 25,000개 기업에서 사용 중임
  • Stack Overflow는 Reddit과 비슷하게 AI 기업에 데이터 라이선스도 판매함
  • Reddit은 사용자 생성 콘텐츠 라이선스로 2024년에 2억 달러 이상을 벌어들인 플랫폼으로 제시됨

오래된 커뮤니티가 만든 신뢰의 가치

  • Stack Overflow의 새로운 틈새시장은 과거 커뮤니티와 전문성이 만든 신뢰에 있음
  • CEO Prashanth Chandrasekar는 2023년 초 질문 감소가 대부분 아주 단순한 질문에서 발생했고, 복잡한 질문은 여전히 Stack Overflow에 올라온다고 봄
  • Chandrasekar는 LLM이 사람이 선별한 데이터만큼만 좋다면, Stack Overflow가 기술 분야에서 가장 좋은 장소 중 하나이거나 최고일 수 있다고 봄
  • 대규모 언어 모델은 코딩 문제와 해결 방법에 관한 데이터를 원하고, Stack Overflow는 그런 데이터를 담은 큰 디지털 창고를 보유함

순환 구조가 된 AI와 개발자 지식

  • Stack Overflow 데이터는 LLM에 중요하지만, 개발자 질문이 LLM과의 비공개 채팅창으로 이동하면서 새로 축적되는 공개 질의응답은 줄어듦
  • LLM은 작동하기 위해 거대한 데이터가 필요하고, Stack Overflow의 데이터는 그 수요를 충족할 수 있는 자산임
  • 동시에 Stack Overflow의 데이터는 점점 오래된 자산이 되고 있음
  • Stack Overflow는 AI가 공개 개발자 지식 공유를 약화시키면서도, 그 공개 지식을 다시 필요로 하는 기술 산업의 순환적 변화를 보여줌

댓글과 토론

Hacker News 의견들
  • 잘 없어졌다는 생각도 듦
    나도 다른 사람들처럼 많이 썼고, 여러 번 도움도 받았지만 문화적 문제가 심각해졌고 사라지지 않았음
    게임화가 규칙에 집착하는 경직된 성향의 사람들을 끌어들였고, 그들이 남에게 상처를 줄 때도 자각하지 못했던 것 같음
    좋은 질문과 쓸 만한 답변을 원했다는 의도는 이해하지만, “잘못된” 질문을 했다는 이유로 사람을 함부로 대하는 걸 정당화하진 못함. 거기서 본 거만함과 냉소적 묵살은 보기 괴로웠음

    • “Django 6에서 이걸 어떻게 하나요?”
      종료: 2011년 8월의 “Django 1.3에서 어딘가 비슷한 걸 어떻게 하나요?”라는 1234번 질문과 중복
      그 사이트의 모더레이터들은 상호작용의 즐거움을 완전히 빼앗았음. 모더레이터가 있는 사이트를 운영한다면, 그들이 사이트를 Stack Overflow처럼 만들지 않도록 꼭 통제해야 함
    • SO에 그런 평판을 만든 열성적 규칙주의자들이 많았던 건 맞지만, 그게 죽은 이유인지는 모르겠음
      ‘New’ 대기열에서 자주 답하던 입장에서는 규칙 위반, 저노력 질문, 명백한 중복의 양이 놀라울 정도였음
      결국 질문의 99%가 상호작용할 가치가 없어서 답변을 그만뒀고, 그냥 닫기 투표하고 넘어가게 됐음
      결국 SO는 너무 유명해졌고 중재가 감당 불가능해져서 죽었다고 봄
    • CUDA 태그에도 자경단 같은 사람이 있었고, 프로필에 이런 내용이 있었음
      예전에는 CUDA라는 신흥 기술이 있었고 과학 계산과 병렬 계산에 흥미로운 가능성을 열어줬으며, Stack Overflow에는 CUDA 사용법에 관한 흥미로운 질문이 많았음. 그래서 답하기 시작했고, 거의 700개 질문에 답하면서 CUDA 태그에서 최고 평판 참여자가 되었고 꽤 즐거웠다는 내용이었음
      하지만 CUDA가 성숙해지면서 좋은 질문은 대부분 이미 묻고 답해졌고, 지금 Stack Overflow에 올라오는 건 대부분 찌꺼기라서 답변보다 편집, 반대표, 종료에 시간을 쓴다는 내용도 있었음
      결과적으로 대부분의 CUDA 질문은 반대표를 받고 삭제됐음. 이상하게도 CUDA는 계속 진화하는데도 그랬음
    • Reddit 서브레딧에서도 몇 번 질문해봤을 때 비슷하게 느꼈음
      삶에서 어려움을 겪고 온라인에서 도움을 찾는 상황이라면 정말 의욕을 꺾는 경험
    • 짜증나는 규칙과 무례함, 거만함까지는 참을 수 있었지만, 진짜 선을 넘은 건 문자 그대로의 삭제주의로 퇴화했다는 점이었음
      이제는 질문을 닫는 데 그치지 않고, 그 안에 유용한 정보가 있어도 통째로 삭제함
      예전에 닫힌 질문으로 돌아가 댓글에 누군가 남긴 링크를 찾으려 했더니, 실제 내용이 있었는데도 어떤 모더레이터가 이유도 없이 질문을 삭제해버린 걸 봤음
      그때 완전히 질려서 내 도메인과 내 웹사이트에 전념하게 됐고, 다시 거기에 뭔가 올린다면 항상 내 사이트 링크 형태로만 올릴 것임. 그들의 삭제주의가 닿지 못하게 하려는 것임
  • Stack Overflow는 프로그래밍에 관한 인류 지식 저장소로는 최고일 수 있음
    하지만 유용성은 축적된 지식에 한정된다고 봄. 서비스나 커뮤니티로서는 오래전부터 꽤 형편없었음
    프로그래밍을 배우려는 신규 사용자에게는 가장 독성이 강한 자원 중 하나였을지도 모름. 2019년 이후로 질문을 올린 적이 거의 없음
    평균적인 사용자가 기대할 수 있는 건 글을 제대로 읽지도 않은 사람의 까칠한 답변이거나, 만족스러운 답이 있든 없든 비슷해 보이는 질문이 있다는 이유로 모더레이터가 삭제하는 것뿐이었음
    어느 시점이 되면 의미 있는 질문은 이미 다 올라와 있음. 그 사이트는 기존 문제의 변형을 도와주는 곳이 아니라, 새로운 문제를 수집하는 곳으로 존재하게 됐음
    또 업계가 몇몇 프레임워크로 균질화된 영향도 과소평가되어 있음. Stack Overflow의 정점이 React가 떠오르던 시기와 겹친다는 점은 시사적임

    • 초창기 SO는 사람이 사람을 돕는 구조에 최적화되어 있었음
      나중에는 정돈됨에 최적화하면서 사이트를 망쳤고, 그 과정에서 특히 신규 사용자를 괴롭혀 쫓아냈음
    • 내 경험상 StackExchange는 초보자에게 꽤 친절했음
      math SE와 stats SE에 수학·통계 관련 간단한 질문을 올리곤 했는데, 몇 시간 안에, 때로는 몇 분 안에 정확한 답을 받았음
    • 인터넷 전체처럼, 인기가 많아질수록 덜 친절해졌음
      그리고 친절함을 유지하고 보상하는 장치가 없었음
      Jeff Atwood는 이후 Discourse를 만들 때 이 부분을 많이 고민했고, 커뮤니티 구성원끼리 좋게 대하도록 유도하려 했음
  • 글쓴이는 그래프에 COVID와 ChatGPT 출시를 표시했지만, Stack Overflow가 2021년 6월 네덜란드 사모펀드 Prosus에 인수됐다는 점은 언급하지 않았음
    내가 보기에는 그 시점이 전체 하락 추세와 꽤 잘 맞아 보임

    • Stack Overflow 원 창업자들이 유동화 이벤트를 얻고 재정적으로 잘살게 됐을 것 같아 다행임
    • 회사는 소유주가 가장 좋은 가격을 받을 수 있다고 믿을 때 팔림
      매각 자체는 원인이라기보다 증상에 가까움
    • SO 문제는 늘 무급 모더레이터들과 연결해서 봤음
      그들은 “인수된” 게 아니라 물려받은 쪽에 가까워 보임
    • 그들이 실제로 뭘 바꿨는지가 궁금함
    • 그렇게 보진 않음
      그 기간 동안 StackOverflow 자체는 별로 바뀌지 않았고, 사용자 변화는 외부 요인 때문이었을 것임
  • Stack Overflow는 단점이 많았지만 정점기에는 인터넷의 경이로운 존재였음
    특히 초창기에는 사람들이 카르마를 좇고 있었고, 뭘 물어봐도 어떤 답이든 받을 수 있었음. 항상 맞지는 않아도 답은 있었음
    LLM이 평균적으로 훨씬 나은 답을 줄 수는 있겠지만, 거기서 잃어버린 인간적인 조각은 제대로 기억하고 소중히 여겨야 한다고 느낌

    • 공개 포럼에서 틀린 답을 받는 것도 수정 답변을 끌어내는 데는 좋을 수 있음
    • StackOverflow보다는 예전에 여기저기 많았던 phpBB 기반 포럼들이 더 좋았음
      아이러니하게도 StackOverflow가 그런 포럼들을 거의 죽였고, 결국 자신도 다음 물결의 희생자가 됐음
  • 이건 걱정할 만한 일 아닌가 싶음
    사람들은 StackOverflow를 쓰면서 그 과정에서 새 지식을 만들어냈음
    그런 토론 매체가 없다면 최신의 고품질 지식을 모델에 어떻게 먹일 수 있을까

    • 아이러니가 아니라 진짜로 LLM을 위한 StackOverflow가 필요함
      LLM들이 많은 조사를 거쳐 발견한 문제 해결책을 올리는 식임
      안타깝게도 LLM은 OpenAI, Anthropic, Google 같은 몇몇 제공자에 집중되어 있어서, 각자 사적이고 닫힌 StackOverflow를 만들 가능성이 있음
      그 사적 StackOverflow를 활용하면 각자의 LLM은 복잡한 추론을 우회해 토큰, 시간, 비용을 아낄 수 있음
    • 문서도 많고, AI가 직접 읽을 수 있는 코드도 많음
      예를 들어 어떤 라이브러리에 흔한 우회책이 필요한 버그가 있다면, 그 우회책을 쓰는 오픈소스 코드에서 배울 수 있음
    • 큰 문제는 아니라고 봄
      강화학습 환경, 합성 데이터, 사람이 주석 단 데이터가 있고, codex/claude code/cursor의 사용 데이터도 있음
      코딩에서 모델 능력의 대부분은 사전학습이 아니라 후학습에서 나옴
    • 나도 이걸 생각해왔음
      LLM은 LLM이 없던 시절의 사용자 생성 콘텐츠를 “훔쳐서” 이익을 봤다고도 할 수 있음
      LLM 시대에는 앞으로 LLM을 학습시킬 새로운 Stack Overflow가 생기지 않을 것임
      Twitter의 많은 계정이 사실상 LLM인 죽은 인터넷 이론에도 가까워지고 있음. Reddit도 큰 문제일 것 같음. 카르마를 파밍하거나 영향력 캠페인에 참여하거나 광고 수익을 노리는 계정들이 많을 테니까
      결국 LLM을 학습시키는 말뭉치 자체가 LLM 찌꺼기로 가득 찬 지점에 도달할 것임. 자기강화형 찌꺼기가 미래인가 싶음
    • 사람들은 여전히 자신이 해결한 흥미로운 문제와 그 방법을 이야기하고 싶어함
      문제는 SO가 스스로를 질식시켰다는 것보다, 주요 검색엔진들조차 작은 블로그를 보여주기보다 AI 답변으로 방향을 틀고 있다는 데 있음
  • 질문 작성 요건이 엄격하면 문제를 명확히 정의하는 데 도움이 됐고, 질문을 제대로 쓰고 나면 해답을 얻게 되곤 했음

    • 초창기 Stack Overflow는 훌륭한 러버덕 디버깅 도구였음
      하지만 최근 몇 년에는 거기에 질문을 올리는 것 자체가 트라우마에 가까운 경험이 됐음. 완전히 정당한 질문을 올려도 반대표와 종료를 받을 가능성이 컸고, 질문에 문제가 조금이라도 있으면 더 심했음
      “질문을 올렸더니 스스로 답할 수 있게 됐고 누군가 댓글로 그렇게 말해줬다”에서 “어떤 질문이든 올리면 사이트 전체가 달려들어 그 질문을 없애려 한다”로 완전히 바뀌었음
  • 이상하게 들릴지 몰라도, 가끔은 Claude Code가 고집하는 방식보다 StackOverflow에서 더 나은 해법을 찾음
    장기적으로 SO 없는 세상이 더 나은지는 잘 모르겠음

    • 나도 같음
      LLM은 문제에 대해 최고의 해법보다는 잘 알려진 해법을 뱉어내는 데 뛰어남
      LLM의 확률분포에서 토큰을 샘플링하는 방식 때문에 해법의 롱테일은 대체로 사라짐
      도움이 됐던 방법은 어떤 문제에 대해 예를 들어 10가지 다른 해법을 달라고 하고 그중 하나를 고르는 것임. 서로 다른 해법이 10개나 없을 때는 거의 창의적인 해법이 나오기도 함
    • SO에는 한 가지에 대해 여러 해법과 구현을 볼 수 있다는 장점이 있었음
      때로 “최고” 해법은 읽기 어려운 코드이고, 사람들이 여러 방식으로 풀면서 화난 원숭이처럼 논쟁하는 걸 보면 문제를 더 잘 이해할 수 있었음
      물론 정말 나쁠 때도 있었음
    • Claude가 하라고 고집하는 것 상당수는 아마 SO에서 온 것일 가능성이 큼
    • 장기적으로 SO 없이 더 나은지는 모르겠다는 말에 동의함
      다만 그 사이트의 문화는 꽤 오래전부터 삐걱거렸음
      SO의 일부인 ServerFault에서 질문과 답변을 편집하는 데 많은 노력을 쏟았지만, 지금은 그 시간이 낭비였다고 느낌
      그들은 한동안 사이트를 팔고 싶어 했고 더는 신경 쓰지 않았던 것 같음. 몇몇 편집자들이 너무 오래 못되게 굴도록 놔뒀고, 그게 그들의 머리로 올라갔음. 그 노력을 되돌릴 수 있으면 좋겠음
    • SO는 아마 언어 모델을 위한 최고 품질의 데이터 소스일 것임
      나머지 인터넷은 Jon Skeet이 제한한 최종 잠재 공간을 희석시키는 것에 가깝다는 농담도 가능함
  • Stack Overflow가 AI 때문에 고생할 거라는 건 알았지만, 월별 질문 수가 챗봇 이전 20만 개에서 대략 1천 개로 떨어졌다는 건 믿기 어려움
    물론 나도 지난 4년 동안 거기에 전혀 가지 않았음

    • 첫 번째 차트의 질의를 눌러보니 2020년 5월에는 약 30만 개로 정점이었고, 마지막 완전한 달인 2026년 4월에는 약 3천 개였음. 정말 충격적임
      https://data.stackexchange.com/stackoverflow/revision/193252...
    • 말이 된다고 봄
      이제 Stack Overflow를 쓸 이유가 문자 그대로 없음. LLM은 단점이 있어도 코딩 문제 답을 얻는 방식으로는 훨씬 낫음
  • “이 글은 고맙지만 여기서 단어 선택이 잘못됐고, 같은 단어가 일부 들어간 다른 답변 13개가 있지만 실제 질문에는 답하지 않으므로 삭제됐습니다. 그리고 이 글이 남아 있으면 제 빗나간 답변 조회수가 줄어듭니다” 같은 식이었음
    그 포럼이 죽은 이유는 하나만이 아님

    • Stack Overflow의 죽음이 논의될 때마다 다들 이 얘기를 하지만, 원래부터 그런 곳이었음
      엄격한 중재는 좋든 싫든 플랫폼의 일부였고, LLM이 코딩 Q&A 포럼 필요성을 99.9% 없애지 않았다면 그런 방식으로도 훨씬 오래 갔을 수 있음
    • 내가 이해하기로는 그들은 Google 검색 최적화를 원했음
      그래서 “정준” 답변이 필요했고, 이게 장기적으로 사이트를 죽였음
      단기적으로는 아주 잘 먹혔고, 창업자들은 마땅히 큰돈을 벌었음
    • 나도 동의함
      다만 1년쯤 전에 질문을 몇 개 올렸는데 응답이 전혀 없었음
      SO를 떠난 건 질문하는 사람만이 아니라 답하는 사람들도 마찬가지임. 닭과 달걀, 즉 네트워크 효과의 역전 문제일 수 있음
    • 잘못된 중재가 StackOverflow를 죽이지는 않았더라도, 적어도 사이트를 지지했을 사람들에게 잃을 가치가 없다는 느낌을 줬음
  • LLM은 디버깅이나 헬프데스크성 작업에서는 느린 인간 지원보다 낫고, 애초에 그런 질문은 SO에서 환영받지도 않았음
    Stack Overflow는 여전히 정준 질문, 여러 답변, 공개적이고 검색 최적화된 인간 간 토론에는 훌륭함
    하지만 사모펀드가 18억 달러 투자를 100배로 만들려는 회사로서는 그 정도로 충분하지 않을 것임
    언젠가 고전적인 Q&A 사이트가 손실 처리되고, 원래 Q&A 사이트를 보존하는 데 관심이 있으며 성장이나 변신을 원하지 않는 Wikimedia 같은 재단으로 분리되면 좋겠음

    • 나쁜 영화 대사를 바꿔 말하면, Q&A 사이트가 18억 달러를 왜 필요로 하나 싶음
      Wikimedia 같은 재단이 원래 목표를 보존하는 가장 좋은 방법이라는 데 동의함