StackOverflow 질문 수의 월별 변화 추이
(data.stackexchange.com)- StackOverflow의 월별 질문 수 변화를 시각화한 데이터 쿼리 페이지
- 서비스 초기인 2008년도에 약 월별 수천~1만개에서 시작, 2014~2018년에 약 15~20만개의 질문이 등록되며 2019년을 기점으로 월별 질문 수가 정점에서 하락세로 전환됨
- 2023~2025년 사이 감소 폭이 더욱 커지며, 2025년에는 월 질문 수가 약 1만 건 수준까지 하락함
- 이는 전성기 대비 약 90% 이상 감소한 수치
Hacker News 의견들
-
예전에 내가 타원과 점 사이의 최단 거리를 구하는 방법을 Stack Overflow에 올린 적이 있음
내 답변 링크
내가 만든 알고리즘으로, 몇 줄 안 되는 코드지만 매우 빠르게 수렴함. 이게 내 인생에서 가장 아름다운 코드라고 생각함
예전엔 이걸 인용한 논문도 있었고 Unity의 충돌 플러그인에도 쓰였다고 들었음. 지금은 아무도 연락하지 않음
요즘은 이걸 어디에 올려야 할지도 모르겠음. 논문으로 쓰기엔 애매하고, 예전엔 SO가 이런 걸 올리기 좋은 곳이었는데 이제는 그런 중앙 저장소가 사라진 느낌임- 논문으로 써서 arXiv에 올리거나 블로그에 정리할 수도 있음
나도 예전에 SO에서 EKF가 singular 상태로 가는 걸 막는 트릭을 올렸는데, 교수님이 그걸 보고 나를 알아봤다고 함. 그런 커뮤니티는 대체하기 어려움 - 블로그를 꼭 시작하길 권함. Hugo + GitHub Pages 조합이면 정말 간단함
설령 글이 적더라도, 세상은 그런 개인 블로그들로 채워져야 풍성해짐 - 하지만 핵심은 ‘어디에 올릴까’보다, 이제는 기술적 질문 자체가 공개적으로 던져지지 않는 시대라는 점임
그렇다면 기술자들이 창의력을 발휘할 문제를 어디서 찾을 수 있을까 하는 고민이 생김 - 그래도 정식으로 저널에 제출하는 것도 방법임. 비공식적으로만 존재하는 것보다 낫다고 생각함
- 나도 2012년쯤 SO에 엄청 활동했음. 지금도 구글 검색하다 보면 내가 쓴 답변이 상위에 뜨고, ‘이거 내가 쓴 거였네’ 하고 놀람
- 논문으로 써서 arXiv에 올리거나 블로그에 정리할 수도 있음
-
이 그래프를 보고 정말 놀랐음. SO가 이렇게까지 급격히 쇠퇴했는지 몰랐음
브리태니커가 위키피디아 등장 9년 만에 종이판을 접은 것보다 더 빠른 속도임
나는 SO의 문제를 ‘거친 운영’ 때문이라고 보지 않음. 근본적으로는 사람들이 더 빠르게 답을 얻을 수 있는 다른 경로가 생겼기 때문임
2016년쯤부터 Reddit이 검색 결과에 자주 등장했고, Discord에서도 질문하면 답을 얻을 수 있었음
마지막 결정타는 LLM임. 이제는 SO 수준의 답을 즉시 받을 수 있음
그렇다면 앞으로 LLM은 무엇을 학습할까? 2014~2020년의 SO 데이터를 계속 재활용하게 될까?- 문서가 잘 정리되어 있고 LLM 친화적 포맷으로 제공된다면, 대부분의 질문은 LLM이 해결할 수 있음
예를 들어 API 문서가 세부 시나리오를 다루지 않아도, LLM은 여러 문서를 조합해 답을 만들어냄 - 앞으로는 대부분의 답을 LLM과의 대화로 얻게 될 것임
다만 Salesforce나 Workday 같은 특수한 생태계는 여전히 포럼이 더 유용함 - SO의 콘텐츠는 개발자들의 실전 경험과 시행착오에서 나왔음
앞으로는 LLM이 이런 경험을 대규모로 수집하고 재분배하는 역할을 하게 될 것임 - SO가 스스로 고품질 LLM을 만들지 못한 게 아쉬움
- 인간 간의 상호작용이 줄고, LLM이 그 데이터를 학습하면서 다시 인간 대화가 줄어드는 ‘죽은 인터넷’ 현상이 보임
- 문서가 잘 정리되어 있고 LLM 친화적 포맷으로 제공된다면, 대부분의 질문은 LLM이 해결할 수 있음
-
LLM이 등장하면서 SO의 문제들이 드러났음
질문이 부당하게 닫히거나, 오래된 답변이 업데이트되지 않거나, 상위 답변자들의 독선적 문화가 심했음
LLM은 이런 부분에서 훨씬 낫다고 느낌- 나도 LLM 이전에 이미 SO 활동을 중단했음. 독단적 운영이 너무 심했음
- 질문할 때마다 “그렇게 하면 안 된다”는 식의 불필요한 훈수가 많았음
- GitHub Discussions가 SO의 하락에 일부 영향을 줬다고 생각함
공개 베타 출시(2020) 이후 점점 더 많이 사용하게 됨 - 사실 질문 수 감소는 2014~2016년부터 시작됐음
- 구글이 더 이상 SO 답변을 상위에 노출하지 않던 시점도 있었음
-
최근 2주 동안 Spark 변환 문제로 고생했는데, Gemini와 Claude가 준 답은 그럴듯하지만 전부 틀림이었음
결국 SO에서 답을 찾아 해결했고, 그 덕분에 Spark 문서의 정확한 부분까지 도달했음
LLM은 친절하지만, 틀린 답을 자신 있게 말하는 친구 같음
반면 SO는 불친절하지만 실제로 문제를 해결해줬음- SO의 장점은 토론 구조임. 여러 사람이 의견을 주고받으며 최적의 답이 위로 올라감
LLM은 그런 인간 간의 논쟁과 경험의 깊이를 대체할 수 없음 - SO에는 단순한 답이 아니라 ‘왜’ 를 설명하는 훌륭한 답변이 많았음
- 하지만 결국 LLM도 인간의 입력을 학습하고, 그 경험이 모델에 녹아들어감
시간이 지나면 점점 더 정확해질 것임 - 물론 SO도 항상 정답을 준 건 아님. 어려운 문제는 답이 없거나 틀린 경우도 많았음
내 경우엔 LLM이 더 높은 정답률을 보임 - 그래도 Q&A 문화는 사라지지 않을 것임. GitHub Discussions 같은 대안이 있음
- SO의 장점은 토론 구조임. 여러 사람이 의견을 주고받으며 최적의 답이 위로 올라감
-
프로그래밍에서는 LLM이 여전히 압도적으로 빠르고 반응이 즉각적임
추가 정보를 주면 바로 수정하고, 문제를 완전히 이해할 때까지 반복함
게다가 비꼬는 사람도 없음 -
사람들은 이 하락을 AI 탓으로 돌리겠지만, 실제로는 커뮤니티의 독성과 사이트의 방향성 문제였음
중복된 댓글 링크- Stack Exchange의 스레드는 정말 독설적이었음.
하지만 어느 순간엔 이미 대부분의 질문이 답변되어 있었고, 구글이 바로 그 답으로 안내했음
LLM은 그 위에 올라탄 ‘마지막 조각’일 뿐임 - 독성보다 중요한 건 포화 상태였음. 기본적인 질문은 이미 다 답변되어 있었고, 새 질문은 중복으로 닫혔음
- 시간이 지나면서 중복 질문이 많아지고, 그게 통계에서 빠지니 감소가 더 커 보였을 수도 있음
2020년 CEO 교체 및 모더레이터 위원회 출범 - 실제 감소는 2017년쯤부터 시작됐고, 코로나 초기에 잠시 반등했음
- Stack Exchange의 스레드는 정말 독설적이었음.
-
SO가 독성이 있었다는 말엔 동의하지만, 그럼에도 불구하고 인터넷 개방형 지식의 위대한 성취였음
프로그래밍을 대중에게 열어준 영향력은 여전히 엄청남- 하지만 어떤 이는 “커뮤니티를 배신하고 돈을 택한 결과”라고 봄
-
데이터 분석가로서 보면, 질문 감소는 자연스러운 현상임
쉬운 질문은 이미 다 나왔고, 새로운 질문은 점점 어려워짐
이 그래프는 삭제된 글을 포함하지 않기 때문에 실제보다 적게 보임
실제 데이터 그래프
오히려 좋은 일일 수도 있음. 중복 질문이 20%나 되고, 검색만 잘해도 해결 가능한 게 많았음
다만 Discord 같은 곳으로 이동하는 건 나쁨. 지식이 사유화되고 검색되지 않기 때문임
그래도 SO의 데이터는 완전히 공개되어 있어서, 회사가 사라져도 복원 가능함 -
나는 2009~2010년 SO 초기에 활발히 활동했지만, 커뮤니티 운영자들의 과도한 간섭 때문에 떠났음
기여할 수 없는 사람들이 규칙을 무기로 삼아 영향력을 행사하는 현상이 있었음
이런 일은 모든 인기 기술 커뮤니티에서 반복됨. HN에서도 조금씩 보임 -
SO는 질문을 올리기조차 힘든 적대적인 환경이 되었음
6k 평판과 여러 금배지를 갖고 있었지만, 정당한 질문이 막히는 일이 많았음- 나도 2k 정도 평판이 있었지만, 질문 재개 투표를 하려면 3k가 필요했음
중복으로 잘못 닫힌 질문이 많았고, 결국 ‘그냥 죽게 두자’는 생각이 들었음 - 답변하려고 해도 너무 많은 사람이 몰려서 경쟁이 심했고, 기여의 재미가 사라졌음
- 25k 평판이었지만, 답변을 쓰면 바로 질문이 닫히는 일이 반복돼서 포기했음
SO는 ‘도움을 주는 곳’이 아니라 ‘데이터 정규화’를 우선시하는 문화였음
결국 그 문화적 충돌이 나를 떠나게 했음
- 나도 2k 정도 평판이 있었지만, 질문 재개 투표를 하려면 3k가 필요했음