해커뉴스에서 AI가 언제부터 두드러지기 시작했나?
(zachperk.com)- 2025년 기준, 해커뉴스 상위 10개 포스트 중 3개가 AI 관련 내용임
- AI에 관한 관심은 ChatGPT가 아니라 GPT-4가 출시된 2023년 1분기부터 급증함
- 2021년 3분기에 Apple NeuralHash 이슈 등으로 AI 관련 글의 부정적 감정이 크게 늘어남
- 전체 AI 관련 글 중 52.13%는 긍정적, 31.46%는 부정적, 16.41%는 중립적 반응임
- 최근 분기에는 약간 부정적 경향이 커지고 있으나, 뚜렷한 장기 트렌드는 나타나지 않음
해커뉴스에서 AI 논의의 부상
2025년 현재, 해커뉴스 상위 10개 포스트 중 3개가 AI 관련 주제임
이는 많은 이들에게 놀라운 일이 아니지만, 언제부터 이런 현상이 시작되었는지에 대한 궁금증이 생김
특히 최근 부정적인 AI 관련 포스트가 1위를 차지하면서 이 질문을 조사하게 되었고, 조사 과정에서도 AI를 도구로 활용함
데이터 수집 및 분류 방법
- 해커뉴스 Big Query 데이터셋을 활용해, 2019년 1월 1일부터 2025년 8월 15일까지 상위 10개 스토리 총 24,910개를 수집함
- 개별 포스트 및 주요 댓글을 GPT-5-mini 모델에 입력하여 자동 분류 작업을 수행함
- Jina.ai reader로 웹페이지 내용을 LLM이 읽을 수 있도록 정리하고, 댓글까지 추가 입력하여 맥락 분석 진행함
-
OpenAI Batch API를 사용해 각 포스트에 대해 아래 세 가지 항목을 생성함
- Summary: 포스트가 어떤 내용인지 짧게 요약
- AI Mention: AI 관련 언급 여부 (True/False)
- AI Sentiment: 언급이 있을 경우 긍정, 중립, 부정으로 감정 분류
분류 데이터와 분석 결과
- 분석을 통해 AI 관련 논의가 2019년 이후 가장 높은 수준에 이르렀음
- 분기별 AI 관련 글 수가 꾸준히 증가하며, 2025년 3분기 중반까지의 추세라면 역대 최다 기록 예상임
-
AI 관련 포스트의 최초 대규모 증가는 ChatGPT(2022년 3분기)가 아니라 GPT-4(2023년 1분기) 출시 시점에 발생함
- 해커뉴스 이용자 다수가 개발자이므로, 개발 도구로서의 GPT-4 공개가 더 큰 영향을 미침
AI 관련 감정 변화 및 주요 사건
- 감정 변화에서 두드러진 시점은 2021년 3분기임
- 해당 기간 Apple의 NeuralHash(온디바이스 CSAM 스캐닝) 발표로 인해 프라이버시 논란이 대두되면서 부정적 감정이 급증함
- NeuralHash 모델의 충돌 및 개인정보 문제 등이 부각됨
- 같은 분기 초에는 GitHub Copilot 연구 프리뷰가 공개되어, 저작권 코드 자동 생성 이슈로 또 다른 논란이 있었음
전체 통계 및 최신 경향
- 총 2,816개의 AI 언급 포스트 중
- 52.13%가 긍정적 감정
- 31.46%가 부정적 감정
- 16.41%가 중립적 감정으로 분류됨
- 2025년 3분기와 그 이전 분기는 약간 더 부정적인 경향이 나타났으나, 명확한 장기적 변화는 아직 감지되지 않음
- 요약: 해커뉴스가 AI를 본격적으로 받아들인 계기는 소비자용 ChatGPT가 아니라, GPT-4가 개발자 도구로써 공개된 시점임
- 2021년 NeuralHash 사건 이후 전체적인 AI 감정은 큰 변화 없이 대체로 안정적으로 유지되었음
Hacker News 의견
-
내가 이번 글에서 인상 깊었던 점은 인용된 다른 글을 프레이밍하는 방식이었음
"지난달 Hacker News에서 이슈가 됐던 다소 부정적인 글이 이런 질문들을 촉발했고, 그래서 AI를 이용해 답을 찾아봤음"<br>
인용된 다소 부정적인 글은 https://tomrenner.com/posts/llm-inevitabilism/ 이고, 나는 직접 읽어봤을 때 꽤 균형 잡힌 글이라고 느꼈음
AI에 대해 직접적으로 강하게 부정하는 발언이 있진 않았고, 저자가 걱정하는 부분이 있긴 하지만 요지는 AI에 대한 현재의 담론을 그대로 받아들이지 말고, 우리가 진짜 원하는 미래가 무엇인지 먼저 질문해보라는 것임
만약 확신이 없다면 충분히 할 수 있는 질문이라고 생각함
그런데 이 글이 "매우 부정적인 글"로 규정되어 있는 것이 신경 쓰였고, 이 때문에 글쓴이의 나머지 기사도 다르게 읽히게 됨-
Hacker News에서는 "부정적"이란 게 뭔지 신기함
뭔가를 공손히 의심만 해도 부정적이라고 하고, 비판하면 부정적, 누군가 오해할 만한 방식으로 묘사해도 부정적이라고 여겨짐
무조건 열광적으로 칭찬하지 않으면 전부 구박받는 분위기임
점점 "긍정적인 말만 허용"되는 곳이 되어가는 느낌임 -
나도 똑같이 느꼈고, 인용된 글도 "매우 부정적인 글"로 볼 수는 없다고 생각함
-
이 다소 부정적인 글에 대해 여기서도 논의됐었음:
https://news.ycombinator.com/item?id=44567857 -
"원하는 미래가 진짜 그게 맞나 의문을 먼저 던져야 한다"
tom(저자)은 당신을 속인 것임
그의 글은 자극적 click bait 성향임
AI는 우리가 쓰고 논의하는 도구일 뿐, 그저 "떠밀려오는 미래"가 아님
그 글은 AI에 대해 실제로 아무 말도 하지 않고, 막연한 의심만 던지며 사람들을 불필요하게 대립하게 만듦
AI 논의를 망치는 거대한 장애물임
-
-
기사 자체보다 오히려 명확히 AI 기반으로 추정되는 댓글들이 더 거슬림
기사야 무시하면 되는데, 댓글들은 훨씬 피하기 어려움
그래서 HN에 차단 기능이 있었으면 좋겠다는 생각을 하게 됐음
커뮤니티가 이제는 충분히 커졌다고 보고, 이런 기능이 생기면 내 경험이 훨씬 나아질 거라 생각함-
약간 덜 관련된 얘기지만 HN에서 내가 가장 바라는 기능은 내가 좋아요/업보트한 글과 댓글을 검색할 수 있는 기능임
수백, 수천 개의 글/댓글에 좋아요를 눌렀는데, 그 모든 콘텐츠 내에서만 검색할 수 있다면 웹상의 보석을 훨씬 쉽게 찾을 수 있을 것임 -
나는 Hacker News 익스텐션에 유저 음소거 및 주석 기능을 추가함
https://soitis.dev/comments-owl-for-hacker-news -
그래서 나는 사람들이 API로 만든 HN 리더 앱이 세상에서 제일 쓸모없다고 생각함
항상 스스로 "디자인 예쁘고 군더더기 없음"이라고 홍보하는데, 정작 유용한 기능은 하나도 없음
만약 특정 키워드 기반으로 포스팅/스레드를 필터링하고 차단할 수 있는 기능이 있다면 유료로라도 쓸 수 있음
하지만 내 입장에서는 기본 HN 사이트가 이미 충분히 좋아서 직접 만들 생각도 없음
-
-
HN 프론트페이지에서 인기 끌다가 금방 사라진 주제들 — 예를 들어 암호화폐, NFT, Web3, 자율주행차 등 — 에 대해서도 비슷한 데이터 분석을 해보면 재밌을 것 같음
근데 실제로 보면 자율주행차나 암호화폐는 실세계에서는 계속 크게 진전되고 있는데도, 프론트페이지에서는 더는 거의 이야기 안 됨
AI가 그만큼 다른 모든 주제를 압도하고 있다는 뜻이고, HN 유행이 얼마나 변덕스러운지 보여주는 증거 같음-
암호화폐가 정말 그렇게 드라마틱하게 발전하고 있는지 의문임
이 현상의 예시일 수 있겠지만, 줄곧 큰 변화에 대한 뉴스도 못 봤음
그냥 "선그리프 올라가는" 현상 정도임 -
사실 그게 자연스러움
기술은 흥미로울 때만 이슈가 되기 때문임
암호화폐에는 이제 의미 있는 진보가 아니고, 대부분 사기와 폰지구조 얘기만 남아서 뻔하고 지루해졌으니 HN에서도 관심이 식었음
자율주행차도 수년간 점진적으로 느리게 발전한 주제라 '곧 세상이 바뀐다' 이런 흥분이 사라진 다음엔 별 얘깃거리가 없음
그에 비해 AI는 지금 "2년 안에 신(God)을 만들 것", "전 지구적 실업 발생", "영구적 하위계층 탄생", "AI 연구자 연봉이 1억~3억 달러"라며, 극단적이고 흥미로운 주장에 양 극단의 의견이 붙는 주제임
만약 이 분야가 점점 식고 뻔해진다면, 코인처럼 댓글 수도 줄어들 거라 봄 -
최근 구직할 때, 정규직/원격/AI/비AI 직무를 정규표현식으로 분류하는 크롤러를 만들어 봤음
나는 새롭게 뜨는 스타트업보다 "지루한" 직장이 더 필요했는데, 워낙 번쩍이는 트렌디한 일자리 공고로 도배되어 있어서 체감상 애로사항이 있었음
참고로 결과물을 공유함:<br> -
요즘 암호화폐 기술과 생태계 현황이 궁금함
옛날엔 이 분야에서 잠깐 일해봤지만, 툴이 너무 형편없었고 금융 이외의 응용은 전부 장난감 수준 같아서 떠났었음
그래도 탈중앙 소프트웨어에는 계속 긍정적 전망을 갖고 있음 -
다음 기회엔 내가 한번 시도해봐야겠음
-
-
이 데이터는 멋지지만, 이번 AI 붐과 2015~2018년 즈음 빅데이터/AI 붐이 어땠는지 비교해보고 싶음
그때도 이유 없이 앞다퉈 자신들을 AI라 부르는 곳이 많았고, 데이터 과학자 아니면 직장을 못 구할 거란 불안감이 있었음
그 붐이 지금과 얼마나 다르고 컸는지 비교하기 어렵지만, 지금은 자본 규모가 훨씬 커서 전체 규모는 오히려 덜할 수도 있을 것 같음
데이터셋을 더 넓혀서 댓글 파도 효과가 있는지 보는 것도 흥미로울 듯함- 내가 그 당시 제일 재밌었던 사례는 "The Grid"라는 웹사이트 빌더였음
엄청난 홍보를 했지만 대중에게는 실제 제품이 없었고, 비공개 베타 사용자들이 "제품이 있긴 있지만 별로임"이라고 평가했음
사이트 만드는 데 한참 걸리고, 결과물도 다들 비슷하고, 코드 품질도 안 좋았음
10년이 지나도 그때 지적된 문제들이 아직도 이어지는 느낌임
- 내가 그 당시 제일 재밌었던 사례는 "The Grid"라는 웹사이트 빌더였음
-
며칠 전 한 시점엔 프론트페이지 상위 10개 기사 모두가 AI나 LLM 관련이었음
물론 자주 있는 일은 아니지만, 이 열풍은 멈추기가 힘듦-
난 이걸 습관적으로 세는 편인데, 보통 상위 10개 중 4~6개가 AI 관련임(지금은 5개)
그 날은 9개였고, 한 주제에서 이렇게 많은 비중이 고정적으로 유지되는 것 자체가 너무 신기함 -
이 사이트는 개발자 타겟임
지금 AI/LLM 열기는 그저 ‘하이프’라기보다는 개발자들(SWE) 입장에서는 ‘공포의 싸이클’에 더 가까움
사람들의 손실회피 경향 때문에 공포 싸이클이 하이프보다 훨씬 더 오래 가고 몰입도를 높임
여기 있는 많은 이들이 솔직하게 말한다면, AI가 내 커리어나 생계, 앞으로 내 미래에 어떤 의미일지 고민 중임
특히 아직 경제적으로 안정되지 않은 분들은 ‘기술자 수요가 진짜 줄 수도 있다’는 두려움이 높아짐
창업자/VC/사업가/자본 소유자에게는 오히려 하이프임
장기적으로 봤을 때 LLM이 암호화폐, NFT, 기타 유행보다도 소프트웨어 수요가 늘어나도 기술자 수요는 줄어드는 첫 기술이 될 수도 있음
AI 랩들이 '코딩 자동화'를 킬러 앱으로 보는 것도 영향이 큼
원래 기술의 하이프 싸이클은 종종 있었지만, 이렇게 ‘공포 싸이클’이 오는 경우는 진짜 드묾
마치 헤드라이트 앞으로 달려드는 사슴처럼, 다들 위협과 관련된 모든 정보를 찾아 헤매고, 다른 주제에 관심을 둘 겨를이 없어짐
요약하면 지금의 불안/기대, 그리고 변화의 속도가 유지되는 한 열풍은 사라지지 않음 -
나도 똑같이 느꼈고 솔직히 짜증나는 쪽임
그런데 사실상, 지금까지 인류가 이렇게까지 돈/노력/관심을 한 주제에 쏟아부은 적이 없는 것 같음
사실상 AI 열풍은 고대 검투 경기장 가서 전쟁 포로들 싸움을 구경하는 것만큼 짜릿한데, 차이점은 검투사들이 언제든 경기장 밖으로 나와 관객을 찌를 듯한 스릴이 있다는 점임
뒤에서는 누군가 "저 근육 멋지다, 언젠가 저 근육이 도로 건설에 쓰일 거다"라는 소리를 하기도 함
이런 열광을 지나칠 수가 없음
-
-
조금은 개인적인 경험이지만, 기사에서 ChatGPT로 감성 분석을 했다는 점이 있음
내가 보기엔 ChatGPT는 미묘한 뉘앙스에서는 실제로 사람이 “부정적”으로 느낄 부분도 “긍정”으로 잘못 판단(환각)하는 경향이 있는 것 같음
다만 더 노골적인 표현을 넣었을 때의 편향은 안 실험해봄 -
요즘 HN이 AI 주제로 넘쳐나고 있는 게 궁금했음
나는 이미 지겹고, 페이지 볼 때마다 거의 모든 AI 글은 그냥 “숨기기” 버튼을 누르고 있음-
심지어 AI 관련 글이 아니라도, 댓글란에서는 어떻게든 AI 화제로 얘기를 돌리는 경향이 있음
피곤함 -
만약 AI가 내 과거 선택에 기반하여 자동으로 관련 기사들을 숨겨준다면 진짜 좋겠음
-
-
모든 YC 스타트업이 AI로 피벗하고, 신규 선발된 거의 모든 기업이 다 AI임
-
나는 이번 분석이 명백히 AI로 생성된 기사들에 대한 분석일 줄 알았음
최근에는 상위 포스트에서 AI 생성된 글의 비율이 점점 늘어나는 느낌임
대부분 즉시 스킵함
실질적으로 진짜 그런 비율인지 데이터로 직접 확인해보고 싶음