우리 직장의 LLM 집단 망상
(blog.avas.space)- 자금난에 시달리는 직장에서 핵심 업무 예산은 깎이는데도 AI 도입에는 돈이 흘러가는 모순적 상황을 직접 겪은 경험 기록
- 수년간 보너스가 취소되고 인력·라이선스·데이터베이스가 삭감된 와중에 컨설턴트, LLM 워크숍, ChatGPT·Copilot 라이선스 비용은 즉시 승인됨
- 수백 명이 참여한 전사 회의에서 다양한 팀이 LLM 프로젝트를 시도했으나 단 하나도 성공하지 못함
- 발표된 일반 활용 사례가 봇에게 기분 묻기, 1페이지 점심 메뉴 요약, 의심 메일 ChatGPT 업로드 등 무의미하거나 위험한 수준에 그침
- 이 현상을 통제 불능의 집단 망상으로 규정하며, 리더십이 마음만 먹으면 가능했던 일들이 그동안 의도적으로 막혀 있었다는 신뢰 붕괴의 순간으로 평가
모순된 재정 상황과 AI 도입 배경
- 고용주는 만성적 자금난에 처해 있으며, 공석은 충원되지 않고 그대로 사라지는 구조
- 2년 전 우수 직원 보너스가 영구 취소됨
- 필수 자원이 삭감되며 "알아서 해결하라"는 통보만 전달됨
- 여러 부서가 인력 충원 없이 과로 상태이며 비용 절감을 위해 중요 라이선스와 데이터베이스 삭제됨
- 이런 배경 속에서도 AI 관련 지출만은 예외적으로 집행됨
- "올인" 권고하는 컨설턴트 고용 비용 확보
- 수년치 외부 LLM 워크숍·세미나 비용 확보
- ChatGPT와 Copilot 양쪽 라이선스 비용 확보
- 직원 보너스와 업무 지원 자금이 사기꾼, 보안 위험, 쓸모없는 워크숍, 기술파시스트에게 흘러간다고 지적
전사 LLM 프로젝트의 전면적 실패
- 부서별로 LLM 프로젝트를 등록·시범 운영 후 결과를 발표하는 반복 회의가 진행됨
- 모든 회의에 참석했으나 실제로 성공한 사례는 단 한 건도 없음
- 수백 명, 여러 팀, AI에 열성적인 사람들, 온갖 종류의 프로젝트가 시도됨
- 모든 프로젝트가 "작동 불가", "시간 절약 안 됨", "오히려 복잡해짐"으로 귀결됨
- 워크숍, "프롬프트 엔지니어링", 커스텀 GPT, 사전 준비 문서·템플릿으로도 재현 가능한 효과를 만들지 못함 (코딩 분야 아님)
- 매번 지저분한 도박이었으며, 미세 조정·반복·출력 검증·오류 수정에 상당한 시간 소요
- 특정 문서 미반영, 할루시네이션, 문서를 올바르게 채우거나 편집하지 못하는 문제가 최대 불만
- Enterprise 라이선스에서도 제약이 너무 컸음
무의미한 일반 활용 사례 시연
- 특정 프로젝트와 무관한 일상 업무용 일반 활용 사례 발표 회의도 존재
- 봇에게 "오늘 기분이 어때?"라고 묻는 기능이 진지하게 시연됨
- 농담이나 풍자가 아니라 미래적이고 인간적이라는 명목으로 발표됨
- 5년 전이었다면 수천 달러짜리 구독으로 봇과 무의미한 대화를 하자는 제안은 비웃음을 샀을 것이며, 그 반응이 여전히 옳다고 강조
- 인트라넷의 1페이지 구내식당 메뉴(엑셀 시트)를 ChatGPT에 올려 "수요일 점심이 뭐냐" 묻는 사례 시연
- 봇의 답변이 시트 전체를 읽는 것보다 길었음
- 다운로드·업로드·프롬프트 작성이 시트를 직접 읽는 것보다 오래 걸림
- 한눈에 확인 가능한 정보에 봇이 불필요함
- IT 책임자가 직접 제시한 사례로, 스팸·피싱·의심 첨부 메일을 데스크톱에 저장 후 ChatGPT에 업로드해 확인하라고 권고
- 기술에 익숙하지 않은 직원이 수상한 파일을 업무용 노트북에 저장하게 만드는 위험성을 지적
AI가 증폭시키는 더닝-크루거 효과
- AI가 사람들의 더닝-크루거 효과(Dunning-Kruger-Effect) 를 증폭시켜, 시도하는 모든 일이 더 똑똑하고 정당해 보이게 만듦
- 평범하고 무가치한 작업을 하면서도 중요하고 획기적인 일을 하는 것처럼 가장하게 됨
- 기술 옹호자들은 거대한 혁명의 일부라 느끼며 비판자들이 언젠가 사과할 날을 상상함
- 책임감 있고 유능한 사람들이 뚜렷한 이유 없이 AI 기업의 홍보원으로 변하는 현상을 우려
- 자격 있는 인물이 세제 효능을 거짓 선전하는 방문판매원 수준으로 전락함
순수한 하이프와 신뢰 붕괴
- 해결할 구체적 문제가 없고 직원의 최소 90% 가 Copilot 등으로 이득 볼 업무가 아닌데도 도입을 강행함
- 없는 곳에 문제를 만들어내며, 토큰을 소모하고 구독을 정당화하기 위한 시도가 반복됨
- 상부에 "적어도 시도는 했다"는 보여주기식 명분을 위한 행위로 규정
- 모든 사용이 "탐색"과 "놀이"라는 이유로 정당화되며, 시간 낭비·비용 낭비·배후 권력의 영향이 최소화됨
- AI 도입 속도에 대한 의문 제기
- 늘 돈이 없다던 곳에서 막대한 초기 비용의 불안정한 기술이 즉시 통과됨
- 공공 부문을 비껴가던 신기술이 이번엔 모든 주목을 받음
- 변화 도입에 수년~십 년이 걸리던 조직이 순식간에 AI 인프라와 조직 역량을 갖춤
- 이는 조직의 느린 변화가 기본값이 아니라 의도적 설계였음을 드러내는 "가면이 벗겨진 순간"
- 장애물이 본질적인 것이 아니라 임의적 거짓이었음이 폭로됨
- 직원에게 신뢰를 완전히 무너뜨리는 순간으로 작용
앞으로의 과제
- "진보"의 이름으로 존경받던 조직의 어른들이 스스로를 망신시킨 경험을 어떻게 잊고 넘어갈지에 대한 근본적 물음 제기
- 수개월간 반복적으로 가스라이팅당하는 듯한 문화가 형성되어, 스스로가 미친 것 아닌가 의심하게 만듦
- 이 경험을 잊을 수 없다고 밝히며 "나의 두 번째 코로나" 로 표현
- 마무리로, 이런 일이 없는 직장이라면 진심으로 다행이며, AI를 현명하게 활용해 좋은 결과를 내는 산업과 사람들에게는 박수를 보낸다고 언급
- 다만 위와 같은 상황이 실재하므로, 그 광기에 대해 함께 토로할 수 있도록 경험 자체를 부정하지 말 것을 요청
댓글과 토론
Lobste.rs 의견들
-
내 직장도 이 정도로 나쁘진 않지만 방향은 같음. 신규 채용이나 인상분에는 돈이 없는데, 비즈니스 컨설턴트, 거대한 엔터프라이즈 COTS 소프트웨어 라이선스, AI 구독에는 항상 돈이 있음
- 미국 기반 정부 조직에서 일하는 것 같음. 정부 말고는 COTS라는 표현을 잘 안 씀
약간의 빈정거림은 빼더라도, 정부보다 덜 굳은 조직에서도 “물건을 사는” 예산이 “직원에게 지급하는” 예산보다 얻기 쉬운 경우는 여전히 흔함
- 미국 기반 정부 조직에서 일하는 것 같음. 정부 말고는 COTS라는 표현을 잘 안 씀
-
글쓴이가 묘사한 건 경영진이 사업 운영에서 거의 치명적으로 무능한 상황임
글쓴이는 덜 무능한 경영진이 있는 새 직장을 찾아야 함. 그게 어렵다면 생존과 정신 건강을 위한 다른 조치를 해야 함- 몇 달 전 FAANG 친구들에게서도 꽤 비슷한 얘기를 들었음. 그때는 tokenmaxxing이 정책이던 시기였음
FAANG이 치명적 무능에서 자유롭다는 뜻은 아니고, “오, 이메일이랑 점심 메뉴를 요약해 준다고?!” 같은 분위기가 생각보다 훨씬 널리 퍼져 있다는 뜻임
- 몇 달 전 FAANG 친구들에게서도 꽤 비슷한 얘기를 들었음. 그때는 tokenmaxxing이 정책이던 시기였음
-
내 경험은 전체적으로 조금 더 긍정적인 편이라고 봄
- 무책임하게 쓰면 코딩 에이전트는 코드베이스를 망가뜨림. 작은 일회성 프로토타입이나 완전 쓰레기 같은 SaaS를 대체하는 경우엔 괜찮지만, 진지한 시스템에는 안 맞음. Claude Fable은 그저 훨씬 더 큰 난장판을 만들 뿐임
- 책임 있게 쓰려면 자기 절제와 적절한 사람이 필요한데, 그럴 경우 코딩 에이전트는 도움이 될 수 있음. 병목은 여전히 대부분 사람이 코드를 이해하고 이해관계자들의 눈높이를 맞추는 데 있어서 사람들이 생각하는 만큼 변혁적이진 않음. 그래도 전부 사라지면 조금 아쉬울 듯함. 이상한 벤더 API를 상대로 초안 테스트 코드를 직접 쓰고 싶진 않기 때문임
- 문서 데이터 마이닝 작업 상당수는 오류율을 받아들일 수 있다면 저렴하고 대량 처리 가능한 LLM의 이점을 확실히 봄
- 관리자는 합리적으로 저렴하고 잘 작동하는 AI 활용 사례를 좋아함
그런데 공항을 지나가다 경영진을 겨냥한 AI 관련 광고를 보면, 그래, 바깥 상황은 정말 심각함
- 어떤 면에서는 정적 타입 vs 동적 타입 논쟁이 떠오름. 적절한 팀과 충분한 경험이 있으면 Clojure 같은 언어로도 매우 생산적일 수 있지만, 사람들이 언어를 남용하고 영리한 척하기 시작하면 유지보수 불가능한 끔찍한 난장판이 될 수도 있음
LLM 사용도 그런 점에서 매우 비슷하게 느껴짐. 도구가 무엇을 할 수 있고 어떻게 효과적으로 적용할지 이해하면 실제로 시간을 절약해 주지만, 최대한 빨리 코드를 찍어내기만 하면 뚫고 들어가기 어려운 혼란으로 끝남