Claude Code 창시자, 소프트웨어 엔지니어의 종말을 말하다 [유튜브]

(youtube.com)

11P by GN⁺ 19시간전 | ★ favorite | 댓글과 토론

에이전트형 코딩 도구 Claude Code는 코드 작성 자체보다, 제품을 만들고 업무 흐름을 재구성하는데 더 큰 변화를 일으킴
Microsoft 업무 AI 사용자 조사에서는 빠른 AI 채택 압박, 새 작업물 생성, 더 가치 높은 업무 시간 증가가 함께 나타났지만, AI 실험 보상은 낮은 수준에 머묾
조직이 단순 사용량을 목표로 삼으면 토큰 리더보드와 사용량 부풀리기가 생기며, AI로 가치를 더하는 방식과 연결된 지표가 더 중요함
Boris Cherny는 엔지니어 직함이 builder에 가까운 역할로 바뀔 수 있고, 비엔지니어도 코드를 만들며 엔지니어는 직접 타이핑보다 판단·계획·사용자 이해에 더 집중하게 된다고 봄
AI 생산성 향상은 노동시간 감소나 일자리 감소로만 이어지지 않으며, 기업은 워크플로를 AI 중심으로 재구성하고 개인은 더 큰 선택지와 레버리지를 갖게 됨

AI 업무 데이터와 조직 지표의 함정

Microsoft가 실제 업무에서 AI를 쓰는 사용자 20,000명을 조사했으며, "전환 역설(transformation paradox)"이라 부르는 현상이 나타남
- 65% 는 AI를 빠르게 채택하지 않으면 뒤처질까 걱정함
- 58% 는 1년 전이라면 만들 수 없었을 작업물을 AI 덕분에 만들고 있음
- 66% 는 AI 덕분에 더 가치 높은 업무에 시간을 쓰게 됐다고 응답함
- 반면 AI 실험에 대해 직장에서 보상받는다는 응답은 13% 에 그쳐, 사용 의지와 조직 사이에 간극이 존재
별도 Microsoft 연구에서는 관리자가 AI 사용을 직접 보여주면 사용이 17% 늘고, 에이전트 신뢰도가 30% 상승
- "AI가 미래다"라는 식의 구호보다, 관리자가 자신이 실제로 쓰는 구체적 방식을 보여주는 쪽이 결과를 냄
- 직원이 AI로 높인 생산성의 성과를 함께 나눌 수 있다고 믿으면 사용 동기가 달라질 수 있으나, 그렇게 금전적으로 보상하는 곳은 거의 없음
일부 직장은 토큰 비용을 보조하지만, 그 지원이 늘 좋은 결과로 끝나지는 않음

토큰 맥싱 — 사용량 지표의 부작용

주요 기술 기업에서 토큰 맥싱(token maxing), 즉 사용량을 늘리려 토큰을 과도하게 소모하는 현상이 발생
- Amazon 직원들이 Financial Times에 전한 바로는, Amazon이 OpenClaw에서 영감을 받은 내부 도구 mesh claw를 도입하고 사용을 장려
- 팀 내 토큰 사용량 순위표가 있어, 일부 직원은 생산적이지 않은 에이전트를 의미 없이 돌려 사용량을 끌어올림
- Meta에서는 최대 사용량이 수천억 토큰 규모였고, 수백만 달러 비용에 해당하는 양이 사실상 낭비됨
Amazon 공식 입장은 토큰 사용량이 관리자 평가 지표가 아니라는 것이지만, 직원들은 관리자가 본다고 여겨 원시 사용량을 늘림
- Amazon에는 개발자 80%가 매주 AI를 사용하게 한다는 상부 목표가 존재
- 구체적 보상이 없으면 "AI를 쓰라"는 문구만 지키고 "업무를 더 잘하라"는 본래 취지를 놓침
- 개발자에게는 모호한 추적 방식보다, 가치 창출과 연결된 생산적 지표가 명확히 필요

Claude Code의 탄생과 빠른 확산

Claude Code는 Anthropic이 전년 5월 출시한 에이전트형 코딩 도구로, 단어를 입력하면 코드를 내놓는 도구
- 출시 8개월 안에 GitHub에 올라간 전체 코드의 약 4% 를 담당
- 그해 2월 연간 매출 실행률 25억 달러에 도달, 그 수준에 가장 빠르게 도달한 기업용 제품
- 창시자 Boris Cherny는 컴퓨터과학 학위 없이 경제학을 전공, 18세에 대학을 중퇴하고 스타트업을 운영했으며 헤지펀드를 거쳐 Meta에서 수석 엔지니어로 5년 근무 후 2024년 말 합류
- 현재 Cherny는 코드를 직접 한 줄도 쓰지 않으면서, 5개 터미널 탭에서 에이전트 5개를 병렬 실행해 하루 20~30개의 풀 리퀘스트를 처리
코딩 도구를 만들라는 임무가 아니라 API를 익히려다 사이드 프로젝트로 시작
- 초기에는 Claude를 AppleScript에 연결해 자신이 듣던 음악을 보여주는 단순한 형태
- 두 달 안에 Claude Code 버전이 나왔고, 첫날 Anthropic 엔지니어링 팀의 20% 가 사용
2024년 9월 합류해 아주 작은 labs 팀에 소속
- 이 팀이 Claude Code, MCP, skills, 데스크톱 앱을 만들었으며, 성공 여부를 알 수 없는 실험적 아이디어가 많았음
- Anthropic은 기업용·코딩·안전성에 집중해 왔고, 제품을 만든다면 더 나은 코딩 모델과 안전성 연구에 모두 도움이 되는 코딩 제품이 합리적이라 판단
당시 코딩 제품은 대부분 IDE 확장이었고, Sonnet 3.5 수준에서는 고급 자동완성에 가까웠음
- 모델은 할 수 있으나 그 능력을 끌어내는 제품이 없는 모델 오버행(model overhang) 을 체감, 이 느낌은 지금도 동일
- 별도 UI나 앱 없이 터미널에서 돌아가는 가장 저렴한 형태로 며칠 만에 제작
- 주변부터 사용자가 퍼져 몇 주 만에 사내 다수가 매일 사용, 출시 5일 안에 엔지니어링 팀 절반이 사용
- 터미널을 꺼리는 엔지니어조차 사용했고, Cherny는 "소프트웨어 엔지니어링이 영원히 바뀌었다"를 분석하기보다 출시에만 집중

엔지니어는 사라지는가 — 역할의 혼합

첫 번째 충격은 Claude가 듣고 있던 음악을 알려준 순간
- 질문에 Claude가 음악 플레이어를 여는 AppleScript 코드를 작성했고, Cherny는 그 언어를 몰랐으며 그런 식으로 답할 생각도 못 했음
- 엔지니어가 택하지 않았을 방식으로 문제를 해결
모델이 매우 빠르게 발전해, 모델 위에 제품을 만들 때 매달 재조정이 필요
- Co-work로 항공편 8개와 호텔 5개를 예약, 유일한 실수는 1박 약 5,000달러짜리 호텔이라 예산 초과 → 해당 건만 재예약
추세는 지수 곡선이라 누구도 정확히 알 수 없으며, 두 가지가 동시에 일어남
- 엔지니어 생산성이 높아져 같은 일에 더 적은 엔지니어가 필요한 기업
- 한 명당 생산성이 높아져 더 많은 제품·사업을 벌이며 더 많은 엔지니어가 필요한 기업 (Cherny 팀은 좋은 엔지니어 부족에 계속 막혀 최대한 빠르게 채용 중)
역할이 흥미롭게 섞이는 중
- 매니저 Fiona는 15년간 코딩하지 않았지만 합류 후 코딩, 프로덕트 매니저 Cat과 디자이너 Megan 등 팀 전원이 코딩
- 비엔지니어는 코드를 조금 더 쓰고, Cherny 같은 엔지니어는 6개월 넘게 코드를 직접 쓰지 않으면서도 하루 종일 무언가를 만듦
- 빌더·엔지니어·프로덕트 매니저 중 무엇이라 부를지는 불확실하나 역할 자체는 분명히 변화

트랙터 비유 — 기술 확산의 시간

트랙터는 1890년대 Iowa에서 John Frick이 발명했지만, 미국에서 트랙터가 말보다 많아진 것은 1960년대로 약 70년이 걸림
- 트랙터는 수확량과 생산성을 크게 높였으나, 사용법을 배우는 훈련이 필요했고 초기엔 비싸 말이 더 쌌음
- 성능도 부족해 밀에는 써도 옥수수에는 못 쓰는 식이었고, 다양한 작물에 맞추는 데 오랜 시간이 걸림
- 현재 AI 전환은 같은 문제들이 초고속(speedrun) 으로 일어나는 상황
이는 평범한 기술(AI as normal technology) 관점과 연결 — 매우 유능한 모델이 나와도 사람과 조직의 변화는 느림
- 다만 Anthropic의 매출 추이를 보면 이번엔 그 속도가 빠르다는 반론도 존재해, 실제 변화 속도를 가늠하는 단계
컴퓨터는 생산성을 높이지만, 그것이 곧 노동시간 감소를 뜻하지는 않음 — 같은 시간에 더 많은 일을 하게 됨

코딩은 "해결"되었는가

"coding is solved"는 "내가 하는 종류의 코딩"에 한정된 표현
- Cherny의 작업물인 cloud CLI, 데스크톱 앱, 모바일 앱은 비교적 새롭고 단순한 코드베이스
- 반면 NASA 같은 대형 고객의 크고 복잡한 코드베이스에서는 아직 해결되지 않았고, 모델도 완벽하지 않아 실수함
엔지니어의 반론(코딩은 타이핑이 아니라 판단·감각·비판적 사고이며 에이전트가 약함)은 타당
- Cherny의 예전 하루도 약 50%만 실제 코드 타이핑, 나머지는 사용자 대화·브레인스토밍·디버깅·설계·계획
- 모델이 코딩을 맡으면 엔지니어는 사용자와 대화하고 다음을 구상하는 더 즐거운 일로 풀려남
Claude Code는 6개월 넘게 100% Claude Code로 작성되었고, Co-work 등 다른 제품도 마찬가지
- 최신 Y Combinator 배치 대담에서 "코드 100%를 Claude Code로 작성"에 수백 명 중 절반이 손을 들었고, "모델로 전혀 작성하지 않는다"에는 단 한 명, 나머지는 50~100% 사이
- 엔지니어링의 변화는 엔지니어링 밖 모든 분야의 선행 지표라고 봄
역량 위축 우려와 프로그래밍의 변천
- 직접 코드를 쓰지 않으면 자기 직업에 대한 이해가 퇴화(atrophy) 할 수 있다는 우려가 제기됨
  - 팀의 엔지니어 Lena는 즐거움을 위해 주말마다 손으로 C++을 작성하며, 이런 여지는 늘 존재함
  - Cherny는 이를 위축이 아니라 프로그래밍이 늘 변해 온 흐름으로 봄
    - 소련 시절 천공 카드, 아폴로 프로그램 시기의 종이 위 수작업 계산도 당시엔 "프로그래밍"이었음
    - 이후 기계어 → 어셈블리 → JavaScript·Python으로 바뀌었고, 이제는 에이전트와 대화하는 방식으로, 곧 에이전트가 에이전트에게 말해 코딩하는 방식으로 한 번 더 변화 예상
  - 공학용 계산기로 수학 실력이 일부 퇴화해도 계속 계산기를 쓰는 것과 같으며, 다만 그 도구가 초지능이 되어 은밀히 사용자를 약화시키는 상황은 다른 문제
모델 성능 퇴보 논란
- 새 모델 출시 후 "성능이 크게 퇴보했다"는 반발이 주기적으로 나타남
  - 실제 버그로 인한 사례가 2건 있었고, Anthropic은 원인과 수정 내용을 블로그에 공개
  - 그 외 대부분은 허니문 기간처럼 모델에 익숙해지며 처음의 경이가 무뎌지는 현상일 가능성
- 1년 전과 달리 지금은 모델의 코드가 Cherny가 직접 쓸 코드보다 우수
  - 과거엔 한 줄씩 세 번 검토해야 했지만, 지금은 Claude에게 맡기고 결과를 다시 점검·테스트하게 하며 동시에 15개의 Claude를 병렬 실행

생산성 역설과 선택의 확대

생산성이 올라도 노동시간이 줄지 않는 것은 상당 부분 개인의 선택과 기업의 상황에 달려 있음
세탁기 일화로 설명
- 세탁기 이전에는 한 번 빨래에 5~6시간이 걸리고 약 3,000ft를 걸어야 했으며, 불 피우고 물 끓이고 빨래판에 문지르고 짜는 일을 가족 수만큼 매일 반복
- 세탁기는 한 번 빨래 시간을 약 3시간 단축
- 이는 여성의 대규모 노동시장 진입을 가능케 한 요인 중 하나
- 절약된 시간은 아이와 보내기, 산책, 독서, 친구 만나기, 혹은 공장·사무직 진입 등 개인의 선택지를 만들었으며, AI도 동일하게 선택을 넓힘
CS 학위를 막 마친 22세에 대한 조언: 신입 일자리는 여전히 존재하지만, 조금이라도 창업 지향이라면 스타트업 창업을 권함
- 역사상 창업하기 가장 좋은 황금기이며, "당신과 에이전트들"이 거대한 회사를 만들 수 있음
- 실제로 1~3인이 10억 달러 규모 회사와 뛰어난 스타트업을 만드는 중이며, 한 사람의 레버리지가 막대
3년 뒤에는 "엔지니어"라 부르지 않을 수 있지만, 코드를 쓰거나 에이전트로 코드를 만드는 사람은 오늘의 100배가 될 것이라는 전망

Claude Co-work — 비엔지니어를 위한 확장

Co-work는 사람들이 세금 신고를 하려고 터미널에 Claude Code를 설치하는 등 코딩 아닌 용도로 쓰는 모습을 보고 시작됨
- 회계·재무·법무는 물론, 항공편 예약, 콘서트 티켓 구매, 워싱턴주 조개잡이 허가 구매까지 다양한 비엔지니어링 업무에 사용
- 코딩 제품은 엔지니어가 자신을 위해 만든 것이 남에게도 유용했지만, Co-work는 비엔지니어 전반을 위해 만드는 새로운 도전
장시간 실행 능력이 핵심 방향
- 약 1년 반 전 Claude Code는 모델 한계로 30초만 지나도 경로를 벗어나 개입이 필요했음
- 지금은 매일 밤 수백~수천 개의 에이전트가 5·10·20시간씩 실행되며, 이것이 현재의 엔지니어링 방식
- Co-work도 같은 방향으로 가겠지만, 어떤 업무에 그토록 긴 실행이 필요한지는 아직 불명확
메모리와 사용자 이해가 좋아지면 필요를 미리 예측하는 방향으로 발전
- 예: 남은 팟캐스트 회차와 미섭외 게스트를 파악해 후보를 브레인스토밍하고, 초기 연락 이메일을 임시보관함에 넣어 두는 식
- 업무 정의는 "디자인 전체" 같은 수평적 방식과, 특정 목표를 끝까지 수행하는 수직적 방식으로 나뉠 수 있음
- 수직 예시: Claude가 기능을 만들고 테스트·병합·출시까지 진행
Opus 4.7부터 Claude가 더 능동적으로 변함
- 기능 출시 뒤 12시간 후 사용자 피드백을 확인하도록 스스로 알림을 예약하고 버그가 있으면 고치려 함 — 사람이 잊기 쉬운 일을 미리 처리해 만족도가 높았음
Claude Mythos는 대부분에게 외부 공개되지 않았고, 공개된 정보는 주로 코딩과 사이버보안 성능 — 평소 도약보다 큰 점프이며 사이버·코딩에 특히 강함

일자리 대체의 책임은 누구에게

이 전환은 좋은 효과와 나쁜 효과가 섞이며, 정확한 시점과 비율은 예측 불가
- Anthropic은 소프트웨어 엔지니어 등의 실업 원천이 될 수 있는 독특한 위치
- 엔지니어로서 다가올 변화를 알리고 도구 사용을 교육해 함께 데려가야 한다는 강한 의무감을 팀과 자주 논의
이는 한 회사가 풀 수 있는 문제가 아니며, 한 회사가 푸는 것도 바람직하지 않음 (잘못된 해법이 될 수 있음)
- 사회 전체가 논의·토론해야 할 문제이며, Anthropic은 경제 보고서와 정책 논의, 관찰한 내용 공개로 기여
Anthropic이 안전성 연구소이면서도 제품을 만드는 이유 중 하나는, 사람들이 직접 경험해 이해하고 사회적 대응에 참여하게 하기 위함 — 기술을 잠가 두면 누구도 관점을 형성하기 어려움

파워 유저와 AI 격차

디지털 격차가 AI 격차로 바뀔 우려가 있으며, 지금까지 데이터는 AI를 가장 잘 활용하는 사람이 이미 소득 상위층에 가깝다는 점을 보여줌
- Anthropic에는 접근성을 넓히는 몇몇 프로그램이 있으나 구체적 이름·방식은 제시되지 않음
가장 큰 가치를 얻는 사용자는 예상과 다른 경우가 많음
- Opus 4.7 출시 해커톤 우승자는 대체로 전문 엔지니어가 아니라 전기기사·의사·목수가 앱을 만든 사례였고, 직전 4.6 해커톤에서도 동일한 경향
- 모델이 충분히 정교해져 비전문가도 잘 다루는 단계
대기업 도입의 핵심은 업무 프로세스를 바꿔 Claude를 중심에 두는 것
- 잘 작동하는 방식 하나는 모두에게 토큰을 주고 안전하게 실험하게 해, 예상치 못한 사람에게서 아이디어가 나오게 하는 것
- 최고의 아이디어는 선임 엔지니어가 아니라 구석의 회계 담당자나 GTM 담당자가 만든 내부 대시보드에서 나올 수 있음
- 오늘 도구를 가장 잘 쓰는 사람이 내일도 그렇다는 보장이 없으므로 모두가 도구 사용을 배우는 것이 중요

향후 1년 전망

내년에는 많은 혼란이 있고, 큰 플레이어들이 적응을 시도해 다수가 성공할 것
일부 전통적 비즈니스 해자는 약해지고 일부는 유지됨
- 네트워크 효과(사용자가 많을수록 가치 상승)는 AI와 무관하게 유지
- 규모의 경제(한계비용 하락)도 자연적 이점이라 사라지지 않음
- 반면 전환 비용은 약화 — Claude가 vendor A에서 B로 옮겨 줄 수 있다면 더 이상 큰 해자가 아님
- 사라지는 해자에 의존한 기업은 어려워지고, 다수는 새 해자를 모색
예상보다 훨씬 큰 혁신이 일어날 것
- 새로운 아이디어는 대기업이 아니라 1·2·10명 규모의 작은 스타트업에서 쏟아지고, 그 수가 폭발적으로 증가
- 소재 발견 스타트업 사례: 석기·철기시대를 지나 실리콘 시대에 이르렀다는 서사로, 새 소재를 찾으면 다음 시대로 진입한다고 보고 Claude로 가능한 분자·설계를 탐색
- 과거엔 자금 마련조차 어려웠던 일을 소수 팀이 20년 전엔 불가능했던 돌파구로 만들 수 있음
- 도메인을 잘 아는 사람이 "Claude 군대" 를 갖추면 인간 군대를 거느렸을 때보다 훨씬 많은 일을 해냄
Cherny는 X와 Threads에서의 사용자 응대를 자동화했지만 직접 하는 것을 선호
- Claude Code의 루프를 루틴으로 옮겨 30분마다 실행하며 Threads API·X API로 피드백을 수집
- 사용자와의 직접 상호작용이 가장 좋아하는 일이며, "작동하지 않는다"는 피드백조차 제품 개선의 원천
- Claude Code는 결함이 많고 이상적 제품과는 거리가 멀지만, 피드백을 듣고 매일 조금씩 개선하는 것이 좋은 제품을 만드는 유일한 방법

Claude Code 창시자, 소프트웨어 엔지니어의 종말을 말하다 [유튜브]

AI 업무 데이터와 조직 지표의 함정

토큰 맥싱 — 사용량 지표의 부작용

Claude Code의 탄생과 빠른 확산

엔지니어는 사라지는가 — 역할의 혼합

트랙터 비유 — 기술 확산의 시간

코딩은 "해결"되었는가

역량 위축 우려와 프로그래밍의 변천

모델 성능 퇴보 논란

생산성 역설과 선택의 확대

Claude Co-work — 비엔지니어를 위한 확장

일자리 대체의 책임은 누구에게

파워 유저와 AI 격차

향후 1년 전망

함께 보면 좋은 글 β

댓글과 토론