AI는 Anthropic의 업무를 어떻게 바꾸고 있는가

(anthropic.com)

35P by neo 3달전 | ★ favorite | 댓글 7개

Anthropic 내부 엔지니어·연구진 132명 조사에서 Claude 중심 AI 협업이 업무 방식 전반을 바꾸며 생산성과 업무 범위가 동시에 확장되고 있음
직원들은 업무의 59%에서 Claude를 사용하며 평균 50% 생산성 향상을 체감하고 있고, 산출물 양이 크게 늘어나면서도 시간 사용 방식이 재편되고 있음
Claude 덕분에 전체 Claude 보조 업무의 27%가 원래는 하지 않았을 일로 채워지며, 프로토타이핑·대시보드·테스트·문서화 같은 ‘미뤄두던 일’까지 처리되는 양상이 보임
한편 기술 역량 약화·멘토십 감소·코딩 공예 상실에 대한 우려도 함께 커지고 있으며, 사람은 점점 AI 에이전트 관리자·감독자 역할로 이동하는 흐름이 나타나고 있음
전체적으로 AI는 개발자를 ‘더 풀스택이고 더 많은 일을 하는 존재’ 로 만들면서도, 장기적인 커리어 경로·학습 방법·조직 문화에 대한 불확실성과 적응 필요성을 동시에 키우고 있음

개요

Anthropic은 AI의 노동시장 영향에 대한 기존 거시 연구에 이어, 이번에는 자신들의 엔지니어·연구자를 대상으로 AI가 실제 업무를 어떻게 바꾸는지 내부 조사를 수행했음
- 2025년 8월 기준 엔지니어·연구자 132명 설문과 53건 정성 인터뷰, Claude Code 사용 로그 데이터를 함께 분석한 연구임
- 분석 결과, 개발자들은 더 많은 일을 해내고 더 다양한 영역을 다루게 되었지만, 그만큼 기술 깊이·협업·커리어 미래에 대한 고민도 커지고 있음
Anthropic 엔지니어들은 Claude를 통해 더 풀스택에 가까운 역할을 수행하고, 학습·반복 사이클을 가속하며, 기존에 미뤄두던 작업까지 처리하고 있음
- 동시에, 이런 폭 확장은 깊이 있는 기술 역량 저하와 감독 능력 약화로 이어질 수 있다는 우려도 함께 존재함
Anthropic은 자신들이 최신 도구에 가장 먼저 접근하는 특수한 환경임을 인정하면서도, 이 내부 변화를 향후 더 넓은 사회·산업 변화의 전조로 보고 조기 관찰이 의미 있다고 보고 있음
- 연구 당시 가장 강력한 모델은 Claude Sonnet 4, Claude Opus 4였고, 이후 모델 성능은 계속 발전하는 중이라고 밝힘
전반적으로 생산성 증대·업무 확장과 함께, 기술 전문성 유지·의미 있는 협업 보존·불확실한 미래 대비라는 과제가 동시에 부각되고 있으며, Anthropic 내부에서도 이를 위한 시도들이 진행 중임
- 별도의 글에서 AI 관련 경제 정책 아이디어도 함께 논의하고 있으며, 이번 글은 주로 조직 내부의 일·역할 변화에 초점을 맞추고 있음

Key findings

설문 데이터 기준, Anthropic 엔지니어들은 Claude를 주로 디버깅과 코드 이해에 사용하고 있으며, 사용 비율과 체감 생산성 향상 폭이 1년 새 2~3배 수준으로 증가한 상태임
- 전체 Claude 보조 업무의 27%는 원래는 하지 않았을 업무로, 프로젝트 확장·대시보드·탐색적 실험 등 추가 작업으로 채워지고 있음
- 대부분의 직원이 Claude를 자주 쓰지만, 완전히 위임 가능한 업무는 0~20% 수준이라고 답해, 적극적인 감독·검증이 여전히 필수임
인터뷰에서는 사람들이 AI 위임 직관을 쌓아가는 과정이 드러나며, 검증이 쉽고 저위험·지루한·반복적인 일을 우선 위임하는 패턴이 공통적으로 나타남
- Claude 덕분에 기술 스펙트럼이 넓어져 풀스택에 가까운 능력을 갖게 되는 대신, 깊이 있는 코딩·디버깅 실습이 줄어 기초 역량이 약해질 수 있다는 우려도 함께 존재함
- Claude가 동료에게 하던 질문의 상당 부분을 대체하면서, 멘토십·동료 학습 기회 감소와 인간 관계 약화를 걱정하는 목소리도 다수 등장함
Claude Code 사용 로그에서는 업무 난이도 상승·연속 도구 호출 수 증가·인간 턴 감소가 동시에 관찰되며, 점점 더 복잡한 작업을 더 적은 개입으로 맡기는 경향이 확인됨
- 6개월 사이 새 기능 구현·코드 설계/플래닝 비중이 크게 늘었고, 전체 작업 중 8.6%는 ‘papercut fix’ 처럼 그동안 미룬 자잘한 품질 개선 작업으로 채워져 있음
- 팀별로는 Pre-training, Alignment & Safety, Security, Non-technical 팀 등에서 각자의 전문 영역을 넘어서는 작업에 Claude를 활용하며, 모두가 조금씩 더 풀스택화되는 양상이 보임
Looking forward 섹션에서는 Anthropic이 AI와 함께 일하는 모범 사례 실험실이 되겠다는 목표를 내놓고, 협업 방식 재설계·경력 개발 지원·AI 활용 베스트 프랙티스 정립을 위한 다음 단계 계획을 언급함
- 엔지니어 외 다른 직군으로 연구를 확장하고, CodePath 같은 외부 교육기관과 협력해 CS 커리큘럼을 AI 시대에 맞게 개편하는 작업도 함께 진행 중임

Survey data

Claude 사용 용도
- 설문 대상 132명의 엔지니어·연구자를 기준으로, Claude 사용 용도를 디버깅·코드 이해·리팩터링·데이터 사이언스·프론트엔드·설계/플래닝 등으로 나눠 빈도를 조사했음
  - 응답자 중 55%는 매일 디버깅에 Claude를 사용하고, 42%는 코드 이해, 37%는 새 기능 구현에 매일 사용한다고 답했음
  - 반면 고수준 설계·플래닝·데이터 사이언스·프론트엔드 개발은 전체 작업 자체가 상대적으로 적고, 사람들이 직접 하려는 경향이 있어 일상 사용 비율이 낮다고 설명됨
- 이런 분포는 뒤에서 제시되는 Claude Code 실제 사용 로그의 작업 분포와도 대체로 일치하며, 디버깅·코드 이해·새 기능 구현이 핵심 사용 축으로 자리 잡고 있음
사용량과 생산성
- 직원들은 12개월 전에는 업무의 28%에서 Claude를 사용하며 약 20% 생산성 향상을 느꼈다고 회상하는 반면, 현재는 업무의 59%에서 Claude를 사용하며 평균 50% 생산성 향상을 체감한다고 응답했음
  - 이는 1년 사이 사용 비율·생산성 향상이 모두 2배 이상 증가한 변화로 평가되고 있음
  - 내부적으로는 엔지니어 1인당 하루 평균 머지된 PR 수가 67% 증가했다는 지표도 함께 제시되며, Claude Code 전사 도입 시기의 변화와 맞물린다고 밝힘
- 설문 분석에서는 Claude 사용량이 많을수록 자기 보고 생산성 향상 폭도 커지는 상관관계가 나타났고, 응답자의 14%는 100% 이상 생산성 향상을 경험하는 ‘파워 유저’로 분류됨
  - 다만 생산성은 측정이 매우 어렵고, 자기 보고 수치의 편향·업무 카테고리 분류 한계가 있음을 연구진도 함께 언급함
  - METR의 외부 연구에서는 개발자들이 AI 도움을 받으면서 생산성 향상을 과대평가하는 경향이 나타났는데, Anthropic은 자신들의 경우 AI를 덜 배치하는 영역을 의도적으로 걸러냈기 때문에 차이가 있을 수 있다고 설명함
- Claude 도움을 받는 각 작업 카테고리별로, 직원들은 걸리는 시간은 다소 줄고, 산출물 양은 크게 늘어나는 패턴을 보고했음
  - 디버깅·코드 이해·리팩터링 등 대부분의 범주에서 시간 감소 응답이 우세하지만, 동시에 ‘시간 증가’ 응답도 꽤 존재해 양극화 양상이 나타남
  - 시간 증가를 경험한 사람들은 주로 Claude 코드 디버깅·정리 부담, AI가 쓴 코드를 이해하기 위한 추가 인지 부하, 탐색과 학습을 더 많이 하게 된 상황을 이유로 들었음
  - 연구에서는 줄어든 시간이 어디로 재투입되는지, 업무 외 활동까지 포함하는지는 이번 데이터로는 명확히 알 수 없다고 한계를 짚고, 추가 연구 필요성을 강조함
Claude가 여는 새로운 업무
- 직원들은 Claude 덕분에 자신이 수행하는 Claude 보조 업무 중 약 27%는 원래라면 하지 않았을 업무라고 응답했음
  - 여기에는 프로젝트 스케일업, 인터랙티브 데이터 대시보드 같은 nice-to-have 도구 제작, 문서화·테스트 같은 반복적이지만 유용한 작업, 비용 대비 효율이 낮았던 탐색적 실험 등이 포함됨
  - 작은 품질 저하 요인(papercut) 을 고치는 작업, 유지보수성 향상을 위한 리팩터링, 작업을 빠르게 돕는 작은 스크립트와 도구들도 이 범주에 들어감
- 한 연구자는 여러 버전의 Claude를 동시에 띄워 각기 다른 접근법을 병렬로 탐색한다고 설명하며, 이를 “단일 고성능 모델 한 대가 아니라 수많은 ‘말(馬)’을 동시에 달리게 하는 형태”로 비유했음
  - 이런 병렬 탐색 덕분에 아이디어 탐색 폭·실험 개수가 기존보다 크게 늘어나며, 보다 창의적인 접근이 가능해졌다고 평가함
완전 위임 가능한 업무 비중
- Claude를 자주 사용하는 엔지니어들도, 완전히 위임할 수 있다고 느끼는 업무 비중은 0~20% 사이라는 응답이 절반 이상을 차지했음
  - 여기서 ‘완전 위임’은 응답자마다 검증 없이 방치해도 된다고 보는 수준부터, 아주 가벼운 검토만으로 충분한 수준까지 폭넓게 해석되고 있을 수 있다고 연구진은 덧붙임
- 사람들은 특히 복잡한 작업·고위험 도메인·코드 품질 기준이 높은 영역에서는 여전히 능동적으로 Claude와 상호작용하며 출력 결과를 검증하는 방식을 택한다고 설명함
  - 결과적으로, Claude는 항상 옆에 있는 협업자에 가깝고, 인간이 완전히 손을 떼는 자동화 도구로 보는 비중은 아직 낮은 편임

Qualitative interviews

AI 위임 전략
- 인터뷰에 참여한 엔지니어·연구자들은 각자 Claude를 위임하는 기준과 전략을 상세히 설명했으며, 공통적으로 아래와 같은 조건을 우선시한다고 밝힘
  - 사용자 맥락은 낮지만 과제가 단순한 경우: 예를 들어, 인프라 작업 대부분은 어려운 문제가 아니고, Git·Linux 경험이 부족해도 Claude가 잘 메워준다고 설명함
  - 검증이 쉬운 작업: “검증 비용이 생성 비용보다 크지 않은 일”에 매우 잘 맞는다고 표현하며, 결과를 빠르게 스니핑 체크할 수 있는 일을 우선 위임함
  - 잘 정의된 서브컴포넌트: 프로젝트에서 적절히 분리된 하위 모듈·함수 수준의 작업을 Claude에게 먼저 맡김
  - 코드 품질이 생명적인 수준이 아닌 영역: 일회성 디버그 코드·연구용 코드·실험용 스크립트 등은 먼저 Claude에게 던지고, 중요한 설계·고난도 디버그·정교한 디자인은 직접 해결하는 식으로 구분함
  - 반복적·지루하고 미뤄두던 일: 하기 싫어 미뤄둔 작업에 대해, Claude와 대화하는 것으로 시작하면 진입 장벽이 확 낮아진다고 설명함
- 설문에서는 Claude 보조 업무 중 평균 44%가 ‘스스로는 즐겁게 하지 않았을 일’ 이라고 응답해, 사람들이 즐겁지 않은 일일수록 AI에게 넘기는 경향이 있다는 점도 드러남
- 반대로, 10분 안에 끝낼 수 있을 것 같은 작은 작업이면 굳이 Claude를 쓰지 않는다는 응답도 있었고, 코드베이스 내부 맥락을 AI에게 설명하는 ‘콜드 스타트 문제’ 때문에 직접 처리하는 편이 빠른 경우도 있다고 언급됨
신뢰 형성과 검증
- 많은 엔지니어가 처음에는 간단한 질문·언어 도움·낯선 언어(Rust 등)에 관한 기본 질문부터 시작해, 점차 더 복잡한 과제까지 Claude에게 맡기게 되는 신뢰 형성 단계를 언급함
  - 한 엔지니어는 Claude 신뢰 과정을 Google Maps 사용 습관 변화에 비유하며, 처음에는 모르는 길에만 쓰다가, 지금은 출퇴근길도 전적으로 맡기는 수준까지 올라온 경험과 비슷하다고 설명함
- Claude를 전문 분야 바깥에 쓰는지, 전문 분야 안에서 쓰는지에 대해서는 의견이 갈렸음
  - 어떤 사람은 자신이 약한 영역(프론트엔드, 인프라, 데이터베이스 등)에 Claude를 써서 구현 시간을 줄이는 용도로 사용함
  - 다른 사람은 자신이 충분히 이해하고 있어야 결과를 평가할 수 있다고 보고, 오히려 자신이 잘 아는 영역에서 Claude를 활용해 가속기처럼 쓰는 전략을 택함
- 보안 엔지니어는 Claude가 제안한 솔루션 중 일부가 “아주 유능한 주니어가 내놓을 법한, 위험하지만 영리한 아이디어” 와 닮아 있다고 표현하며, 위험성을 알아보려면 충분한 경험과 판단력이 필요하다고 강조함
- 일부 엔지니어는 코어 전문 영역과 주변 영역 모두에서 Claude를 사용하며, 자신의 숙련도에 따라 프롬프트 방식·검증 수준을 미세 조정한다고 설명함
  - 잘 아는 영역에서는 Claude에게 구체적인 단계와 제약을 지시하고, 잘 모르는 영역에서는 Claude에게 전문가 역할을 맡기고 여러 옵션과 고려사항을 제시하도록 요청하는 방식임
사람이 직접 하는 업무 경계
- 사람들은 공통적으로 고수준·전략적 사고, 시스템 설계, 조직 맥락과 ‘취향(taste)’이 필요한 결정은 여전히 자신이 맡고 있다고 설명함
  - “보통 큰 그림·설계는 스스로 하고, 새 기능 구현·디버깅 등은 최대한 위임한다”는 표현이 인터뷰에 등장함
- 설문에서도 설계·플래닝 영역에서는 생산성 향상이 가장 낮게 나타났는데, 이는 사람들이 설계 자체는 여전히 인간의 역할로 보고 있기 때문이라고 해석됨
- 다만 이 경계는 고정된 것이 아니라 ‘moving target’ 으로 묘사되며, 모델 성능 향상에 따라 조금씩 AI가 담당하는 영역이 위로 올라가는 중이라는 인식이 공유됨
스킬 변화와 확장
- Claude 덕분에 많은 엔지니어가 자신의 본래 전문 영역 밖의 업무를 수행할 수 있게 되었다고 설명함
  - 백엔드 엔지니어가 Claude와 여러 차례 주고받으며 복잡한 UI를 구축했고, 디자이너들이 “정말 네가 만들었냐”고 물어봤다는 일화가 소개됨
  - 여러 응답자는 Claude 때문에 프론트엔드·트랜잭션 DB·API·실험 인프라 등에서 더 과감하게 손을 댈 수 있게 되었고, 예전 같으면 “건드리기 무서웠던 영역”까지 다루게 되었다고 말함
- 이런 능력 확장은 피드백 루프와 학습 속도를 가속하는 효과도 낳음
  - 과거엔 기능을 만들고, 회의를 잡고, 피드백을 받고, 다시 수정하는 데 몇 주가 걸리던 작업이 이제는 몇 시간짜리 실시간 공동 작업 세션으로 대체될 수 있다고 설명함
- 여러 사람은 Claude 덕분에 프로토타입 속도·병렬 작업 능력·프로젝트 야심 수준이 모두 올라갔다고 언급함
  - 시니어 엔지니어는 “툴 덕분에 주니어 엔지니어들이 더 생산적이고, 더 큰 프로젝트에 도전할 용기를 갖게 된다”고 평가함
  - 또 다른 엔지니어는 Claude로 인해 일을 시작할 때 필요한 ‘활성화 에너지’가 크게 줄어, 미뤄두던 문제도 쉽게 손을 대게 되었다고 표현함
스킬 감소 우려와 감독 역설
- 한편 많은 응답자가 “위임이 늘면서 스스로의 기술이 줄어들고 있는 것 같다” 는 우려를 표했고, 특히 문제 해결 과정에서 incidental learning(부수 학습) 이 줄어드는 점을 걱정함
  - 어려운 버그를 직접 디버깅할 때는 문서·주변 코드·관련 설정을 광범위하게 읽게 되는데, Claude가 바로 핵심으로 안내해 버리면 시스템 전체 모델을 쌓을 기회가 줄어든다는 지적이 나옴
  - 예전에는 새 도구를 쓸 때 설정 옵션을 다 뒤져보고 기능을 손으로 익혔지만, 지금은 AI가 알려주는 방법만 쓰다 보니 깊은 이해를 놓치고 있다는 느낌을 받는다는 증언도 있음
- 한 시니어 엔지니어는 자신은 이미 기본기를 충분히 쌓은 상태라 걱정이 덜하지만, 커리어 초반이라면 훨씬 더 의식적으로 자기 실력을 키우려 노력해야 할 것이라고 말함
- 특히 많이 언급된 개념은 “감독 역설(paradox of supervision)” 임
  - Claude를 안전하게 쓰려면 AI 출력을 감독·검증하는 능력이 중요하지만, AI에 의존할수록 그 감독에 필요한 코딩·설계 능력이 약해질 수 있는 모순이 생긴다는 지적임
  - 어떤 사람은 “실력 저하의 문제 자체보다, 감독 능력이 떨어져 AI를 안전하게 쓰지 못하게 되는 것이 더 걱정된다”고 말함
- 이를 보완하기 위해 일부 엔지니어는 의도적으로 “Claude 없이 풀어보는 연습” 을 한다고 언급함
  - Claude가 잘 풀 수 있다는 걸 알면서도 일부 문제는 스스로 풀며 감각을 유지하려는 노력을 하고 있다고 설명함
‘더 높은 추상화’와 소프트웨어 공예
- 여러 인터뷰에서 소프트웨어 엔지니어링이 더 높은 추상화 수준으로 이동하고 있다는 관점이 등장함
  - 과거에는 메모리 수동 관리·어셈블리·하드웨어 스위치 토글까지 하던 시대에서, 점차 고수준 언어와 런타임이 저수준 세부를 대신 처리하게 되었고, 지금은 ‘English as a programming language’, 즉 자연어로 의도를 설명하고 코드를 생성시키는 단계로 넘어가고 있다는 인식임
  - 누군가는 컴공 수업에서 중요하게 가르치던 연결 리스트 구현을 비유로 들며, 스스로 구현할 줄 아는 건 여전히 좋지만, 실제 업무에서 그걸 직접 코딩하는 일은 거의 없어진다고 설명함
- 일부는 Claude 덕분에 오히려 고수준 개념·패턴·사용자 경험에 더 집중하게 되었다고 말하며, “알고 보니 코드 쓰기 자체를 좋아했던 게 아니라, 코드가 가져오는 결과를 좋아했던 것 같다”고 표현함
- 다른 사람들은 코딩 자체가 주는 즐거움과 ‘공예적 만족감’ 이 줄어드는 걸 아쉬워함
  - 25년 동안 프로그래밍을 해온 사람은 자신의 숙련된 코딩 능력에 대한 자부심이 일의 만족도의 핵심이었는데, 이 부분이 흐려지는 느낌이 있다고 털어놓음
  - 하루 종일 프롬프트만 치는 일은 즐겁지 않고, 음악 들으며 직접 코드를 짜는 ‘몰입 상태’의 즐거움을 잃는다는 표현도 등장함
- 어떤 사람은 “리팩터링에 완전히 빠져드는 ‘젠(zen) 상태’는 그립지만, 전체 생산성 향상이 훨씬 크기 때문에 기꺼이 포기하겠다”고 말하며, 손수 만드는 즐거움과 성과 극대화 사이에서 실용적인 선택을 하고 있음을 드러냄
- 결론적으로, AI 보조를 어떻게 느끼는지는 사람이 소프트웨어 엔지니어링에서 무엇을 가장 의미 있게 느끼는지에 따라 강하게 달라지는 양상이 나타남
협업과 사회적 관계 변화
- Claude는 많은 사람에게 동료에게 질문하기 전 첫 번째 질문 대상이 되었음
  - 한 응답자는 예전보다 질문 자체는 더 많이 하지만, 그중 80~90%는 Claude에게 하고, 나머지 10~20%만 사람에게 묻는다고 설명함
  - 이렇게 되면서 루틴한 질문은 Claude가 흡수하고, 사람에게 가는 질문은 전략적·맥락 의존적·고난도 문제 위주로 재편되는 필터링 효과가 생김
- 절반 정도의 사람들은 여전히 팀 협업 패턴이 크게 달라지지 않았다고 느끼며, 회의·맥락 공유·방향 선택 등은 사람끼리 계속 하고 있다고 말함
  - 다만 앞으로는 집중 작업 시간 대신 여러 ‘Claude 인스턴스’와의 대화가 새로운 기본 작업 단위가 될 것 같다는 전망도 나옴
- 다른 사람들은 명확히 동료와의 상호작용이 줄었다고 느끼고 있음
  - “요즘은 동료보다 Claude와 더 많이 일하는 것 같다”는 표현이 등장하며, 동료 시간 뺏는다는 죄책감이 줄어든 점은 좋지만, 사람과 함께 일하는 즐거움이 줄어드는 점을 아쉬워하는 목소리도 큼
  - 팀 내에서 “먼저 Claude에게 물어봤냐”는 응답이 자동으로 돌아오는 문화를 불편하게 느끼는 사람도 있고, 사람끼리 직접 붙어서 일하는 방식을 더 선호한다는 의견도 나옴
- 특히 멘토십·주니어 교육 측면의 변화가 두드러짐
  - Claude가 주니어에게 상세한 코칭·코드 리뷰 역할을 많이 해주면서, 주니어가 시니어에게 질문하러 오는 빈도가 확 줄었다는 관찰이 나옴
  - 한 시니어는 “주니어들이 나에게 질문하러 덜 오게 된 건 아쉽지만, 그들이 질문에 대한 답을 더 빨리 잘 얻고 빨리 배우는 것도 사실”이라고 복합적인 감정을 표현함
커리어 불확실성과 적응
- 여러 사람은 자신의 역할이 코드를 직접 쓰는 사람에서 AI 에이전트 관리자·코드 리뷰어로 이동하고 있다고 설명함
  - 어떤 사람은 지금 일을 “1명, 5명, 100명의 Claude가 하는 일을 대신 책임지는 역할”로 묘사하며, 이미 하루 종일 여러 Claude 인스턴스를 띄워놓고 일한다고 말함
  - 다른 사람은 자기 일이 70% 이상 코드 리뷰·수정 역할로 이동했다고 추정함
- 장기적인 커리어 전망에 대해서는 단기 낙관·장기 불안이 뒤섞인 응답이 많았음
  - “단기적으로는 상당히 낙관적이지만, 장기적으로는 AI가 결국 대부분을 하게 되어 나와 많은 사람이 쓸모없게 될 것 같다는 우려도 있다”는 표현이 등장함
  - 또 다른 사람은 “매일 출근해 스스로를 자동화하는 일을 하고 있는 기분”이라는 직설적인 표현을 쓰기도 함
- 일부는 특히 주니어 개발자의 미래를 걱정하면서도, 동시에 그들이 새 기술을 가장 빠르게 받아들이는 세대라는 점에서 희망을 보기함
  - AI가 실수한 코드를 주니어가 그대로 배포할 위험이 있지만, 더 나은 가드레일·교육 자료·실수에서의 학습이 결합되면 시간이 지나며 적응할 수 있을 것이라는 기대도 함께 제시됨
- 미래 전략과 적응 방식으로는 여러 답변이 나옴
  - AI 산출물을 의미 있게 리뷰하고 감독하는 능력을 새로운 전문성으로 삼겠다는 계획
  - 사람 사이의 합의 형성·조정·전략 수립에 더 많은 시간을 쓰고, 구현은 AI에게 더 많이 맡기는 역할로 이동할 것이라는 기대
  - Claude를 활용해 리더십·커뮤니케이션·커리어 개발 피드백을 받으며, 학습 속도를 끌어올리고 있다는 사례도 소개됨
- 전반적인 정서는 “미래에 어떤 스킬이 가장 중요할지에 대한 확신은 매우 낮다”는 인식과, “중요한 것은 어떤 일이 오든 빠르게 적응할 수 있는 사람·조직이 되는 것”이라는 태도로 요약됨

Claude Code usage trends

더 어려운 문제와 더 높은 자율성
- Anthropic은 내부 프라이버시 보호 도구를 이용해 2025년 2월과 8월, 두 시점의 Claude Code 내부 로그 20만 건을 분석했음
  - 각 대화 기록을 1~5점 난이도 스케일로 평가했을 때, 평균 난이도는 3.2에서 3.8로 상승했음
    - 난이도 3.2 수준 예시는 “Python 모듈 import 에러 해결”, 3.8 수준 예시는 “캐싱 시스템 구현 및 최적화” 등임
- Claude Code가 사람 개입 없이 연속적으로 수행하는 도구 호출 수는 평균 9.8회에서 21.2회로 116% 증가했음
  - 이는 Claude가 연속적인 파일 수정·명령 실행을 더 길게 스스로 이어가며 복잡한 작업을 처리한다는 의미임
- 대화당 인간 턴 수는 평균 6.2에서 4.1로 33% 감소했으며, 동일한 작업을 달성하는 데 필요한 인간 상호작용이 줄어드는 경향이 드러남
  - 이런 지표를 종합하면, 엔지니어들이 더 복잡한 업무를 Claude에게 더 많은 자율성을 주고 맡기고 있음을 시사함
작업 분포 변화
- Claude Code 로그의 각 대화를 디버깅·코드 이해·리팩터링·테스트·새 기능 구현·코드 설계/플래닝·프론트엔드·데이터 사이언스 등으로 분류해 작업 분포를 비교했음
  - 전체 분포는 설문에서 사람들이 보고한 주 사용 패턴(디버깅·코드 이해·새 기능 구현 중심) 과 대체로 일치함
- 6개월 사이 가장 두드러진 변화는 새 기능 구현과 코드 설계/플래닝 비중의 급증임
  - 새 기능 구현은 전체 로그 중 14.3%에서 36.9%로 증가했고, 설계·플래닝 관련 작업도 1.0%에서 9.9%로 증가했음
  - 이는 Claude가 더 복잡하고 창의적인 작업에서 쓰이는 비중이 커졌거나, 팀들이 Claude Code를 이런 워크플로에 적극 도입하기 시작했음을 의미할 수 있다고 설명함
  - 연구진은 절대 작업량 증가와 상대적 분포 변화를 명확히 분리하기는 어렵다고 언급하며, 이 점을 한계로 남겨둠
Papercut 수정
- 설문에서 사람들이 자잘한 품질 개선·생활 편의 개선 작업을 더 많이 하게 되었다고 답한 것과 일치하게, Claude Code 로그에서도 전체 작업의 8.6%가 ‘papercut fix’로 분류됨
  - 여기에는 성능 시각화 도구 제작, 유지보수성 향상을 위한 리팩터링, 터미널 단축키나 스크립트 같은 작은 편의 기능 구축이 포함됨
- 이런 작업들은 개별적으로는 작지만, 누적될수록 생산성과 개발자 경험을 눈에 띄게 개선할 수 있는 요소로 작동함
  - 원래는 우선순위에서 밀려 미뤄지던 일들이 Claude 덕분에 부담이 줄어들어 자연스럽게 처리되고 있다는 점이 특징임
팀별 사용 차이
- 2025년 8월의 Claude Code 로그를 기준으로, 각 대화를 주 작업 유형 하나로 태깅해 팀별 분포를 비교한 결과가 Figure 5로 제시됨
  - 전체 평균(“All Teams”)에서는 새 기능 구현·디버깅·코드 이해가 가장 큰 비중을 차지해, Claude 사용의 기본 패턴을 보여줌
- 주요 팀별 특징은 다음과 같음
  - Pre-training 팀은 Claude Code 사용의 54.6%를 새 기능 구현에 사용하며, 특히 다양한 추가 실험 실행이 큰 비중을 차지함
  - Alignment & Safety 팀, Post-training 팀은 프론트엔드 개발 비중이 각각 7.5%, 7.4%로 높으며, 주로 데이터 시각화를 위한 UI 구축에 Claude를 활용함
  - Security 팀은 Claude Code 사용의 48.9%가 코드 이해 작업으로, 낯선 코드의 보안적 함의를 분석·파악하는 용도로 자주 사용함
  - Non-technical 직원들도 Claude Code를 많이 쓰는데, 51.5%가 디버깅(네트워크 이슈, Git 문제 등), 12.7%는 데이터 사이언스 작업에 해당하며, 기술적 지식의 간극을 메우는 도구로 활용되고 있음
- 전반적으로 팀들은 자신의 핵심 업무(인프라, 연구, 보안 등) 에도 Claude를 활용하지만, 동시에 전통적인 전문 영역 바깥 작업에도 Claude를 써서 모두가 조금씩 더 풀스택에 가까워지는 양상이 데이터로 확인됨

Looking forward

Anthropic 내부에서의 다음 단계
- Anthropic은 지난 1년간의 변화를 바탕으로, Claude를 활용한 업무 전환을 책임감 있게 관리하는 ‘실험실’ 역할을 자임하고 있음
  - 엔지니어·연구자·리더십과 함께 협업 방식·회의와 소통 구조·직무별 역할 정의를 다시 점검하고, AI 보조 업무를 전제로 한 새로운 베스트 프랙티스를 만들려는 작업을 시작했다고 밝힘
- 특히 전문성 개발·멘토십·승진과 성장 경로가 AI 시대에 어떻게 달라져야 하는지에 초점을 맞추고 있으며, 여기에는 Anthropic이 이미 공개한 AI fluency framework도 참고되고 있음
  - 사람과 AI가 함께 일할 때, 어떤 수준의 이해·감독·피드백 능력을 갖춰야 하는지를 정의하는 프레임워크를 기반으로, 실질적인 교육·내부 정책을 설계하려는 움직임임
- 이번 연구는 엔지니어 중심이지만, 앞으로는 비개발 직군까지 범위를 확장해 Anthropic 전체에서 AI가 업무를 어떻게 바꾸는지 살펴볼 계획이라고 밝힘
외부 파트너십과 교육, 장기 계획
- Anthropic은 내부 연구와 함께, 외부 조직이 AI 보조 시대에 적응하도록 돕는 역할도 병행하고 있음
  - 예로, CodePath와 협력해 컴퓨터 과학 커리큘럼을 AI 보조 환경에 맞게 개편하는 작업을 지원 중이라고 언급함
  - 이는 주니어 개발자 교육·초기 경력자 학습 경로를 AI 도구 사용을 전제로 다시 설계해야 한다는 문제의식을 반영함
- 앞으로는 조직 내 역할 재설계·리스킬링 경로·새로운 직무 전환 루트 같은 구조적 접근이 점점 더 중요해질 수 있다고 보고 있음
  - 예를 들어, AI 에이전트 감독·품질 책임·윤리 검토 등 새로운 역할을 공식 직무로 인정하는 형태 등이 논의될 수 있음
- Anthropic은 2026년에 더 구체적인 계획을 공개하겠다고 예고하며, 이번 연구를 시작점이자 중간 점검으로 위치시킴
  - 핵심 메시지는 Anthropic이 AI가 일을 바꾸는 과정을 단순히 관찰하는 데서 그치지 않고, 스스로 먼저 실험·조정하면서 ‘책임 있는 전환’ 모델을 만들려 한다는 점임