2P by neo 59분전 | ★ favorite | 댓글과 토론
  • Anthropic 내부 엔지니어·연구진 132명 조사에서 Claude 중심 AI 협업이 업무 방식 전반을 바꾸며 생산성과 업무 범위가 동시에 확장되고 있음
  • 직원들은 업무의 59%에서 Claude를 사용하며 평균 50% 생산성 향상을 체감하고 있고, 산출물 양이 크게 늘어나면서도 시간 사용 방식이 재편되고 있음
  • Claude 덕분에 전체 Claude 보조 업무의 27%가 원래는 하지 않았을 일로 채워지며, 프로토타이핑·대시보드·테스트·문서화 같은 ‘미뤄두던 일’까지 처리되는 양상이 보임
  • 한편 기술 역량 약화·멘토십 감소·코딩 공예 상실에 대한 우려도 함께 커지고 있으며, 사람은 점점 AI 에이전트 관리자·감독자 역할로 이동하는 흐름이 나타나고 있음
  • 전체적으로 AI는 개발자를 ‘더 풀스택이고 더 많은 일을 하는 존재’ 로 만들면서도, 장기적인 커리어 경로·학습 방법·조직 문화에 대한 불확실성과 적응 필요성을 동시에 키우고 있음

개요

  • Anthropic은 AI의 노동시장 영향에 대한 기존 거시 연구에 이어, 이번에는 자신들의 엔지니어·연구자를 대상으로 AI가 실제 업무를 어떻게 바꾸는지 내부 조사를 수행했음
    • 2025년 8월 기준 엔지니어·연구자 132명 설문53건 정성 인터뷰, Claude Code 사용 로그 데이터를 함께 분석한 연구임
    • 분석 결과, 개발자들은 더 많은 일을 해내고 더 다양한 영역을 다루게 되었지만, 그만큼 기술 깊이·협업·커리어 미래에 대한 고민도 커지고 있음
  • Anthropic 엔지니어들은 Claude를 통해 더 풀스택에 가까운 역할을 수행하고, 학습·반복 사이클을 가속하며, 기존에 미뤄두던 작업까지 처리하고 있음
    • 동시에, 이런 폭 확장은 깊이 있는 기술 역량 저하와 감독 능력 약화로 이어질 수 있다는 우려도 함께 존재함
  • Anthropic은 자신들이 최신 도구에 가장 먼저 접근하는 특수한 환경임을 인정하면서도, 이 내부 변화를 향후 더 넓은 사회·산업 변화의 전조로 보고 조기 관찰이 의미 있다고 보고 있음
    • 연구 당시 가장 강력한 모델은 Claude Sonnet 4, Claude Opus 4였고, 이후 모델 성능은 계속 발전하는 중이라고 밝힘
  • 전반적으로 생산성 증대·업무 확장과 함께, 기술 전문성 유지·의미 있는 협업 보존·불확실한 미래 대비라는 과제가 동시에 부각되고 있으며, Anthropic 내부에서도 이를 위한 시도들이 진행 중임
    • 별도의 글에서 AI 관련 경제 정책 아이디어도 함께 논의하고 있으며, 이번 글은 주로 조직 내부의 일·역할 변화에 초점을 맞추고 있음

Key findings

  • 설문 데이터 기준, Anthropic 엔지니어들은 Claude를 주로 디버깅과 코드 이해에 사용하고 있으며, 사용 비율과 체감 생산성 향상 폭이 1년 새 2~3배 수준으로 증가한 상태임
    • 전체 Claude 보조 업무의 27%는 원래는 하지 않았을 업무로, 프로젝트 확장·대시보드·탐색적 실험 등 추가 작업으로 채워지고 있음
    • 대부분의 직원이 Claude를 자주 쓰지만, 완전히 위임 가능한 업무는 0~20% 수준이라고 답해, 적극적인 감독·검증이 여전히 필수임
  • 인터뷰에서는 사람들이 AI 위임 직관을 쌓아가는 과정이 드러나며, 검증이 쉽고 저위험·지루한·반복적인 일을 우선 위임하는 패턴이 공통적으로 나타남
    • Claude 덕분에 기술 스펙트럼이 넓어져 풀스택에 가까운 능력을 갖게 되는 대신, 깊이 있는 코딩·디버깅 실습이 줄어 기초 역량이 약해질 수 있다는 우려도 함께 존재함
    • Claude가 동료에게 하던 질문의 상당 부분을 대체하면서, 멘토십·동료 학습 기회 감소와 인간 관계 약화를 걱정하는 목소리도 다수 등장함
  • Claude Code 사용 로그에서는 업무 난이도 상승·연속 도구 호출 수 증가·인간 턴 감소가 동시에 관찰되며, 점점 더 복잡한 작업을 더 적은 개입으로 맡기는 경향이 확인됨
    • 6개월 사이 새 기능 구현·코드 설계/플래닝 비중이 크게 늘었고, 전체 작업 중 8.6%는 ‘papercut fix’ 처럼 그동안 미룬 자잘한 품질 개선 작업으로 채워져 있음
    • 팀별로는 Pre-training, Alignment & Safety, Security, Non-technical 팀 등에서 각자의 전문 영역을 넘어서는 작업에 Claude를 활용하며, 모두가 조금씩 더 풀스택화되는 양상이 보임
  • Looking forward 섹션에서는 Anthropic이 AI와 함께 일하는 모범 사례 실험실이 되겠다는 목표를 내놓고, 협업 방식 재설계·경력 개발 지원·AI 활용 베스트 프랙티스 정립을 위한 다음 단계 계획을 언급함
    • 엔지니어 외 다른 직군으로 연구를 확장하고, CodePath 같은 외부 교육기관과 협력해 CS 커리큘럼을 AI 시대에 맞게 개편하는 작업도 함께 진행 중임

Survey data

  • Claude 사용 용도

    • 설문 대상 132명의 엔지니어·연구자를 기준으로, Claude 사용 용도를 디버깅·코드 이해·리팩터링·데이터 사이언스·프론트엔드·설계/플래닝 등으로 나눠 빈도를 조사했음
      • 응답자 중 55%는 매일 디버깅에 Claude를 사용하고, 42%는 코드 이해, 37%는 새 기능 구현에 매일 사용한다고 답했음
      • 반면 고수준 설계·플래닝·데이터 사이언스·프론트엔드 개발은 전체 작업 자체가 상대적으로 적고, 사람들이 직접 하려는 경향이 있어 일상 사용 비율이 낮다고 설명됨
    • 이런 분포는 뒤에서 제시되는 Claude Code 실제 사용 로그의 작업 분포와도 대체로 일치하며, 디버깅·코드 이해·새 기능 구현이 핵심 사용 축으로 자리 잡고 있음
  • 사용량과 생산성

    • 직원들은 12개월 전에는 업무의 28%에서 Claude를 사용하며 약 20% 생산성 향상을 느꼈다고 회상하는 반면, 현재는 업무의 59%에서 Claude를 사용하며 평균 50% 생산성 향상을 체감한다고 응답했음
      • 이는 1년 사이 사용 비율·생산성 향상이 모두 2배 이상 증가한 변화로 평가되고 있음
      • 내부적으로는 엔지니어 1인당 하루 평균 머지된 PR 수가 67% 증가했다는 지표도 함께 제시되며, Claude Code 전사 도입 시기의 변화와 맞물린다고 밝힘
    • 설문 분석에서는 Claude 사용량이 많을수록 자기 보고 생산성 향상 폭도 커지는 상관관계가 나타났고, 응답자의 14%는 100% 이상 생산성 향상을 경험하는 ‘파워 유저’로 분류됨
      • 다만 생산성은 측정이 매우 어렵고, 자기 보고 수치의 편향·업무 카테고리 분류 한계가 있음을 연구진도 함께 언급함
      • METR의 외부 연구에서는 개발자들이 AI 도움을 받으면서 생산성 향상을 과대평가하는 경향이 나타났는데, Anthropic은 자신들의 경우 AI를 덜 배치하는 영역을 의도적으로 걸러냈기 때문에 차이가 있을 수 있다고 설명함
    • Claude 도움을 받는 각 작업 카테고리별로, 직원들은 걸리는 시간은 다소 줄고, 산출물 양은 크게 늘어나는 패턴을 보고했음
      • 디버깅·코드 이해·리팩터링 등 대부분의 범주에서 시간 감소 응답이 우세하지만, 동시에 ‘시간 증가’ 응답도 꽤 존재해 양극화 양상이 나타남
      • 시간 증가를 경험한 사람들은 주로 Claude 코드 디버깅·정리 부담, AI가 쓴 코드를 이해하기 위한 추가 인지 부하, 탐색과 학습을 더 많이 하게 된 상황을 이유로 들었음
      • 연구에서는 줄어든 시간이 어디로 재투입되는지, 업무 외 활동까지 포함하는지는 이번 데이터로는 명확히 알 수 없다고 한계를 짚고, 추가 연구 필요성을 강조함
  • Claude가 여는 새로운 업무

    • 직원들은 Claude 덕분에 자신이 수행하는 Claude 보조 업무 중 약 27%는 원래라면 하지 않았을 업무라고 응답했음
      • 여기에는 프로젝트 스케일업, 인터랙티브 데이터 대시보드 같은 nice-to-have 도구 제작, 문서화·테스트 같은 반복적이지만 유용한 작업, 비용 대비 효율이 낮았던 탐색적 실험 등이 포함됨
      • 작은 품질 저하 요인(papercut) 을 고치는 작업, 유지보수성 향상을 위한 리팩터링, 작업을 빠르게 돕는 작은 스크립트와 도구들도 이 범주에 들어감
    • 한 연구자는 여러 버전의 Claude를 동시에 띄워 각기 다른 접근법을 병렬로 탐색한다고 설명하며, 이를 “단일 고성능 모델 한 대가 아니라 수많은 ‘말(馬)’을 동시에 달리게 하는 형태”로 비유했음
      • 이런 병렬 탐색 덕분에 아이디어 탐색 폭·실험 개수가 기존보다 크게 늘어나며, 보다 창의적인 접근이 가능해졌다고 평가함
  • 완전 위임 가능한 업무 비중

    • Claude를 자주 사용하는 엔지니어들도, 완전히 위임할 수 있다고 느끼는 업무 비중은 0~20% 사이라는 응답이 절반 이상을 차지했음
      • 여기서 ‘완전 위임’은 응답자마다 검증 없이 방치해도 된다고 보는 수준부터, 아주 가벼운 검토만으로 충분한 수준까지 폭넓게 해석되고 있을 수 있다고 연구진은 덧붙임
    • 사람들은 특히 복잡한 작업·고위험 도메인·코드 품질 기준이 높은 영역에서는 여전히 능동적으로 Claude와 상호작용하며 출력 결과를 검증하는 방식을 택한다고 설명함
      • 결과적으로, Claude는 항상 옆에 있는 협업자에 가깝고, 인간이 완전히 손을 떼는 자동화 도구로 보는 비중은 아직 낮은 편임

Qualitative interviews

  • AI 위임 전략

    • 인터뷰에 참여한 엔지니어·연구자들은 각자 Claude를 위임하는 기준과 전략을 상세히 설명했으며, 공통적으로 아래와 같은 조건을 우선시한다고 밝힘
      • 사용자 맥락은 낮지만 과제가 단순한 경우: 예를 들어, 인프라 작업 대부분은 어려운 문제가 아니고, Git·Linux 경험이 부족해도 Claude가 잘 메워준다고 설명함
      • 검증이 쉬운 작업: “검증 비용이 생성 비용보다 크지 않은 일”에 매우 잘 맞는다고 표현하며, 결과를 빠르게 스니핑 체크할 수 있는 일을 우선 위임함
      • 잘 정의된 서브컴포넌트: 프로젝트에서 적절히 분리된 하위 모듈·함수 수준의 작업을 Claude에게 먼저 맡김
      • 코드 품질이 생명적인 수준이 아닌 영역: 일회성 디버그 코드·연구용 코드·실험용 스크립트 등은 먼저 Claude에게 던지고, 중요한 설계·고난도 디버그·정교한 디자인은 직접 해결하는 식으로 구분함
      • 반복적·지루하고 미뤄두던 일: 하기 싫어 미뤄둔 작업에 대해, Claude와 대화하는 것으로 시작하면 진입 장벽이 확 낮아진다고 설명함
    • 설문에서는 Claude 보조 업무 중 평균 44%가 ‘스스로는 즐겁게 하지 않았을 일’ 이라고 응답해, 사람들이 즐겁지 않은 일일수록 AI에게 넘기는 경향이 있다는 점도 드러남
    • 반대로, 10분 안에 끝낼 수 있을 것 같은 작은 작업이면 굳이 Claude를 쓰지 않는다는 응답도 있었고, 코드베이스 내부 맥락을 AI에게 설명하는 ‘콜드 스타트 문제’ 때문에 직접 처리하는 편이 빠른 경우도 있다고 언급됨
  • 신뢰 형성과 검증

    • 많은 엔지니어가 처음에는 간단한 질문·언어 도움·낯선 언어(Rust 등)에 관한 기본 질문부터 시작해, 점차 더 복잡한 과제까지 Claude에게 맡기게 되는 신뢰 형성 단계를 언급함
      • 한 엔지니어는 Claude 신뢰 과정을 Google Maps 사용 습관 변화에 비유하며, 처음에는 모르는 길에만 쓰다가, 지금은 출퇴근길도 전적으로 맡기는 수준까지 올라온 경험과 비슷하다고 설명함
    • Claude를 전문 분야 바깥에 쓰는지, 전문 분야 안에서 쓰는지에 대해서는 의견이 갈렸음
      • 어떤 사람은 자신이 약한 영역(프론트엔드, 인프라, 데이터베이스 등)에 Claude를 써서 구현 시간을 줄이는 용도로 사용함
      • 다른 사람은 자신이 충분히 이해하고 있어야 결과를 평가할 수 있다고 보고, 오히려 자신이 잘 아는 영역에서 Claude를 활용해 가속기처럼 쓰는 전략을 택함
    • 보안 엔지니어는 Claude가 제안한 솔루션 중 일부가 “아주 유능한 주니어가 내놓을 법한, 위험하지만 영리한 아이디어” 와 닮아 있다고 표현하며, 위험성을 알아보려면 충분한 경험과 판단력이 필요하다고 강조함
    • 일부 엔지니어는 코어 전문 영역과 주변 영역 모두에서 Claude를 사용하며, 자신의 숙련도에 따라 프롬프트 방식·검증 수준을 미세 조정한다고 설명함
      • 잘 아는 영역에서는 Claude에게 구체적인 단계와 제약을 지시하고, 잘 모르는 영역에서는 Claude에게 전문가 역할을 맡기고 여러 옵션과 고려사항을 제시하도록 요청하는 방식임
  • 사람이 직접 하는 업무 경계

    • 사람들은 공통적으로 고수준·전략적 사고, 시스템 설계, 조직 맥락과 ‘취향(taste)’이 필요한 결정은 여전히 자신이 맡고 있다고 설명함
      • “보통 큰 그림·설계는 스스로 하고, 새 기능 구현·디버깅 등은 최대한 위임한다”는 표현이 인터뷰에 등장함
    • 설문에서도 설계·플래닝 영역에서는 생산성 향상이 가장 낮게 나타났는데, 이는 사람들이 설계 자체는 여전히 인간의 역할로 보고 있기 때문이라고 해석됨
    • 다만 이 경계는 고정된 것이 아니라 ‘moving target’ 으로 묘사되며, 모델 성능 향상에 따라 조금씩 AI가 담당하는 영역이 위로 올라가는 중이라는 인식이 공유됨
  • 스킬 변화와 확장

    • Claude 덕분에 많은 엔지니어가 자신의 본래 전문 영역 밖의 업무를 수행할 수 있게 되었다고 설명함
      • 백엔드 엔지니어가 Claude와 여러 차례 주고받으며 복잡한 UI를 구축했고, 디자이너들이 “정말 네가 만들었냐”고 물어봤다는 일화가 소개됨
      • 여러 응답자는 Claude 때문에 프론트엔드·트랜잭션 DB·API·실험 인프라 등에서 더 과감하게 손을 댈 수 있게 되었고, 예전 같으면 “건드리기 무서웠던 영역”까지 다루게 되었다고 말함
    • 이런 능력 확장은 피드백 루프와 학습 속도를 가속하는 효과도 낳음
      • 과거엔 기능을 만들고, 회의를 잡고, 피드백을 받고, 다시 수정하는 데 몇 주가 걸리던 작업이 이제는 몇 시간짜리 실시간 공동 작업 세션으로 대체될 수 있다고 설명함
    • 여러 사람은 Claude 덕분에 프로토타입 속도·병렬 작업 능력·프로젝트 야심 수준이 모두 올라갔다고 언급함
      • 시니어 엔지니어는 “툴 덕분에 주니어 엔지니어들이 더 생산적이고, 더 큰 프로젝트에 도전할 용기를 갖게 된다”고 평가함
      • 또 다른 엔지니어는 Claude로 인해 일을 시작할 때 필요한 ‘활성화 에너지’가 크게 줄어, 미뤄두던 문제도 쉽게 손을 대게 되었다고 표현함
  • 스킬 감소 우려와 감독 역설

    • 한편 많은 응답자가 “위임이 늘면서 스스로의 기술이 줄어들고 있는 것 같다” 는 우려를 표했고, 특히 문제 해결 과정에서 incidental learning(부수 학습) 이 줄어드는 점을 걱정함
      • 어려운 버그를 직접 디버깅할 때는 문서·주변 코드·관련 설정을 광범위하게 읽게 되는데, Claude가 바로 핵심으로 안내해 버리면 시스템 전체 모델을 쌓을 기회가 줄어든다는 지적이 나옴
      • 예전에는 새 도구를 쓸 때 설정 옵션을 다 뒤져보고 기능을 손으로 익혔지만, 지금은 AI가 알려주는 방법만 쓰다 보니 깊은 이해를 놓치고 있다는 느낌을 받는다는 증언도 있음
    • 한 시니어 엔지니어는 자신은 이미 기본기를 충분히 쌓은 상태라 걱정이 덜하지만, 커리어 초반이라면 훨씬 더 의식적으로 자기 실력을 키우려 노력해야 할 것이라고 말함
    • 특히 많이 언급된 개념은 “감독 역설(paradox of supervision)”
      • Claude를 안전하게 쓰려면 AI 출력을 감독·검증하는 능력이 중요하지만, AI에 의존할수록 그 감독에 필요한 코딩·설계 능력이 약해질 수 있는 모순이 생긴다는 지적임
      • 어떤 사람은 “실력 저하의 문제 자체보다, 감독 능력이 떨어져 AI를 안전하게 쓰지 못하게 되는 것이 더 걱정된다”고 말함
    • 이를 보완하기 위해 일부 엔지니어는 의도적으로 “Claude 없이 풀어보는 연습” 을 한다고 언급함
      • Claude가 잘 풀 수 있다는 걸 알면서도 일부 문제는 스스로 풀며 감각을 유지하려는 노력을 하고 있다고 설명함
  • ‘더 높은 추상화’와 소프트웨어 공예

    • 여러 인터뷰에서 소프트웨어 엔지니어링이 더 높은 추상화 수준으로 이동하고 있다는 관점이 등장함
      • 과거에는 메모리 수동 관리·어셈블리·하드웨어 스위치 토글까지 하던 시대에서, 점차 고수준 언어와 런타임이 저수준 세부를 대신 처리하게 되었고, 지금은 ‘English as a programming language’, 즉 자연어로 의도를 설명하고 코드를 생성시키는 단계로 넘어가고 있다는 인식임
      • 누군가는 컴공 수업에서 중요하게 가르치던 연결 리스트 구현을 비유로 들며, 스스로 구현할 줄 아는 건 여전히 좋지만, 실제 업무에서 그걸 직접 코딩하는 일은 거의 없어진다고 설명함
    • 일부는 Claude 덕분에 오히려 고수준 개념·패턴·사용자 경험에 더 집중하게 되었다고 말하며, “알고 보니 코드 쓰기 자체를 좋아했던 게 아니라, 코드가 가져오는 결과를 좋아했던 것 같다”고 표현함
    • 다른 사람들은 코딩 자체가 주는 즐거움과 ‘공예적 만족감’ 이 줄어드는 걸 아쉬워함
      • 25년 동안 프로그래밍을 해온 사람은 자신의 숙련된 코딩 능력에 대한 자부심이 일의 만족도의 핵심이었는데, 이 부분이 흐려지는 느낌이 있다고 털어놓음
      • 하루 종일 프롬프트만 치는 일은 즐겁지 않고, 음악 들으며 직접 코드를 짜는 ‘몰입 상태’의 즐거움을 잃는다는 표현도 등장함
    • 어떤 사람은 “리팩터링에 완전히 빠져드는 ‘젠(zen) 상태’는 그립지만, 전체 생산성 향상이 훨씬 크기 때문에 기꺼이 포기하겠다”고 말하며, 손수 만드는 즐거움과 성과 극대화 사이에서 실용적인 선택을 하고 있음을 드러냄
    • 결론적으로, AI 보조를 어떻게 느끼는지는 사람이 소프트웨어 엔지니어링에서 무엇을 가장 의미 있게 느끼는지에 따라 강하게 달라지는 양상이 나타남
  • 협업과 사회적 관계 변화

    • Claude는 많은 사람에게 동료에게 질문하기 전 첫 번째 질문 대상이 되었음
      • 한 응답자는 예전보다 질문 자체는 더 많이 하지만, 그중 80~90%는 Claude에게 하고, 나머지 10~20%만 사람에게 묻는다고 설명함
      • 이렇게 되면서 루틴한 질문은 Claude가 흡수하고, 사람에게 가는 질문은 전략적·맥락 의존적·고난도 문제 위주로 재편되는 필터링 효과가 생김
    • 절반 정도의 사람들은 여전히 팀 협업 패턴이 크게 달라지지 않았다고 느끼며, 회의·맥락 공유·방향 선택 등은 사람끼리 계속 하고 있다고 말함
      • 다만 앞으로는 집중 작업 시간 대신 여러 ‘Claude 인스턴스’와의 대화가 새로운 기본 작업 단위가 될 것 같다는 전망도 나옴
    • 다른 사람들은 명확히 동료와의 상호작용이 줄었다고 느끼고 있음
      • “요즘은 동료보다 Claude와 더 많이 일하는 것 같다”는 표현이 등장하며, 동료 시간 뺏는다는 죄책감이 줄어든 점은 좋지만, 사람과 함께 일하는 즐거움이 줄어드는 점을 아쉬워하는 목소리도 큼
      • 팀 내에서 “먼저 Claude에게 물어봤냐”는 응답이 자동으로 돌아오는 문화를 불편하게 느끼는 사람도 있고, 사람끼리 직접 붙어서 일하는 방식을 더 선호한다는 의견도 나옴
    • 특히 멘토십·주니어 교육 측면의 변화가 두드러짐
      • Claude가 주니어에게 상세한 코칭·코드 리뷰 역할을 많이 해주면서, 주니어가 시니어에게 질문하러 오는 빈도가 확 줄었다는 관찰이 나옴
      • 한 시니어는 “주니어들이 나에게 질문하러 덜 오게 된 건 아쉽지만, 그들이 질문에 대한 답을 더 빨리 잘 얻고 빨리 배우는 것도 사실”이라고 복합적인 감정을 표현함
  • 커리어 불확실성과 적응

    • 여러 사람은 자신의 역할이 코드를 직접 쓰는 사람에서 AI 에이전트 관리자·코드 리뷰어로 이동하고 있다고 설명함
      • 어떤 사람은 지금 일을 “1명, 5명, 100명의 Claude가 하는 일을 대신 책임지는 역할”로 묘사하며, 이미 하루 종일 여러 Claude 인스턴스를 띄워놓고 일한다고 말함
      • 다른 사람은 자기 일이 70% 이상 코드 리뷰·수정 역할로 이동했다고 추정함
    • 장기적인 커리어 전망에 대해서는 단기 낙관·장기 불안이 뒤섞인 응답이 많았음
      • “단기적으로는 상당히 낙관적이지만, 장기적으로는 AI가 결국 대부분을 하게 되어 나와 많은 사람이 쓸모없게 될 것 같다는 우려도 있다”는 표현이 등장함
      • 또 다른 사람은 “매일 출근해 스스로를 자동화하는 일을 하고 있는 기분”이라는 직설적인 표현을 쓰기도 함
    • 일부는 특히 주니어 개발자의 미래를 걱정하면서도, 동시에 그들이 새 기술을 가장 빠르게 받아들이는 세대라는 점에서 희망을 보기함
      • AI가 실수한 코드를 주니어가 그대로 배포할 위험이 있지만, 더 나은 가드레일·교육 자료·실수에서의 학습이 결합되면 시간이 지나며 적응할 수 있을 것이라는 기대도 함께 제시됨
    • 미래 전략과 적응 방식으로는 여러 답변이 나옴
      • AI 산출물을 의미 있게 리뷰하고 감독하는 능력을 새로운 전문성으로 삼겠다는 계획
      • 사람 사이의 합의 형성·조정·전략 수립에 더 많은 시간을 쓰고, 구현은 AI에게 더 많이 맡기는 역할로 이동할 것이라는 기대
      • Claude를 활용해 리더십·커뮤니케이션·커리어 개발 피드백을 받으며, 학습 속도를 끌어올리고 있다는 사례도 소개됨
    • 전반적인 정서는 “미래에 어떤 스킬이 가장 중요할지에 대한 확신은 매우 낮다”는 인식과, “중요한 것은 어떤 일이 오든 빠르게 적응할 수 있는 사람·조직이 되는 것”이라는 태도로 요약됨

Claude Code usage trends

  • 더 어려운 문제와 더 높은 자율성

    • Anthropic은 내부 프라이버시 보호 도구를 이용해 2025년 2월과 8월, 두 시점의 Claude Code 내부 로그 20만 건을 분석했음
      • 각 대화 기록을 1~5점 난이도 스케일로 평가했을 때, 평균 난이도는 3.2에서 3.8로 상승했음
        • 난이도 3.2 수준 예시는 “Python 모듈 import 에러 해결”, 3.8 수준 예시는 “캐싱 시스템 구현 및 최적화” 등임
    • Claude Code가 사람 개입 없이 연속적으로 수행하는 도구 호출 수는 평균 9.8회에서 21.2회로 116% 증가했음
      • 이는 Claude가 연속적인 파일 수정·명령 실행을 더 길게 스스로 이어가며 복잡한 작업을 처리한다는 의미임
    • 대화당 인간 턴 수는 평균 6.2에서 4.1로 33% 감소했으며, 동일한 작업을 달성하는 데 필요한 인간 상호작용이 줄어드는 경향이 드러남
      • 이런 지표를 종합하면, 엔지니어들이 더 복잡한 업무를 Claude에게 더 많은 자율성을 주고 맡기고 있음을 시사함
  • 작업 분포 변화

    • Claude Code 로그의 각 대화를 디버깅·코드 이해·리팩터링·테스트·새 기능 구현·코드 설계/플래닝·프론트엔드·데이터 사이언스 등으로 분류해 작업 분포를 비교했음
      • 전체 분포는 설문에서 사람들이 보고한 주 사용 패턴(디버깅·코드 이해·새 기능 구현 중심) 과 대체로 일치함
    • 6개월 사이 가장 두드러진 변화는 새 기능 구현과 코드 설계/플래닝 비중의 급증
      • 새 기능 구현은 전체 로그 중 14.3%에서 36.9%로 증가했고, 설계·플래닝 관련 작업도 1.0%에서 9.9%로 증가했음
      • 이는 Claude가 더 복잡하고 창의적인 작업에서 쓰이는 비중이 커졌거나, 팀들이 Claude Code를 이런 워크플로에 적극 도입하기 시작했음을 의미할 수 있다고 설명함
      • 연구진은 절대 작업량 증가와 상대적 분포 변화를 명확히 분리하기는 어렵다고 언급하며, 이 점을 한계로 남겨둠
  • Papercut 수정

    • 설문에서 사람들이 자잘한 품질 개선·생활 편의 개선 작업을 더 많이 하게 되었다고 답한 것과 일치하게, Claude Code 로그에서도 전체 작업의 8.6%가 ‘papercut fix’로 분류
      • 여기에는 성능 시각화 도구 제작, 유지보수성 향상을 위한 리팩터링, 터미널 단축키나 스크립트 같은 작은 편의 기능 구축이 포함됨
    • 이런 작업들은 개별적으로는 작지만, 누적될수록 생산성과 개발자 경험을 눈에 띄게 개선할 수 있는 요소로 작동함
      • 원래는 우선순위에서 밀려 미뤄지던 일들이 Claude 덕분에 부담이 줄어들어 자연스럽게 처리되고 있다는 점이 특징임
  • 팀별 사용 차이

    • 2025년 8월의 Claude Code 로그를 기준으로, 각 대화를 주 작업 유형 하나로 태깅해 팀별 분포를 비교한 결과가 Figure 5로 제시됨
      • 전체 평균(“All Teams”)에서는 새 기능 구현·디버깅·코드 이해가 가장 큰 비중을 차지해, Claude 사용의 기본 패턴을 보여줌
    • 주요 팀별 특징은 다음과 같음
      • Pre-training 팀은 Claude Code 사용의 54.6%를 새 기능 구현에 사용하며, 특히 다양한 추가 실험 실행이 큰 비중을 차지함
      • Alignment & Safety 팀, Post-training 팀은 프론트엔드 개발 비중이 각각 7.5%, 7.4%로 높으며, 주로 데이터 시각화를 위한 UI 구축에 Claude를 활용함
      • Security 팀은 Claude Code 사용의 48.9%가 코드 이해 작업으로, 낯선 코드의 보안적 함의를 분석·파악하는 용도로 자주 사용함
      • Non-technical 직원들도 Claude Code를 많이 쓰는데, 51.5%가 디버깅(네트워크 이슈, Git 문제 등), 12.7%는 데이터 사이언스 작업에 해당하며, 기술적 지식의 간극을 메우는 도구로 활용되고 있음
    • 전반적으로 팀들은 자신의 핵심 업무(인프라, 연구, 보안 등) 에도 Claude를 활용하지만, 동시에 전통적인 전문 영역 바깥 작업에도 Claude를 써서 모두가 조금씩 더 풀스택에 가까워지는 양상이 데이터로 확인됨

Looking forward

  • Anthropic 내부에서의 다음 단계

    • Anthropic은 지난 1년간의 변화를 바탕으로, Claude를 활용한 업무 전환을 책임감 있게 관리하는 ‘실험실’ 역할을 자임하고 있음
      • 엔지니어·연구자·리더십과 함께 협업 방식·회의와 소통 구조·직무별 역할 정의를 다시 점검하고, AI 보조 업무를 전제로 한 새로운 베스트 프랙티스를 만들려는 작업을 시작했다고 밝힘
    • 특히 전문성 개발·멘토십·승진과 성장 경로가 AI 시대에 어떻게 달라져야 하는지에 초점을 맞추고 있으며, 여기에는 Anthropic이 이미 공개한 AI fluency framework도 참고되고 있음
      • 사람과 AI가 함께 일할 때, 어떤 수준의 이해·감독·피드백 능력을 갖춰야 하는지를 정의하는 프레임워크를 기반으로, 실질적인 교육·내부 정책을 설계하려는 움직임임
    • 이번 연구는 엔지니어 중심이지만, 앞으로는 비개발 직군까지 범위를 확장해 Anthropic 전체에서 AI가 업무를 어떻게 바꾸는지 살펴볼 계획이라고 밝힘
  • 외부 파트너십과 교육, 장기 계획

    • Anthropic은 내부 연구와 함께, 외부 조직이 AI 보조 시대에 적응하도록 돕는 역할도 병행하고 있음
      • 예로, CodePath와 협력해 컴퓨터 과학 커리큘럼을 AI 보조 환경에 맞게 개편하는 작업을 지원 중이라고 언급함
      • 이는 주니어 개발자 교육·초기 경력자 학습 경로를 AI 도구 사용을 전제로 다시 설계해야 한다는 문제의식을 반영함
    • 앞으로는 조직 내 역할 재설계·리스킬링 경로·새로운 직무 전환 루트 같은 구조적 접근이 점점 더 중요해질 수 있다고 보고 있음
      • 예를 들어, AI 에이전트 감독·품질 책임·윤리 검토 등 새로운 역할을 공식 직무로 인정하는 형태 등이 논의될 수 있음
    • Anthropic은 2026년에 더 구체적인 계획을 공개하겠다고 예고하며, 이번 연구를 시작점이자 중간 점검으로 위치시킴
      • 핵심 메시지는 Anthropic이 AI가 일을 바꾸는 과정을 단순히 관찰하는 데서 그치지 않고, 스스로 먼저 실험·조정하면서 ‘책임 있는 전환’ 모델을 만들려 한다는 점임