엔지니어 이직을 멈추는 경제적 개입 방법
(codegood.co)- 시니어 엔지니어 이탈 문제는 정보 흐름이 아닌 경영진 인센티브 구조의 문제이며, 분기별 성과에 최적화된 보상 체계가 장기 투자를 요하는 인재 유지와 근본적으로 충돌
- 시니어 엔지니어 1명 이탈 시 총비용은 50만~100만 달러에 달하며, 채용비, 공석 비용, 온보딩, 부족 지식(tribal knowledge) 손실 등이 여러 예산에 분산되어 보이지 않음
- 14개월 전 경고를 무시한 결제 처리 회사가 블랙프라이데이에 347만 달러 손실을 입은 사례에서, 원래 수정 비용은 8만 달러에 불과했음
- 6가지 구조적 개입(이탈비용 회계, 사고 추적, 경영진 온콜, 보상에 유지율 반영, 기술자문위원회, IC 트랙 동등 보상)이 인센티브를 재정렬하는 해결책으로 제시
- 이러한 개입은 경영진이 유지율을 경제적 문제로 인식하고 구조적 변화를 수용할 의지가 있을 때만 효과적이며, 형식적 시행은 오히려 역효과 초래
정보가 흘러도 행동이 바뀌지 않는 이유
"The constraint is not information flow. It is economics."
- 이 글은 엔지니어 이탈을 다룬 연작의 2편으로, 1편 왜 당신의 최고 엔지니어들이 다른 곳에 면접을 보고 있을까에서 다룬 정보 비대칭 문제 이후의 상황을 이어서 다룸
- 1편에서는 시니어 엔지니어가 왜 떠나는지 설명했으며, 핵심 원인은 문제가 존재해도 경영진에게 도달하지 않는 구조였음
- 하지만 이 글은 그 가정을 한 단계 더 밀어붙임
- 정보 흐름을 실제로 개선했을 때 어떤 일이 벌어지는 지를 다룸
- 결론은 직관과 다르게, 아무것도 바뀌지 않는 경우가 대부분이라는 점임
- 조직은 문제를 인지하기 위해 여러 장치를 도입함
- 스킵 레벨 1:1 미팅 도입
- 익명 피드백 채널 운영
- 외부 컨설턴트를 통한 리텐션 설문 진행
- 그 결과 엔지니어들은 매우 명확하게 문제를 전달함
- 기술 부채가 사기를 갉아먹고 있음
- 아키텍처 결정에서 전문성이 무시되고 있음
- 온콜 부담이 지속 가능하지 않은 수준임
- 경영진은 이를 듣고 고개를 끄덕임
- 문제를 인정함
- 우선순위를 조정하겠다고 말함
- 그러나 분기가 바뀌면 의사결정은 이전과 동일하게 반복됨
- 동일한 방식으로 분기 목표를 달성함
- 그리고 그 방식은 방금 들은 문제들을 다시 무시하는 것임
- 이 지점에서 글은 핵심을 분명히 함
- 문제는 정보 부족이 아님
- 문제는 경제적 구조, 즉 인센티브 설계임
핵심 문제: 임원의 인센티브 구조
-
VP of Engineering이 10월에 직면한 의사결정 계산 사례
- 분기 성과 검토 3개월 전이고 엔지니어의 주식 베스팅까지는 6개월 남음
- 한 명의 시니어 플랫폼 엔지니어가 다음과 같이 요청함
- 인증 시스템을 6주간 리팩터링하고 싶다는 것
- 기술 부채가 누적되어 있고 구조가 취약해짐
- 보안 연구자 두 명이 이미 위험 신호를 전달했음
- 하지만 현재 상태는 애매함
- 실제 장애는 없고, 고객 불만도 없고, 매출 영향도 없음
- 존재하는 것은 “지금 고치지 않으면 위기가 된다”는 엔지니어의 경고뿐임
- VP에게는 두 가지 선택지가 존재함
-
선택지 A: 리팩터링 승인
- 6주간 기능 개발 속도 감소 감수
- 분기 OKR 미달 가능성 발생
- CEO에게 “고객이 보지 못하는 기술 작업” 때문에 로드맵이 지연된 이유를 설명해야 함
- 이미 세일즈 팀이 약속한 기능 출시 일정이 흔들릴 위험
- 결과적으로 연말 보너스에 직접적 악영향 가능성 존재
- 이 선택의 보상은 12~18개월 뒤에 받음 : 해당 시니어 엔지니어가 “기술 판단이 존중된다” 는 이유로 조직에 남는 것
-
선택지 B: 기능 우선 결정
- 기술 부채를 “중요하다”고 인정하되 “다음 분기”로 미룸
- 예정된 로드맵을 그대로 출시하여 OKR 달성하고, 보너스 수령
- 시니어 엔지니어는 당장은 남아 있음. 스톡 옵션이 아직 베스팅되지 않았기 때문
- 인증 시스템이 나중에 터지면 그것은 미래 분기의 문제
- 엔지니어가 6개월 뒤 떠나면 채용으로 대체 가능하다고 판단
-
선택지 A: 리팩터링 승인
- 이 구조에서 선택지 B가 항상 이김 - 결국 실패할 때까지
- 제품 출시 중 핵심 시스템 장애가 발생하고, 18개월 사이 시니어 엔지니어 5명 이탈하며, CFO가 “왜 재채용 비용으로 매년 140만 달러를 쓰고 있는가”를 묻기 시작할때까지 B가 이김
-
근본적 불일치 이기 때문
- 임원 보상 구조는 분기 단위 성과에 최적화되어 있음
- 하지만, 엔지니어 유지와 기술 부채 해소는 장기 투자를 요구함
- 정보 흐름 개선만으로는 이 간극을 메울 수 없음
- 경제적 구조 자체의 재설계가 해결책
Why the Math Favors Dysfunction - 계산해보면 장애가 나는게 당연함
- 숨겨진 비용은 눈에 보이지 않는 방식으로 작용하여 합리적인 행위자들이 비합리적으로 행동하게 만듦
- 연봉 $200,000 수준의 시니어 엔지니어 1명이 떠날 경우 실제 총비용은 $500,000 ~ $1,000,000 이상으로 계산됨
- 대부분의 경영진은 이 수치를 듣고 과장된 것이라고 생각하지만 그렇지 않음. 계산 방법은 다음과 같음
-
직접 대체 비용: $85,000-$100,000
-
채용 수수료: 외부 리크루터 수수료 20-25% 로 20만 달러 엔지니어의 경우 $40,000-$50,000
- 내부 채용(구인 게시판, 소싱 도구, 리크루터 급여) 자체 처리 시 $15,000-$20,000
-
사이닝 보너스: 경쟁 시장에서는 시니어 후보 확보에 $20,000-$40,000 필요
- 특히 그들의 현재 회사에 지분을 남겨두고 옮길 때는 필수
- 이사 비용: 해당 시 국내 이사라면 $10,000-$30,000, 해외는 더 높음
-
채용 수수료: 외부 리크루터 수수료 20-25% 로 20만 달러 엔지니어의 경우 $40,000-$50,000
-
공석(Vacancy) 비용: $50,000-$100,000
- 시니어 엔지니어 채용까지 평균 3-6개월 소요
- 공석 기간 동안 해당 엔지니어의 업무는 중단되지 않고 두 가지 비용이 동시에 발생함
- 하나는 업무 재분배로 인해 팀 생산성이 저하되는 것이고, 다른 하나는 업무 포기로 인해 기회비용이 발생하는 것
-
업무 재분배 비용 $25,000-$40,000:
- 떠난 엔지니어 업무의 약 60% 가 남은 팀원에게 분산
- 업무 자원의 자유로운 재배치가 아니라 생산성 저하로 이어짐
- 이미 업무량이 포화 상태인 엔지니어들은 이제 익숙하지 않은 영역의 코드 리뷰를 처리하고, 자신이 개발하지 않은 시스템에 대한 질문에 답하며, 완전히 이해하지 못하는 서비스를 유지 관리해야함
- 엔지니어 3명이 각각 20% 추가 업무 흡수 시 단순히 20% 더 일하는 것이 아니라 컨텍스트 전환으로 전체 효율 감소
- 공석 기간 동안 엔지니어당 10-15% 생산성 손실을 초래
-
업무 재분배 비용 계산
- 업무를 흡수하는 엔지니어 수 × 생산성 감소율 × 공석 기간(개월) × (평균 연봉 / 12)
- 일반적인 시나리오에서는 3명의 엔지니어 × 12% 생산성 감소 × 4개월 × ($180,000 / 12) = $21,600
- 이탈한 엔지니어가 인프라·보안·플랫폼처럼 전문성이 높은 영역을 담당했을 경우 $30,000–$40,000 수준까지 상승
-
업무 포기 비용 $25,000-$60,000:
- 나머지 40%는 재분배되지 않고 이연 또는 완전 포기
- 플랫폼 개선, 기술 부채 감소, 아키텍처 진화, 문서화, 멘토링 등 기능 출시와 무관하지만 미래 위기 예방 업무인데 조용히 로드맵에서 제외됨
- 업무 포기(Work Abandonment)의 즉각적인 비용은 수행되지 않은 작업의 급여 환산 가치로 계산됨
- 이탈한 엔지니어 업무의 40% 가 공석 기간 동안 수행되지 않음
- 계산식은 40% × 4개월 × ($200,000 / 12) = $26,667
- 하지만 진짜 비용은 즉각적으로 끝나지 않음
- 미뤄진 작업은 이후 분기들에 걸쳐 누적 비용을 만들어냄
- 예를 들어
- 시니어 인프라 엔지니어가 계획했던 데이터베이스 최적화가 연기되면
- 쿼리 성능이 점진적으로 저하되고
- 결국 원래 작업 범위를 훨씬 넘는 긴급 대응이 필요해짐
- 해당 엔지니어가 담당하던 아키텍처 리뷰가 중단되면
- 비용이 큰 실수를 사전에 걸러낼 수 있는 전문성이 사라진 상태에서
- 기술적 의사결정이 진행됨
- 시니어 인프라 엔지니어가 계획했던 데이터베이스 최적화가 연기되면
- 측정 가능한 업무 포기 비용은
- “원래 했어야 했지만 하지 않은 작업”의 가치임
- 보수적인 계산식은 다음과 같음
- (포기된 업무 비율 × 연봉 / 12) × 공석 개월 수
- (40% × $200,000 / 12) × 4개월 = $26,667
- 현실적인 업무 포기 비용 범위는 $25,000–$60,000
- 포기된 작업이 예방적인지 기능 중심적인지 비중에 따라 달라짐
-
총 공석 비용(Combined Vacancy Cost): $50,000–$100,000
- 업무 재분배 비용 $25,000–$40,000 + 업무 포기 비용 $25,000–$60,000 두 항목을 합산한 결과임
- 이는 4개월간 자리가 비어 있는 상태에서 발생하는 직접적이고 측정 가능한 영향만을 반영한 수치임
- 계산 자체는 보수적으로 이루어짐
-
온보딩 및 적응 비용: $100,000-$125,000
- 새 시니어 엔지니어 생산성: 1개월차 약 25%, 2-3개월차 50%, 4-5개월차 75%, 6개월차 전체 생산성 도달
- 1개월 차: 생산성 75% 손실 = (200,000달러 / 12개월) × 0.75 = 12,500달러
- 2~3개월 차: 생산성 50% 손실 = (200,000달러 / 12개월) × 0.50 × 2 = 16,667달러
- 4~5개월 차: 생산성 25% 손실 = (200,000달러 / 12개월) × 0.25 × 2 = 8,333달러
- 첫 6개월 생산성 격차 총합: $37,500
-
온보딩 인력 비용: 새 시니어 엔지니어가 첫 달 주당 10-15시간, 2-3개월차 주당 5-8시간의 다른 엔지니어 시간 소비
- 1개월 차: 주 12시간 × 4주 × 시간당 90달러 = 4,320달러
- 2~3개월 차: 주 6시간 × 8주 × 시간당 90달러 = 4,320달러
- 시간당 $90 기준 온보딩 인력 비용: $8,640
- 즉 첫 6개월 동안 $46,140의 손실 이 발생함
- 하지만 대부분의 시니어 엔지니어가 이전 엔지니어 수준의 도메인 전문성에 도달하는 데 약 1년 소요되므로 $92,000-$125,000 예상
- 새 시니어 엔지니어 생산성: 1개월차 약 25%, 2-3개월차 50%, 4-5개월차 75%, 6개월차 전체 생산성 도달
-
부족 지식(Tribal Knowledge) 손실: $100,000-$300,000
- 가장 정량화하기 어렵지만 이후 분기에 실수로 나타남
- 이탈 엔지니어가 알고 있던 것들:
- 코드베이스의 어느 부분이 취약하고 신중한 변경이 필요한지
- 어떤 고객이 특별 요구사항을 가졌고 그 이유
- 어떤 아키텍처 결정이 의도적 트레이드오프인지 vs 기술 부채인지
- 10,000줄 서비스에서 실제로 중요한 3줄의 코드
- 특정 데이터베이스 쿼리가 비효율적으로 보이지만 그렇게 작성된 이유(3년 전 발견된 특정 조건에서 "명백한" 최적화가 데이터 손상 유발)
-
맥락 부재로 인한 실수: 새 엔지니어가 "느린" 쿼리 최적화 시 회사 2대 고객의 핵심 워크플로 중단
- 문제 파악 2일($4,615), 적절한 수정 구현 1주($7,692), 고객 관계 복구
- 단일 사고 비용 약 $12,000-$15,000, 이탈 시니어 엔지니어당 첫해 3-5회 발생
-
의사결정 지연: 이탈 엔지니어가 30초에 답했을 질문이 이제 3시간의 코드 고고학, Slack 히스토리 검색, "왜 이렇게 했는지 아는 사람?" 대화 필요
- 주 2회, 6개월간 발생 시: $14,040
-
이연 또는 포기된 프로젝트: 이탈 엔지니어만이 인증 시스템을 충분히 이해해 SSO 통합을 안전하게 구현 가능
- 해당 프로젝트 6-9개월 지연, SSO가 50만 달러 기업 계약에 필요했다면 지연 비용 측정 가능
- 이런 내부 지식 손실에 대한 보수적인 추정치: 퇴사 후 12개월 동안 10만 달러에서 30만 달러까지
-
엔지니어 이탈당 총비용
- 직접 대체: $85,000-$100,000
- 공석 비용: $50,000-$100,000
- 적응 및 온보딩: $92,000-$125,000
- 내부 지식 손실: $100,000-$300,000
- 보수적 총계: $327,000-$625,000
- 프로젝트 지연 및 기회비용 포함 현실적 총계: $500,000-$1,000,000
- 이러한 비용은 예산 전체에 분산되고 노이즈에 숨겨짐: 채용비는 HR 예산, 생산성 손실은 추적 안 됨, 내부 지식 증발은 분기 보고서에 미표시
- 기술 부채 이연 및 기능 우선 결정은 즉각적이고 가시적인 성과 창출: 영업팀 데모, 마케팅 출시 발표, CEO의 이사회 보고 등
- 경제학자들이 "끓는 개구리" 문제라 부르는 현상임:
- 개별 직원의 퇴사는 감당할 수 있는 것처럼 보이고, 기술 업무 연기는 합리적으로 보이며, 분기별 절충안도 개별적으로는 정당해 보임
- 패턴이 명백해질 때(연간 시니어 엔지니어 이탈률 18%, 누적 기술 부채, 연쇄 시스템 장애)에는 조직은 이미 기능 장애를 정상적인 것으로 받아들이게 됨
회복(Recovery)은 어떤 모습으로 보이는가
- 블랙프라이데이 재앙 14개월 전, 중견 결제 처리 회사의 시니어 플랫폼 엔지니어가 구체적 우려를 제기
- "트랜잭션 처리 시스템이 예상 홀리데이 트래픽을 감당하지 못합니다"
- 데이터베이스 샤딩 및 큐 최적화가 필요하다는 상세 제안 제출: 엔지니어링 시간 6주, 인프라 비용 $80,000 추정
-
VP of Product에 의해 우선순위가 밀림:
- 다른 두 개의 기능 출시가 더 중요하다고 판단됨
- 분기 리뷰에서는 "잠재적 문제를 사전에 파악한 능력"을 칭찬했지만, 아키텍처 제안서는 Jira에 방치함
- 해당 엔지니어는 4개월 후 15% 인상 받고 경쟁사로 이직, 3개월 탐색과 $47,000 채용비 소요 후 대체 인력 채용, 생산성 도달에 5개월 추가 소요
- 그 사이 시니어 엔지니어 2명 추가 이탈: 1명은 기술 부채 좌절감, 1명은 사내에 없던 Principal Engineer 역할을 외부에서 수락
- 그 최초 경고가 다시 논의된 시점은 9개월 후 아키텍처 리뷰
- 당시에는 이미 제안의 맥락과 해결 방법에 대한 조직적 기억이 사라진 상태
- 주니어 엔지니어에게 “대안을 조사”하라는 임무가 할당됨
-
블랙프라이데이 당일, 오전 9시 47분 트랜잭션 급증하며 재앙이 시작
- 오전 10시 23분부터 데이터베이스가 쓰기 요청을 거부
- 병목은 14개월 전 지적된 바로 그 지점이며, 해당 장애로 인해 $2.5M 규모의 트랜잭션 처리 실패
- 복구에는 5시간이 소요됨
- 긴급 인프라 확장 비용 $180,000 과 영구적 아키텍처 변경을 위해 엔지니어 3명이 휴일 내내 초과 근무
-
12월 3일, CTO 주도로 새로운 항목이 포함된 포스트모템이 경영진에 제출됨
- “Previously Raised Concerns” 섹션 추가되어 그 엔지니어의 최초 경고, 우선순위 배제 결정, 이후의 인력 이탈을 모두 기록
- CFO가 총비용을 계산해 봄
-
엔지니어 이탈 비용(시니어 3명) : 1인당 $235,000의 측정 가능한 비용 발생
- 리크루팅 $47,000 + 사이닝 보너스 $30,000 + 공석 비용 $83,000 (평균 4개월) + 온보딩·램프업 $75,000
- 총합 $705,000
-
트라이벌 지식 손실 비용: $2.2M
- 데이터베이스 구조, 실패 모드, 기존 해결책에 대한 이해가 조직에서 사라짐
- 문제를 다시 발견하고, 해결책을 재조사하고, 긴급 상황에서 구현해야 했음
- 이러한 지식 격차는 계획된 마이그레이션을 위기 대응으로 바꿔 버림
- 조사 비용, 잘못된 시도, 긴급 벤더 투입, 가맹점 대응 비용이 누적됨
-
실패한 트랜잭션 비용:
- 결제 처리 실패 금액 $2.5M
- 수수료율이 2.9%였으므로 직접 매출 손실은 $72,500 이지만, 계약상 모든 거래를 처리해야할 의무가 있음
- 그래서 처리 실패로 인한 SLA 위반 벌금 $180,000 및 가맹점 지원 및 이탈 방지 비용 $45,000 발생
-
긴급 인프라 비용: $180,000
- 긴급 데이터베이스 확장(추가 읽기 복제본, 업그레이드 된 인스턴스, Expedited 벤더 서포트 비용)
- 로드밸런서 재설정 및 CDN 최적화로 14개월 전에 예상했던 트래픽을 처리 가능하게 함
-
복구 및 사후 조치 비용: $87,000
- 시니어 엔지니어 3명 휴일 주말 72시간 2.5배 초과근무율 근무: $51,923
- 더 넓은 엔지니어링 팀 2주 후속 작업: $38,462
- 총 사고 비용: $3.47M
- 원래 제안된 예방 비용: $80,000 (선임 엔지니어 1명의 6주 엔지니어링 작업 시간과 인프라 비용 포함)
- 포스트모템 첫 페이지에는 $3.47M vs $80,000 라고 적혀있는데 이 숫자가 대화의 방향을 바꿈
- CEO가 이사회 질문에 대응해 유지율 분석을 지시
- 시니어 엔지니어 이탈률 연간 34%(수익성 있는 회사 업계 평균의 2배 이상)
- 이전에 경영진 검토 없이 보관된 퇴사 인터뷰에서 일관된 패턴이 나타남
- 재능 있는 엔지니어들이 기술적 우려가 인정되었지만 실행되지 않을 때 이탈
-
18개월간 4가지 개선조치 시행:
- CFO가 분기 보고서에 고객 획득 비용과 함께 이탈 비용 추적 시작 — 갑자기 $235,000 평균 이탈 비용이 마케팅 지출 결정같은 문서에 등장
- 모든 경영진 분기별 온콜 로테이션에 참여 — 데이터베이스 작업 우선순위 하향한 VP of Product는 첫 주 23페이지 분량의 보고서를 수신했는데, 19건이 이전 6개월간 지적된 기술 부채 관련
- 보상위원회가 임원 변동 급여에 인재 유지 요소를 추가: 시니어 엔지니어 90% 연간 유지하는 것은 보너스 계산의 25% 가치
- 디렉터 및 VP 수준과 보상 일치하는 Staff 및 Principal IC 트랙 신설
- 18개월 후, 이 결제회사는 시니어 엔지니어 이탈률이 연간 9%로 감소
- 더 중요한 것은 아키텍처 리뷰 프로세스 변화:
- 기술 부채 제안에 이제 계산된 장애 비용이 포함
- 경영진은 일상적으로 "이것을 이연하면 엔지니어 이탈 위험은 얼마나 되나요?"라고 질문
- 원래 데이터베이스 우려 제기했던 플랫폼 엔지니어가 Principal Engineer로 복귀
- 퇴사 당시 대비 연봉 40% 인상 — 특별히 인프라 확장 리드로 채용
- 해당 엔지니어의 복귀는 숫자가 보여준 변화와 함께 조직의 경제적 계산이 실제로 바뀌었음을 상징함
실제로 효과가 있었던 여섯 가지 개입(Intervention)
- 인센티브를 재정렬하는 구조적 개입, 정보 수집이나 공감 활동이 아니라 경제적 재설계
-
영향력의 계층 구조
- 6가지 개입이 부담스러워 보일 수 있으나 구현 난이도와 가치 창출 시간이 동일하지 않음, 순서가 중요
-
가장 빠른 성과를 내는 방법: 조직의 최소한의 동의만 필요한 개입
- 이탈비용 회계(#1): CFO 승인과 재무 분석가 시간만 필요
- 무시된 경고로 인한 사고 추적(#2): SRE 프로세스 변경만 필요. 예산이나 구조 조정이 필요 없고, 체계적인 사후 분석 문서화만 있으면 됨
- 둘 다 30일 내 시작 가능, 더 어려운 싸움을 위한 정량화된 증거 제공
-
중기 개입: 문화 변화 필요하지만 보상 구조조정 불필요
- 경영진 온콜 로테이션(#3): 한 경영진이 인프라 개선 작업 연기의 결과를 직접 경험할 때 성공하며, 그 정책은 자연스럽게 자리 잡음
- 권한 있는 기술자문위원회(#5): 경영진이 자신의 결정이 번복될 가능성을 진정으로 받아들일 때 효과를 발휘하며, 소규모로 시범 운영되는 방식은 몇 분기 내에 실패
- 구현 일정 3-6개월 : 단순한 정책 변경뿐 아니라 신뢰 구축을 필요로 하기 때문
-
구조적 개입: 이사회 또는 보상위원회 승인 필요, 6-12개월 소요하지만 가장 깊은 변화 제공
- 보상 체계 내 인재 유지 지표 포함(#4): 경영진 보너스가 시니어 엔지니어 유지에 의존 시 기술 부채가 하룻밤 사이 전략적으로 중요해짐
- IC 트랙의 동등성 확보(#6): Staff 엔지니어가 팀 관리 없이 수석급 급여 시 기술 전문성 유지가 구조적으로 가능해짐
-
최소 실행 가능 개입: 다른 계층의 두 요소 결합
- 이탈비용 회계(빠른 성과) + 보상에 유지 지표(구조적 변화)
- 첫 번째가 비즈니스 케이스 구축, 두 번째가 경영진에게 행동을 합리적으로 만듦
- 위기 상황 회사: 빠른 성과 즉시 시행 + 구조적 변화 병행 설계
- 조기 경고 징후 회사: 측정(비용 회계, 사고 추적)으로 시작 + 결과 데이터로 더 깊은 개입 정당화
-
1. 이탈 비용 회계 (Cost-of-Attrition Accounting)
-
보이지 않는 것을 보이게 만들기: 모든 시니어 엔지니어 이탈의 전체 비용 계산
- 평균 리크루팅 비용 $35,000
- 완전한 생산성 도달까지 약 6개월(시니어 엔지니어 연봉의 50%)
- 지식 손실로 인한 프로젝트 지연
- 해당 엔지니어만 이해했던 아키텍처 결정의 기회비용
- 이 수치를 월별로 추적하고 CAC, 매출 지표와 같은 임원 대시보드에 포함시킴
- 한 금융 서비스 회사는 분기별 이탈 비용을 추적한 결과
- Q1: 시니어 2명 이탈, $400,000
- Q3: 연간 예상 비용 $900,000
- CFO가 이를 연간 엔지니어링 예산 $3M과 함께 제시하자
- CEO의 질문이 “왜 떠났나”에서 “막으려면 얼마가 필요한가” 로 바뀜
- 결과적으로 기술 부채 정리와 보상 조정에 $400,000 투자하자
시니어 이탈률 43% 감소하고 투자 비용은 두 분기 만에 모두 회수
-
보이지 않는 것을 보이게 만들기: 모든 시니어 엔지니어 이탈의 전체 비용 계산
-
2. 무시된 경고로 인해 발생한 사건을 추적하기
- 사후분석 템플릿을 수정하여 필수 섹션인 "사전 경고(Prior Warnings)" 추가
- 담당자가 Jira, Slack, 아키텍처 리뷰 노트, 이메일에서 이 장애 모드에 대한 과거 경고를 확인하도록 요구
- 문서화 항목: 경고 제기 시점, 제기자, 제안된 조치, 우선순위 하향 이유
- 사고 비용 계산: 다운타임 수익 영향, 고객 지원 부담, 복구에 소요된 엔지니어 시간
- 한 헬스케어 기술 회사는 이 방식을 도입한 뒤
- 6개월 내 프로덕션 사고의 70%가 사전 예측되었음을 발견
- 엔지니어들이 우려 제기했지만 경영진이 기능 개발에 집중하느라 문제 해결 우선순위 하향
- 1년간 총 비용: 예방 가능한 사고에 180만 달러의 비용이 발생 함
- 16건 주요 장애 중 14건에서 기술 경고가 정확했음을 경영진이 확인 시 패턴의 심각성을 깨달음
- 예측이 일관되게 정확함이 입증되자 행동 변화
-
3. 경영진 온콜 로테이션
- 모든 임원(프로덕트, VP, 디렉터 포함)이 분기당 1주씩 온콜 수행
- 에스컬레이션 정책:
- 온콜 엔지니어가 알림이 이전에 우선순위가 낮았던 수정 사항이나 연기된 기술 작업과 관련이 있다고 판단할 경우
- 시간이나 요일에 관계없이 해당 결정을 내린 책임자에게 직접 보고
- 이는 어떤 대시보드보다 강력한 체험 학습을 제공함
-
사례: 한 VP of Product가 7개월 전 엔지니어들이 "있으면 좋은" 수정으로 플래그한 동일한 데이터베이스 연결 풀 이슈로 5일간 17건의 호출을 경험
- 해당 이슈는 P3로 표시되었고, VP는 대신 3개 기능 출시 우선
- 5번 연속 새벽 3시 호출 후 P0으로 변경, 8일 내 수정
- 나중에 해당 VP는 "엔지니어들이 알림 피로에 대해 과장한다고 생각했음. 아니었음" 이라고 인정함
-
4. 임원 보상에 인재 리텐션 지표 반영
- 경영진 변동 보상의 25%가 시니어 엔지니어 유지율에 의존하도록 구조 개편
- "시니어" 정의: 재직 기간 2년 이상, 성과 평가에서 기대치를 뛰어넘는 경우, 또는 핵심 시스템 담당
- 목표 설정: 시니어 엔지니어 연간 90% 유지
- 목표 미달 시 보너스 비례적으로 삭감
- 목표 초과 시 보너스가 배율로 지급
-
사례: Series B SaaS 회사가 2021년 이 구조 시행
- 시니어 엔지니어 이탈 연간 28%
- 경영진 초기 저항: "누군가가 더 나은 제안을 받는 것을 우리가 통제할 수는 없다"라며 반대함
- CEO 응답: "그러면 우리가 연봉 외에는 경쟁력이 없다는 것을 인정하는 셈. 개선하거나 보상 영향 수용하라"
- 1년 내 이탈률 11%로 감소
- 퇴사 인터뷰 패턴 전환: 떠나는 엔지니어들이 기능장애 기반 이탈(무시된 기술 우려, 성장 부재, 문화 독성)이 아닌 기회 기반 이탈(더 큰 회사 수석 승진, 스타트업 창업, 이전) 언급
- 경영진이 이제 인재 유지에 대한 책임감을 갖게 되면서, 보너스 목표 달성은 가장 쉬운 부분이 되어버림
-
5. 실질 권한을 가진 기술 자문 위원회(TAB)
- 엔지니어링 조직이 선출한(경영진 임명 아닌) 시니어 엔지니어 5명으로 위원회 구성
- C 레벨들과 분기별 미팅
- 하나의 권한: 분기당 경영진 결정 1건 거부 가능
- 요구사항: 거부 시 기술적 정당화, 예상 비용, 위험 분석 포함 서면 대안 제안 필수
- 경영진은 CEO 승인과 문서화된 이유로만 거부권 무효화 가능
-
사례: 블록체인 인프라 회사가 2020년 초 TAB 구성
- 2년간 거부권 2회 행사
- 첫 번째 거부: 독점 합의 프레임워크 구축 결정 차단, 대신 기존 오픈소스 프로토콜 확장 제안. 추정 18개월 개발 시간 절약
- 두 번째 거부: 포괄적 롤백 테스트 없이 데이터베이스 마이그레이션 출시 방지. 사후 구현 분석에서 TAB이 200만 달러 데이터 손상 사고 예방 추정
- 진짜 영향은 더 미묘: 경영진이 기술 결정 최종화 전 "TAB이 이것 승인할까?" 묻기 시작
- 거부 위협이 TAB 도달 전 제안 품질 변화
- 엔지니어들이 기술적 판단이 마침내 경영진 결정에 중요해졌다고 보고
-
6. 보상 동등성을 갖춘 IC(개인 기여) 트랙
- IC 경력 발전 경로를 명확하게 설정 : Staff Engineer, Principal Engineer, Distinguished Engineer
- 보상 밴드가 각각 Director, VP, SVP 수준과 일치해야 함
- 승진 기준: 팀 규모나 보고 체계보다는 기술적 영향력, 아키텍처에 대한 주도권, 다른 엔지니어들의 업무 효율성을 높이는 파급 효과
-
사례: 핀테크 회사가 6개월 내 Staff급 엔지니어 3명 이탈
- 퇴사 인터뷰에서 동일 패턴: "매니저가 되지 않고는 L7 보상에 도달 불가. 관리하고 싶지 않고 개발자가 되고 싶음"
- 회사가 보상 동등성 있는 IC 트랙 시행
- 1년 내: 이전에 면접 보던 엔지니어 2명 Principal로 승진, 유사 경력 경로 없는 경쟁사에서 시니어 IC 3명 채용, 시니어 기술 이탈 62% 감소
- 더 중요하게, 회사에 남은 엔지니어들이 추정 300만 달러에 달하는 아키텍처 실수 예방
- 이는 주니어 또는 미드 레벨 엔지니어들이 전문성이나 권한 부족으로 이의를 제기할 수 없었던 결정들
실행 경로 (Implementation Paths)
- 실행 일정은 조직이 처한 심각도에 따라 달라짐
-
위기 상황 회사 (시니어 이탈률 >20%, 최근 중대 장애 발생)
- 1-2주차: 실제 12개월 이탈 비용 계산(채용비, 생산성 적응 시간, 프로젝트 지연, 부족 지식 손실 포함), 퇴사 인터뷰 패턴 분석, 프로덕션 사고를 이전에 무시된 경고에 매핑
- 3-4주차: CFO와 CEO에게 발견 사항 제시, 패턴 표시(기술 우려 제기 → 우선순위 하향 → 엔지니어 이탈 → 사고 또는 비용), 총 손해 정량화, 즉각 개입 제안
- 5-8주차: 경영진 온콜 로테이션 시작(가장 빠른 문화 전환), 이탈비용 추적 시작(지속적 변화 케이스 구축), 엔지니어 3명으로 TAB 파일럿 생성, 경영진 대시보드에 월별 이탈 비용 추적 시작
- 9-12주차: 이사회에 보상 구조 변경 제시, 경영진 보너스를 유지율에 연계, IC 경력 트랙 공개 발표, 무엇이 왜 바뀌었는지 투명하게 소통
-
조기 경고 징후 회사 (이탈률 12-18%, 엔지니어들이 1:1에서 우려 언급)
- 1-2개월차: 이탈 비용 추적 및 경제적 케이스 구축 시작, 유지 위험과 무엇이 머물게 할지 엔지니어 설문, 가장 자주 언급된 3가지 우려 식별
- 3-4개월차: 자원 경영진과 경영진 온콜 로테이션 파일럿, TAB 파일럿 시작, 둘 다 기술 부채와 조직 마찰 표면화에 사용, 이연된 작업 비용 문서화
- 5-6개월차: 영구 보상 구조 변경 시행, TAB 권한 공식화, IC 경력 트랙 기준 및 보상 밴드 공개, 시니어 엔지니어 유지를 명시적 경영진 목표로 설정
이것이 효과 없는 경우
- 이러한 개입은 3가지 시나리오에서 예측 가능하게 실패함, 이를 인정하지 않으면 시간만 낭비하게 됨
-
1. 애초에 이탈을 전제로 설계된 비즈니스 모델
- 컨설팅 회사와 계약 업체는 연간 20-40% 이직률 예상
- 비즈니스 모델이 인력 대체 비용을 가격에 반영하고, 청구 요율은 조직 내 전문 지식이 제한적이라는 전제하에 책정
- 제품 회사용으로 설계된 인력 유지 전략은 클라이언트 로테이션이 자연스러운 이탈을 유도하고 파트너 트랙이 의도적으로 업앤아웃 압력 생성하는 곳에서 의미 없음
- 유사하게 제품-시장 적합성 이전 초기 스타트업은 유지 실패가 아닌 필요한 피벗을 신호하는 엔지니어 이탈 경험 가능
- 회사가 6개월마다 근본적으로 방향을 전환하고 있다면, 낮은 유지율은 체계적 역기능이 아닌 적절한 인재 재배치를 의미
-
2. 실행하는 척만 하는 경우 (Implementation Theater)
- 형식만 있는 개입은 무개입보다 더 나쁜 결과를 낳음
- 실제 거부 권한 없는 TAB은 엔지니어 우려를 분산시키는 배출구가 됨
- 체계적으로 무시되는 제안에 시간 투자 시 분노만 더 커짐
- 근본적인 원인 해결과 연결되지 않은 임원진의 온콜 로테이션은 책임감 없는 보여주기식 공감 생성
- 자신이 우선순위를 정해 해결할 수 없는 문제로 호출을 받는 VP는 엔지니어들이 자주 불평한다는 것만 학습
- 계산되지만 경영진 대시보드나 보상 논의에 절대 등장하지 않는 이탈비용 회계는 이론적인 논의로 남음
- 절반 시행된 개입은 리더십이 구조적 변화에 대한 진정한 의지 없이 관심을 보이는 척만 한다는 것을 보여줌
-
3. 문화적 전제조건 부재
- 이러한 개입은 많은 조직에 부재한 문화적 전제조건을 필요로 함: 리더십이 평판 관리가 아닌 진정한 행동 변화를 원해야 함
- 경영진이 엔지니어 유지를 경제적 문제가 아닌 PR 문제로 보면 가장 가시적인 개입(자문위원회, 청취 투어)만 시행하면서 비용 많이 드는 것(보상 구조조정, 실제 거부 권한)은 회피
-
진단 테스트: 경영진 변동 보상의 25%를 시니어 엔지니어 유지에 연계를 제안해 볼 것
- 리더십이 즉시 "우리 회사에서 안 되는 이유"를 제시한다면 해답을 찾은 것
- 그들은 개인적 비용 없는 솔루션을 원하는 것임
- 리더십이 즉시 "우리 회사에서 안 되는 이유"를 제시한다면 해답을 찾은 것
- 엔지니어에게 거부 권한 부여, 경영진 급여를 유지에 연계, 분기 재무 검토에 이탈 비용 반영할 준비가 안 된 회사는 구조적 변화 준비 안 됨
- 우려를 인정하고 "추가 연구" 권장하며 시니어 엔지니어 계속 이탈하는 동안 먼지 쌓이는 컨설팅 보고서에 만족할 뿐
- 개입은 리더십이 연간 140만 달러 이직 비용이 이를 막기 위해 필요한 조치보다 더 크다는 사실을 인식할 때 작동
- 그 인식 없으면 아무리 많은 자문위원회도 경제적 정렬을 대체 불가
새로운 경제적 계산
- 저자가 이끈 블록체인 인프라 회사가 3년간 10명에서 187명 엔지니어로 확장하면서도
- 연간 시니어 엔지니어 이탈률을 평균 6% 로 유지했는데, 초고속 성장 기업의 일반적인 이직률인 35~40%를 훨씬 웃도는 수치
- 성과의 원인은 복지나 문화적 장치가 아니라 인센티브 구조의 재설계에 있었음
- 중간 관리자가 모든 것이 통제 하에 있는 것처럼 보이는 것이 아닌 기술 위험 조기 표면화로 보상을 받음
- 사후분석에 이전 경고 문서화 요구; 무시된 경고는 우선순위를 낮춘 담당자의 성과 평가 대상이 됨
- 기술 리더십이 아키텍처 결정에 거부 권한 보유. 우리는 2회 사용했는데, 거부권 행사 가능성만으로도 전반적인 제안서 품질이 향상
- 창립 때부터 IC 경력 트랙 존재; 가장 시니어 비매니저가 대부분의 디렉터보다 더 많은 급여를 수령
- 시스템 비용: 보상 조정, 거버넌스 오버헤드, 일부 기능 지연한 기술 부채 우선순위 지정에 연간 약 $400,000
-
절감액:
- 예방된 이탈 비용 210만 달러 (업계 표준 35% 이탈을 시니어 엔지니어 인원에 적용)
- 추가로 시니어 엔지니어가 중단 권한이 있어 수백만 달러 사고를 만들지 않은 아키텍처 결정에서 측정 불가하지만 상당한 절감효과가 있음
불편한 진실
- 대부분의 회사는 어쩔 수 없이 강제적인 상황이 닥치기 전까지 이러한 개입 시행 안 함
- 강제 기능은 보통 재앙적인 상황임: 수백만 달러 비용 프로덕션 사고, 핵심 팀을 마비시키는 대규모 인력 이탈, 또는 경쟁사가 당신이 거부했던 것, 즉 기술적 판단에 대한 존중을 제시하며 당신의 핵심 엔지니어 인력의 절반을 빼앗아 가는 경우
- 그때쯤이면 예방이 아닌 피해 복구에 매달리게 됨
- 회복은 비용이 많이듬. 다음 위기 예방할 수 있는 최고 엔지니어들이 이미 떠났기 때문
- 그들의 후임자들은 재능은 있지만 조직에 대한 지식이 부족해서 어떤 경고를 해야 할지 모르며, 파멸 루프 가속화
- 문제는 이러한 개입이 효과 있는지가 아님, 증거는 명확함
- 경영진의 인센티브를 직원 유지에 맞춰 조정하, 엔지니어에게 의미 있는 권한 부여하고, 이직을 경제적 문제로 다루는 회사가 직원 유지율, 사고 발생율, 장기적인 기술 건전성 측면에서 일관되게 우수
- 숙련된 엔지니어들이 이탈하고 있고 일반적인 해결책이 효과가 없다면, 문제는 소통이 아니라 경제적인 측면일 수 있음
모바일로 보고있는데 정렬 문제인지 본문 중에 한줄에 한 글자만 있는 리스트가 몇개 있습니다. 그거 말고도 뎁스가 좀만 들어가면 행 길이가 드라마틱하게 짧아지네요.