GN⁺: 나의 5억 달러짜리 화성 로버 실수
(chrislewicki.com)나의 5억 달러짜리 화성 로버 실수: 실패담
-
2003년 2월, 나사(NASA)의 제트 추진 연구소(JPL)에서 일상적인 저녁이 시작됨.
-
Spirit 화성 로버가 플로리다 케이프 커내버럴로 발사를 위해 운송되기 두 주 전이었음.
-
Spirit과 Opportunity는 당시 가장 복잡한 우주선 중 하나로, 나사에 거의 10억 달러가 투자됨.
-
화성 로버에는 바퀴 구동 및 조향, 로봇 팔 제어, 카메라 조준, 지구 지향 안테나 포인팅 등을 위한 62개의 모터가 탑재됨.
-
로버는 화성의 가혹한 환경을 시뮬레이션하는 광범위한 테스트를 거침.
-
특히 폭발적인 충격파가 모터 내부의 취약한 탄소 구성 요소를 손상시킬 수 있는 화약 이벤트가 중요함.
-
모터의 내부 상태는 전기적 성능을 검사하여 확인할 수 있음.
-
테스트는 여러 번 수행되었으며, 경험 많은 크리스는 모터 연결 및 제어 지침 작성 책임자로서 이 테스트 캠페인에 적합한 인물이었음.
-
테스트 중, 크리스는 실수로 전기적 서지를 로버가 아닌 우주선으로 보내는 실수를 저질러버림.
-
이 실수로 인해 5억 달러짜리 우주선이 폐기될 수도 있는 상황에 처함.
-
크리스는 즉시 상황을 보고했으나, 우주선에서 모든 텔레메트리가 손실된 것으로 나타남.
-
크리스는 자신의 실수로 인해 이번 발사 주기에 로버가 하나만 발사될 수도 있다고 생각함.
-
그는 이 사건을 아내에게 털어놓으며 자신이 다음 날 직장을 잃을 것이라고 확신함.
-
다음 날, 팀은 사건을 면밀히 검토했고, 전기적 서지가 H-브리지 모터 드라이버 회로로 갔을 가능성이 높다고 판단함.
-
우주선을 다시 켜보기로 결정하고, 테스트를 재개함.
-
우주선의 텔레메트리가 다시 살아나고, Spirit이 죽지 않았음이 밝혀짐.
교훈
-
크리스는 이 이야기를 공유함으로써 자신과 다른 사람들에게 귀중한 교훈을 제공함.
-
그의 실패담은 팀 문화와 채용 과정에서도 중요한 역할을 함.
-
크리스는 자신의 경험을 통해 얻은 교훈을 다음과 같이 표현함: "당신의 흉터가 당신을 섬기게 하라; 그것들은 귀중한 학습 경험이자 능력과 회복력에 대한 투자다."
-
위기의 순간, 한 동료가 크리스에게 다가와 위로의 말을 건네며, 다음에 무언가가 괜찮다고 승인할 때 이 느낌을 기억하라고 조언함.
-
크리스는 이 사건 이후 Spirit과 Opportunity의 비행 감독관이 되어 나사의 탁월한 성과 메달을 수상함.
-
프로젝트 관리자는 크리스가 다시는 같은 실수를 하지 않을 것이라고 믿으며, 그가 테스트를 계속 이끌 것이라고 결정함.
-
크리스는 이후에도 많은 테스트를 수행하며, 절차를 신중하게 수정하여 동일한 실수를 반복하지 않도록 함.
-
그는 중요한 결정을 내릴 때마다 그 순간을 기억하며, 다른 사람들이 자신의 도전적인 순간을 헤쳐나가도록 돕는 데 주력함.
-
우주 탐사에서 실패는 선택이 아니라 기본 장착된 것으로, 모든 실수는 더 큰 성공으로 향하는 디딤돌임.
-
크리스는 우주 기업가, 엔지니어, 과학자, 기술자 등 다른 사람들의 '실패담'을 듣고 배우고 싶어함.
GN⁺의 의견
이 글에서 가장 중요한 것은 실패를 통한 학습과 성장의 가치임. 크리스의 이야기는 실패가 불가피한 일부임을 인정하고, 그것을 극복하는 과정에서 얻는 교훈과 자신감이 얼마나 중요한지를 보여줌. 이 글은 특히 초급 소프트웨어 엔지니어들에게 실패를 두려워하지 않고, 그것을 성장의 기회로 삼을 수 있는 영감을 제공함. 또한, 크리스의 경험은 팀워크와 리더십의 중요성을 강조하며, 어려운 상황에서도 서로를 지지하고 신뢰하는 문화가 얼마나 중요한지를 보여줌. 이러한 이야기는 사람들에게 유익하고, 긍정적이며, 흥미롭고, 재미있고, 매력적인 요소를 가지고 있어 많은 사람들에게 흥미로울 것임.
Hacker News 의견
-
기계/항공우주 엔지니어의 경험
인명을 책임지는 안전 비평가로서, 사고로 인해 파손된 부품 사진을 검토하며 자신의 계산 오류나 부적절한 테스트 절차 등이 원인이었을까 두려움을 느낌. 이러한 경험은 일부에게는 PTSD와 같은 심리적 부담을 안겨줌.
-
소프트웨어 엔지니어의 실수 이야기
10년 전 고객의 웹 서비스 새 버전을 출시하는 날, 수동적이고 복잡한 배포 과정 중 실수로 프로덕션 데이터베이스를 지워버림. 다행히 백업 덕분에 대부분의 데이터 복구 가능. 이후 데이터베이스와 프로덕션 시스템을 다룰 때 극도로 주의를 기울임.
-
인턴의 실수와 프로세스 문제
인턴이 프로덕션 데이터베이스를 삭제했다면, 인턴의 문제가 아닌 프로세스의 문제임. 전임 직원(FTE)에게 더 많은 것을 기대하긴 하지만, 실수를 통해 다시 일어날 수 있는 희망의 중요성을 인식함.
-
데이터베이스 보안과 해커의 위협
한 사람의 실수로 전체 시스템이 무너질 수 있으므로, 해커에게도 동일한 위험이 존재함. 별도의 자격 증명, 접근 분리, 위험한 명령어 금지 등의 보안 조치가 중요함.
-
TV 방송국 테이프 오퍼레이터의 경험
방송 중 잘못된 테이프를 꺼내는 실수를 방지하기 위해 트레이너가 주의를 주는 방법을 통해 신중함을 배움. 실수로 인한 징계가 엄격했지만, 덕분에 실수를 하지 않고 경력을 쌓음.
-
토마스 J 왓슨의 인용구
회사에 큰 손실을 끼친 직원을 해고하지 않고, 그 경험을 통해 배운 것을 가치 있게 여김.
-
사건 연결성의 중요성
사건 발생 시 정확한 타임스탬프 비교를 통해 불필요한 걱정을 피할 수 있음. 정확한 언어 사용과 사건 간 연결성 확인의 중요성을 강조함.
-
NOAA-N Prime 위성 사고
비싼 볼트를 다른 프로젝트에 '빌려' 사용하고 반환하지 않아 위성이 떨어지는 사고 발생. 사고로 인한 수리 비용은 1억 3천 5백만 달러에 달함.
-
과로와 실수 가능성
중요한 작업에 12시간 근무를 허용하는 것은 잘못됨. 실수의 가능성을 인정하고, 인간의 역량에만 의존하는 것은 위험함.
-
전기 커넥터 설계와 모터 컨트롤러의 복잡성
잘못된 연결을 방지하기 위해 다양한 크기와 모양의 커넥터를 사용하는 설계의 중요성. 복잡한 실패 사슬과 그로 인한 재설계의 필요성을 인식함.