사실 예전이나 지금이나 장애 처리로 힘든 걸 즐겁다고 생각해본 적은 없습니다.
예를 들면 오늘 처리한 장애도 하필 저희 팀에서는 운영 서버에 대한 직접 접근이 막혀 있던 제품에서 발생한 것이라, 장애를 발견하고 현상 파악을 진행하던 초반부와 서버 접근 권한을 간신히 얻어낸 후반부를 제외하고는 상대적으로 무기력할 수밖에 없었습니다. 저희 팀에서 이러이러한 조치를 해달라고 부탁하면 서버 운영 팀에서는 그쪽 사정으로 거부했거든요. 그런 무기력함을 즐겁게 받아들일 수는 없지요.
그래서 퇴근 전까지 포스트모템 문서를 작성하며 느낀 건 차라리 ‘더러워서라도 다음부터는 이런 실수 안 한다!’에 더 가까웠던 것 같습니다.
말씀해주신 내용을 들으니 많이 힘이 드셨겠다는 생각이 듭니다. 말씀해주신대로 같은 실수를 안하게 되면서 조금씩 나아갈 수 밖에... ㅠ
사실 해당 제품은 상당히 오래된 레거시 제품이고, 인수인계 받은 지 얼마 되지 않았으며, 받자마자 기능 변경 소요가 들어와서 최근 코드를 수정은 한 적이 있지만 오늘 발생한 장애와는 아무런 관련이 없는 부분이었습니다. 그래서 실제로 문제가 된 부분은 제가 직접 작성한 내용은 아니었습니다만, 해당 제품을 좀 더 속속들이 알고 있었더라면 더욱 빨리 문제를 해결할 수 있었겠지요. 그게 참 아쉬워요.
그리고 애초에 전면 장애상황을 확인하고 나서 처음에 확신했던 원인에 대한 추정은 사실 절반만 맞는 것이었고 말이죠. 그 추정에 대한 확신이야말로 오늘의 진정한 실수였지 않나 생각합니다.
오늘 하루도 정말 수고하셨습니다. 그래도 문제를 해결하셨다는게 다행이에요. 위의 글에서 적었던 문제들도 가끔 생각날 때가 있어요. 그때는 힘들었지만 지금은 즐겁게 받아들일 수 있는 것 같아요.
kunggom님께서 오늘 겪은 힘든 일도 시간이 지나면 즐겁게 생각할 수 있지 않을까요? ㅎㅎ
부족한 제 글을 읽어주셔서 감사합니다.