The Delivery Hero Reliability Manifesto (번역)
(moonsub-kim.github.io)내용들이 하나하나 다 감명 깊어서 쉽사리 요약을 하진 못하고 가장 와닿았던 것들 몇개만 열거하겠습니다.
- Manifesto를 위반하지 말고, 룰을 변경하기 위한 토론을 하여 Manifesto를 발전시킨다.
- 모든 서비스는 의존성을 포함하여 아키텍처 차트로 문서화하며, 아키텍처는 리뷰를 받아야 한다.
- 데이터 생산자는 생산하는 데이터도 문서화해야 한다.
- 금요일에 배포하는것도 안정적으로 동작해야 한다.
- 실패상황에 대한 방어로직(타임아웃, 재시도, 서킷브레이커, 폴백, 쓰로틀링, 멱등성 등)을 구현한다.
- 서비스 상태를 알 수 있는 대시보드(분당 요청 수, 에러율, 서버응답시간, 비즈니스 메트릭)를 만들어 모니터링한다.
- 이슈를 분석하고 재현하는 방법을 런북으로 작성하고, 얼럿과 연결해 복구시간을 최소화한다.
- 문제가 발생하면 소매를 걷고 문제 해결을 돕는다.
- 모든 텍스트로 하는 대화는 언제나 선의를 주려는 의도가 있다는 생각으로 이해하자.
- 보안과 관련된 액션을 팀의 성과로 반영하기 위해 팀별 보안 점수 테이블을 만들어 공개한다.
- 시스템에 주문 수가 늘어날수록 주문당 비용은 감소해야한다. 분기당 주문당 비용이 10%씩 줄어들면 좋다.
- 리드 타임(개발시작부터 프로덕션 배포까지의 시간), 배포 빈도, 복구시간, 복구시간동안 에러율을 모니터링한다.
이외로도 내용이 더 많은데, 보다보면 이만큼 만들어 낼때까지 얼마나 많은사람들이 기여를 했을까 궁금해지기도하고.. 정말 경외롭다는 감정이 느껴지는 글입니다.