GitLab On-Call Runbooks
(gitlab.com)깃랩이 사이트에 문제가 발생했을때 단계별 대처방법을 정리해둔 런북 모음.
체크리스트 및 각 Role 별로 해야할 일들을 명확하게 해둬서 참고할 만.
관련해서 사용중인 도구들도 참고.
- PagerDuty로 온콜스케줄링 및 사고 알림
- StatusIO 로 서비스 상태 외부에 알림
- Zoom 으로 화상대화
- Google Docs로 사고에 대한 시간별 정리
중요한 건.. Don't Panic