저희 회사의 경우 보통 두달에 일주일 정도 업무외 시간 시스템 장애에 실시간으로 대응하는 걸 on-call이라고 합니다. PagerDuty 라는 앱을 많이 쓰는데, severity가 high인 장애가 발생하면, - dead letter가 생긴다든디, api failure rate가 어느 정도를 넘어간다든지 ... - 하면 휴대폰으로 즉시 alarm이 오고 회사 랩톱으로 접속해서 로그확인하면서 필요한 조치를 취합니다.
저희 회사의 경우 보통 두달에 일주일 정도 업무외 시간 시스템 장애에 실시간으로 대응하는 걸 on-call이라고 합니다. PagerDuty 라는 앱을 많이 쓰는데, severity가 high인 장애가 발생하면, - dead letter가 생긴다든디, api failure rate가 어느 정도를 넘어간다든지 ... - 하면 휴대폰으로 즉시 alarm이 오고 회사 랩톱으로 접속해서 로그확인하면서 필요한 조치를 취합니다.
온콜이라는 게 대략 어떤건지 모르겠어요... 지원 요청이려나요. 우리나라처럼 전화 응대는 아닐 듯한데...