8P by xguru 2020-08-31 | favorite | 댓글 3개

- 어제 오후 대규모 인터넷 장애에 대한 분석
- 처음엔 CloudFlare쪽 문제로 알려졌지만, 밝혀진건 세계 최대 ISP중 하나인 CenturyLink측 장애
- 잘못된 Flowspec 업데이트로 BGP (Border Gateway Protocol)에 문제 발생
ㅤ→ Flowspec은 BGP의 확장으로 방화벽 룰이 빠르게 네트웍에 전파되도록 하는 도구
ㅤㅤ(Cloudflare는 7년전에 Flowspec 으로 장애를 낸적이 있어서 더 이상 사용하지 않는다고)
ㅤ→ 보통 1.5~2MB 정도인 BGP 업데이트가 해당 Flowspec 이 포함되면서 갑자기 20M이상으로 넘어가면서 문제 발생

- 복구에 4시간이나 걸린 이유에 대한 CloudFlare의 추측
ㅤ→ Flowspec룰 때문에 대용량 BGP 업데이트가 생기면서 라우터에 접근이 불가능 했을 것
ㅤ→ 아마도 이 Flowspec룰이 CentryLink가 아닌 그들의 고객으로 부터 나오면서 문제가 발생해서 원인 찾기가 어려웠을 것
ㅤ→ 미국시간 일요일 오전에 일이 발생했고, 게다가 CenturyLink/Level(3) 네트웍이 너무 크고 복잡해서

- 어제 이 네트웍 장애로 LoL과 PSN,Xbox Live,Steam,WoW 등의 수 많은 온라인 게임 접속이 불가

관련해서 League of Legends 프로 경기가 중단되서 대회 전용 서버가 아닌 일반 서버에서 진행됐습니다.
[LCK PO 2R] 중단됐던 젠지 vs DRX, 라이브 서버에서 잔여 세트 진행 - http://www.inven.co.kr/webzine/news/?news=243826&site=lol

으어 경기중이었으면 난감했겠네요.