1P by GN⁺ 2일전 | ★ favorite | 댓글 1개
  • 최근 Cloudflare 서비스가 전반적으로 장애 현상을 겪음
  • 사용자들은 이메일 또는 문자 메시지를 통해 사고 관련 실시간 알림을 받을 수 있음
  • Cloudflare는 장애가 발생하거나 해결될 때마다 사용자에게 알림을 제공함
  • 전 세계 다양한 국가의 사용자가 문자 메시지 알림을 신청할 수 있는 환경임
  • 모바일 번호 인증을 완료하면, 실시간 인시던트 업데이트 수신이 가능함

Cloudflare 서비스 상태 페이지 안내

Cloudflare는 최근 광범위한 서비스 장애가 발생했음을 공지함

실시간 알림 서비스 안내

  • 사용자는 Cloudflare 사고 현황이 업데이트될 때마다 이메일 알림을 받을 수 있음
  • 사고가 발생하거나 해결될 때마다 문자 메시지(SMS) 알림을 받을 수 있음

문자 메시지 알림 신청 국가

  • Afghanistan, Albania, Algeria, American Samoa, Andorra 등 세계 대부분 국가의 사용자에게 문자 서비스가 제공됨
  • 각 국가별 국제번호를 선택하여 모바일 번호를 입력하는 방식임
  • 대한민국(Republic of Korea, +82) 포함, 아시아, 유럽, 미주 등 다양한 지역 서비스 지원임

알림 구독 및 인증 절차

  • 사용자는 원하는 국가 코드와 자신의 모바일 번호를 입력함
  • 가입 시, 입력한 번호로 OTP(일회용 비밀번호) 가 전송됨
  • 해당 OTP를 인증함으로써 문자 알림 수신 절차가 마무리됨
  • 이메일만으로도 구독 신청 가능함

요약

  • Cloudflare의 상태 페이지를 통해, 서비스 장애와 관련된 실시간 정보를 사용자에게 제공함
  • 전 세계 다양한 지역의 사용자들이 간편하게 문자 및 이메일 알림을 받을 수 있어 장애 대응 및 인시던트 상황 파악이 용이함
Hacker News 의견
  • Cloudflare의 중요한 Workers KV 서비스가, 중요한 의존성을 가진 서드파티 서비스 장애 때문에 오프라인 상태가 된 상황 언급
    • 이게 사실이라면, 그리고 다른 BGP 관련 이슈가 없다면, 이런 의존성은 오래가지 않을 거라는 추측
    • Cloudflare가 일부 서비스에 GCP를 의존하고 있다는 이야기에 대해, Google에서는 이번 장애가 없었다는 공식 부인 언급, 관련 트위터 링크 공유 트위터 Nitter
    • 서브 프로세서 페이지를 확인하면 실제 의존성을 검증할 수 있다는 정보와 링크 공유 Cloudflare Subprocessors
    • 나도 비슷한 내용의 댓글을 작성했었기 때문에 앞으로 참고할 만한 내용이라는 생각
  • Downdetector에서 Google, Cloudflare, AWS 등 많은 주요 기업에서 장애가 발생하고 있다는 상태 파악, 이번 사태의 원인으로 BGP 라우팅 문제가 있다는 업계의 의견 공유
    • 이런 상황이면 BGP 문제가 맞다는 생각, 예전에 트래픽이 이란이나 중국 등으로 잘못 경로 지정된 사례도 언급
    • Internet Health Report에서 "표시할 데이터 없음"이라는 메시지 확인
    • Anthropic도 다운 혹은 성능 저하 상황이라 산책이나 하러 갈 타이밍이라는 여유 표현
  • GCP도 다운 상태라는 제보와 함께 관련 링크 공유
    • 서비스 장애가 대규모로 발생할 때 느껴지는 상상력 있는 농담(스케일이 확실히 다르다는 분위기)
    • 이상하게 느껴질 정도로 겹치는 상황이 발생, Cloudflare가 GCP를 사용하는 건지 궁금증 표출
  • 누군가 BGP 설정을 잘못 배포했을 것 같다는 직감 표현
    • 이 정도로 광범위하고 심각한 사태라면 BGP가 주요 원인일 확률이 높다는 확신
  • 이번 사태가 상당히 심각한 문제로 보인다는 의견, 한동안 이렇게 많은 서비스에서 동시다발적으로 문제가 발생하는 것을 본 적이 없다는 느낌
    • 클라우드 등 주요 인프라가 소수 기업에 집중되면서 이런 사태가 점점 서서히 정기적으로 발생하는 느낌이라는 지적
  • "인간임을 인증하세요" 대화창과 Workers 등에서도 기능 장애가 나타나는 중이라는 현상 공유
    • KV도 동작하지 않고, KV에 의존하는 워커들은 예외를 던지고 있다는 경험, 대시보드는 접속은 되지만 매우 느리고, 18시(UTC)쯤부터 오류율이 급증하기 시작했다는 상황 설명, 그리고 Cloudflare 상태 페이지에서 대규모 장애를 공식 확인한 링크 추가 Cloudflare Status
    • 정말로 Cloudflare에서는 "인간 인증" 대화창을 많이 보는데, Akamai에서는 볼 수 없는 것이 궁금해지는 상황
  • Cloudflare에서 서비스 장애 공지 제목을 "Broad Cloudflare service outages"로 바꿨다는 사실 공유
  • 곧 인터넷을 구한 대서사시 블로그 포스트가 올라올 것 같다는 재치 있는 예측과 함께, 현재는 다운된 상태지만 참조할 만한 DDoS 관련 Cloudflare 공식 블로그 글 링크 소개 Cloudflare Blog: The DDoS That Almost Broke the Internet
  • 이번에 우리 Workers 앱들이 다시 정상 상태로 돌아왔다는 현황 보고, 미국에서는 잘 되고 있지만 유럽(EU) 고객은 여전히 장애를 겪고 있다는 추가 상황 공유, 그 이후에는 유럽 고객도 다시 정상 회복된 상태라는 최신 정보 전달