▲GN⁺ 2023-11-05 | parent | ★ favorite | on: Cloudflare 제어 플레인 및 분석 시스템 중단에 대한 사후 분석(blog.cloudflare.com)Hacker News 의견 Cloudflare의 중대한 중단에 대한 기사, 회사는 이 문제를 Flexential 벤더가 운영하는 데이터 센터의 전원 고장으로 돌리고 있다. 일부 댓글 작성자들은 Cloudflare가 Flexential에게 책임을 전가하고 벤더에 대한 기밀 정보를 공개하는 것을 비판한다. 중단의 근본 원인은 Cloudflare가 단일 데이터 센터에 의존하고 있었다는 점으로, 일부 댓글 작성자들은 이것이 Cloudflare의 명성에 부끄러운 일이라고 생각한다. 복구 과정은 중단 자체보다 더 오래 걸렸으며, 일부 서비스는 완전히 복구하는 데 약 30시간이 걸렸다. 이는 많은 서비스들이 서로에게 의존하고 있었기 때문이다. 일부 댓글 작성자들은 중단 동안 Cloudflare의 커뮤니케이션에 불만을 표현하며, 특히 기업 고객들에게 더욱 그렇다. 문제에도 불구하고 일부 댓글 작성자들은 Cloudflare의 투명성과 사후 보고서의 철저함을 칭찬한다. 일부 댓글 작성자들은 Cloudflare의 중복 실패와 제어 평면의 지리적 분산 부족에 대해 우려를 표현한다. 댓글 작성자들은 또한 Cloudflare가 모든 서비스를 고가용성 클러스터에 두지 않았으며, 전원 중단의 모든 가능한 시나리오를 테스트하지 않았다고 비판한다. 일부 댓글 작성자들은 보고서에서 인간 요소를 칭찬하며, Cloudflare가 복구 과정 중 추가적인 실수를 피하기 위해 휴식이 필요하다는 것을 인정한다. 댓글 작성자들은 데이터 센터가 완전히 오프라인 상태에서 복구할 수 있는 능력의 중요성을 강조하며, Cloudflare가 이 시나리오를 테스트하지 않았다고 비판한다. 일부 댓글 작성자들은 기사의 구조에 놀라움을 표현하며, 대부분의 게시물이 제3자 벤더를 논의하고 Cloudflare의 자체 복구 노력에는 덜 초점을 맞추고 있다.
Hacker News 의견