GN⁺: Fly.io 장애 해결 완료
(status.flyio.net)- 이 사이트는 글로벌 사건 업데이트를 제공하는 페이지임. 일상적인 하드웨어 고장이나 제한적인 인프라 사건은 포함되지 않음.
- 개인화된 앱에 영향을 미칠 수 있는 모든 사건을 보려면 Fly Organization의 대시보드에서 개인화된 상태 페이지를 확인할 수 있음.
과거 사건
2024년 11월 27일
- 사건 보고 없음
2024년 11월 26일
- API 지연 및 타임아웃 오류: 해결됨. Machines API와 GraphQL API의 성능이 정상으로 돌아옴.
- 연결성 저하: CPU 할당량의 전체 롤아웃으로 인해 일부 고객의 머신이 제한됨. 네트워킹 문제를 일으켰으며, 이를 해결하기 위해 변경사항을 일시적으로 롤백함.
- API 성능 저하: 해결됨. 시스템을 확장하고 API에 대한 수정사항을 적용하여 정상 운영 중임.
2024년 11월 25일
- API 성능 저하: 문제를 식별하고 수정 중임. Machines API와 프록시 성능이 저하됨.
- Corrosion 클러스터 복구: 복구 및 재시드 프로세스를 실행 중이며, 일부 호스트에서 여전히 작업 중임.
2024년 11월 24일
- 사건 보고 없음
2024년 11월 23일
- 사건 보고 없음
2024년 11월 22일
- 로그 검색 불가: 해결됨. Fly Metrics 로그 검색 패널과 과거 앱 로그에 영향을 미침.
2024년 11월 21일
- 응급 네트워크 유지보수: 완료됨. 네트워크 공급자가 스위치 교체를 수행함.
2024년 11월 20일
- 사건 보고 없음
2024년 11월 19일
- 로그 검색 불가: 해결됨. Fly Metrics 로그 검색 패널과 과거 앱 로그에 영향을 미침.
2024년 11월 18일
- 사건 보고 없음
2024년 11월 17일
- 사건 보고 없음
2024년 11월 16일
- 사건 보고 없음
2024년 11월 15일
- 사건 보고 없음
2024년 11월 14일
- IAD에서의 IPv6 연결성 저하: 해결됨. 상위 공급자와 협력하여 문제를 해결함.
Hacker News 의견
-
한 사용자는 fly.io에서 호스팅한 웹사이트가 5분 동안 다운되었지만, 이후로는 안정적으로 운영되고 있다고 언급함. 무료 모니터링 서비스를 사용하여 5분마다 체크하고 있음.
-
fly.io는 포스트모템을 공개하며, 2016년에는 Consul이라는 중앙 집중형 TLS 서버를 사용했으나 2020년에 Corrosion으로 대체함. 2024년 10월에 Consul의 루트 키 서명 키가 만료되어 연결이 끊겼고, 새로운 SSL 인증서를 배포하여 복구했음.
-
fly.io의 인프라 문제로 인해 다른 서비스의 TLS 키도 만료되었음을 발견했으며, 로그 도구가 네트워크 제공자를 DDOS 공격함. 여러 문제를 해결하기 위해 많은 노력이 필요했음.
-
fly.io의 안정성에 의문을 제기하며, 클라우드 플랫폼이 신뢰성을 제공하지 않는다면 가상 서버를 임대하는 것이 더 나을 수 있다고 언급함.
-
Fly.io API가 여전히 접근 불가능하며, 사용자는 배포나 데이터베이스에 접근할 수 없다고 함. 정확한 업데이트는 커뮤니티 페이지를 통해 확인할 수 있음.
-
개인적으로 Fly.io와 Railway.com을 비교했을 때 Railway가 더 나았으며, 지원도 뛰어났다고 언급함. Fly.io는 데이터 삭제 문의에 응답하지 않았음.
-
Fly.io의 주요 장애를 여러 번 경험했으며, 서비스의 안정성이 최우선이 되어야 한다고 강조함.
-
Turso도 Fly.io의 장애와 관련된 문제를 겪고 있으며, CEO가 Discord에서 이를 확인함.
-
Fly.io의 낮은 가격에 대해 의문을 가졌으며, 기술 문서에서 인스턴스가 하나의 물리적 서버에 고정되어 있어 서버가 다운되면 백업에서 복원해야 한다고 설명함.
-
주요 휴일 주간에 장애가 발생하는 경향이 있으며, MS 365/Teams/Exchange도 영향을 받았다고 언급함. 주요 휴일에는 변경을 중단하는 것이 좋다고 제안함.
-
2023년 초의 일련의 장애도 Corrosion과 관련된 문제를 겪었음을 언급함.