▲GN⁺ 2025-02-21 | parent | ★ favorite | on: 파워스탯, 센서, dmidecode로 헤츠너 문제점 발견(ubicloud.com)Hacker News 의견 대부분의 다른 AX 모델(AX42, AX52, AX102)도 몇 달 후에 고장 나는 심각한 신뢰성 문제를 가지고 있음. 이는 결함이 있는 메인보드에 기반을 두고 있음. Hetzner는 특정 날짜 이전에 제작된 서버의 메인보드를 대부분 교체해야 함 이전 회사에서는 Hetzner에서 CPU 팬 고장이 자주 발견되었음. 이는 일반적인 HD/SSD 고장 외에도 발생함. 자체 모니터링이 필요하며, 이는 관리되지 않는 서버가 클라우드 인스턴스보다 저렴한 이유 중 하나임 과거를 돌아보면, 6개월을 기다렸다면 많은 문제를 피할 수 있었을 것임. 초기 사용자는 나중에 수정되는 문제를 발견하는 경우가 많음 이는 매우 좋은 조언이며, 안정성이 필요한 모든 시스템에 대해 따르고 있음 보안 문제가 없다면 몇 달을 기다리거나 한두 버전 뒤에 머무름 Hetzner는 전력 제한 가능성을 확인하거나 부인하지 않았음 전력 제한의 결과는 무엇인가? 기사에 따르면 하드웨어가 더 빨리 열화될 수 있다고 함 Hetzner의 반응 부족과 UbiCloud의 측정은 실제로 전력을 제한하고 있음을 시사하는 것 같음. 그렇지 않다면 그렇게 말했을 것임 Dell도 때때로 이 문제를 겪음. 그들의 오래된 서버 첫 배치를 받았을 때, I/O(후면) 섹션을 교체해야 했음. 이 문제를 해결한 후 거의 10년 동안 운영됨 최근에 이 서버들을 은퇴시켰음. RAID 카드부터 전력 조절기까지 모든 것이 닳았음 구성 변경으로 인해 완벽하게 작동하는 서버를 재부팅하고 RAID 카드를 영원히 잃는 경험은 충격적임 전력 제약 하에서 기계 수를 늘리기 위해 데이터 센터 운영자는 보통 기계당 전력 사용을 제한함. 그러나 이는 메인보드가 더 빨리 열화될 수 있음 이 점에 대해 설명할 수 있는 사람이 있는가? 이는 직관에 반하는 것임 검색 결과에 따르면 열 스로틀링에 부딪히면 높은 작동 온도가 부품(예: 커패시터)을 더 빨리 열화시킬 수 있다고 함. 그러나 기사는 다양한 온도 센서를 조사했으며 이는 해당되지 않음 전력/신호 문제나 VRM 문제일 수 있을지 궁금함. CPU가 뜨겁지 않다고 해서 보드의 다른 부분이 사양을 벗어나 치명적인 고장을 일으키지 않는다는 의미는 아님 전력/신호 관련 메인보드 문제는 진단하기 어려움. 이는 다른 부품과 관련된 문제로 나타나며, 실제로 메인보드를 교체하기 전에 모든 것을 교체하게 됨 현재 사용 중인 AX102에서도 유사한 일이 발생했음. 네트워크 카드와 관련된 문제로 충돌이 발생했음. 다행히도 Hetzner 지원이 하드웨어 교체에 도움이 되었음. 많은 고통을 초래했지만 하드웨어 문제 해결에 좋은 교훈이 되었음 데이터 센터 경험이 있는 사람이 Hetzner가 메인보드 공급업체와 어떤 상업적 해결책을 도달했을지 추측할 수 있을까? 모든 메인보드를 무료로 교체하고 보상을 받았을 것으로 추정할 수 있을까? 전력 제한이 있는지 추정하기 전에 해당 시스템에서 어떤 CPU 거버너가 실행 중인지 보고 싶음. 많은 기본 Linux 설치가 전력 절약 거버너를 실행하며, 이는 최대 주파수와 최대 전력을 제한함
Hacker News 의견