1P by neo 3달전 | favorite | 댓글 1개

10년 동안 드라이브 고장 없는 71 TiB ZFS NAS

  • 하드웨어

    • 24개의 4 TB 드라이브로 구성된 71 TiB ZFS NAS
    • 10년 동안 단 한 번도 드라이브 고장 없음
    • 두 번째 마더보드와 전원 공급 장치 사용 중
  • 드라이브 관리

    • 4 TB HGST 드라이브는 10년 동안 약 6000시간 사용
    • 서버를 사용하지 않을 때는 꺼두는 것이 드라이브 수명 연장에 도움
    • 원격으로 서버를 켜고 끄는 스크립트 사용
    • 에너지 절약과 드라이브 수명 연장을 위해 서버를 기본적으로 꺼둠
  • 마더보드 교체

    • 마더보드 고장으로 인해 몇 년 전에 교체
    • BIOS 진입 불가 및 부팅 실패 등의 문제 발생
    • Ebay에서 동일한 마더보드를 구입하여 문제 해결
  • ZFS

    • ZFS는 여러 운영 체제에서 문제 없이 작동
    • zpool scrub을 몇 번 실행했지만 체크섬 오류 없음
    • ZFS는 데이터 손실 방지에 매우 효과적
  • 소음 관리

    • 기본 팬 속도가 매우 높아 소음이 심함
    • 팬 속도를 온도에 따라 조절하는 스크립트 작성
    • PID 컨트롤러를 사용하여 팬 속도와 소음을 조절
  • 네트워킹

    • 초기에는 기가비트 네트워크 컨트롤러 사용
    • Infiniband 카드로 전환 후 700 MB/s 전송 속도 달성
    • 현재는 10Gbit 이더넷 카드 사용
  • 전원 공급 장치

    • 부팅 시 모든 드라이브가 동시에 스핀업되어 600W 전력 소모
    • 전원 공급 장치가 가끔 부팅 시 전력 차단
  • UPS 사용 중지

    • UPS가 추가 전력을 소모하여 사용 중지
    • 전력 문제로 시스템 손실 위험을 감수
  • 백업

    • 중요한 데이터는 세 번 백업
    • 중요하지 않은 데이터는 백업하지 않음
    • 하드웨어 교체와 ZFS로 데이터 손실 방지
  • 미래 계획

    • 현재로서는 추가 저장소 계획 없음
    • 예비 마더보드, CPU, 메모리, HBA 카드 보유
    • 드라이브 크기 증가로 인해 더 작은 폼 팩터로 전환 가능성 있음
    • 시스템이 고장 나면 저장소 취미를 그만둘 가능성도 있음

GN⁺의 정리

  • 이 글은 10년 동안 드라이브 고장 없이 운영된 71 TiB ZFS NAS에 대한 경험을 공유함
  • 서버를 사용하지 않을 때 꺼두는 것이 드라이브 수명 연장에 큰 도움이 됨
  • ZFS는 데이터 손실 방지에 매우 효과적이며, 팬 속도 조절을 통해 소음을 줄일 수 있음
  • 네트워크 전송 속도를 높이기 위해 다양한 네트워크 카드를 사용함
  • 백업 전략과 전원 공급 장치 관리에 대한 경험도 공유함
Hacker News 의견
  • ZFS와 BTRFS에 대한 논의가 주로 이루어지지만, bcachefs를 사용해 본 사람이 있는지 궁금함

    • bcachefs는 리눅스 커널에 포함되어 있으며, 전체 체크섬 기능을 갖추고 있음
    • 파일 시스템의 책임을 진지하게 여기는 저자가 있음
  • 드라이브 회전 일정이 있는지에 대한 질문

    • 24개의 동일 모델 드라이브를 사용 중이며, 동일한 배치에서 나온 것으로 보임
    • 비슷한 마모 상태로 인해 동시에 고장 날 가능성이 높음
    • 신뢰할 수 있는 저장소는 까다로움
  • 드라이브를 계속 켜두는 것이 전원을 주기적으로 끄는 것보다 마모를 줄일 수 있다는 반대 의견을 들음

    • ZFS NAS를 계속 켜두어 정기적으로 데이터를 검사하는 것을 선호함
    • 10년 동안 4개의 드라이브 시스템을 운영하면서 2개의 드라이브가 고장났지만, 이는 엔터프라이즈급 드라이브가 아니었음 (WD Green)
  • 큰 팬은 낮은 RPM에서도 많은 공기를 이동시킬 수 있으며, 에너지 효율이 높음

    • Oxide Computer는 80mm 팬을 사용하여 조용하고 전력 소모가 적다는 점을 강조함
    • 다른 서버에서는 팬 전력 소모가 전체 전력의 25%에 달하지만, 이들은 약 1%만 사용함
  • 영화 컬렉션에 대한 더 많은 이야기를 듣고 싶어함

    • 초기 아이템 선택 방법과 10년 이상 컬렉션에 남아 있는 아이템에 관심이 있음
  • 전력 문제로 시스템을 잃는 위험을 감수함

    • UPS는 전력 불균형으로 인한 드문 고장을 방지함
    • 건설 작업이나 번개로 인해 전력 스파이크가 발생할 수 있음
    • UPS는 서버가 손상되기 전에 스스로 고장나서 보호함
  • 24개의 드라이브는 성능상의 이점을 제공할 수 있지만, 6베이 NAS와 18TB 디스크를 사용하는 것이 전력 사용, 소음, 공간, 비용 및 신뢰성 측면에서 많은 이점을 제공함

  • 드라이브가 작동하는 환경이 수명에 큰 영향을 미침

    • 주거 환경은 데이터 센터나 사무실 공간보다 변동성이 큼
    • 온도와 습도 변동, 먼지의 영향이 큼
    • 깨끗하고 안정적인 환경에서 드라이브 고장이 현저히 줄어듦
  • 드라이브를 끄는 것이 비밀이 아니라 단순히 운이 좋았음

    • 4TB HGST 드라이브를 10년 넘게 24/7로 사용 중이며, 고장이 없음
    • 다른 사람들은 동일한 드라이브로 여러 번 RMA를 경험함
  • 전원 주기 변경이 위험한 드라이브도 있었음

    • 모든 사람에게 항상 좋은 것은 아님
    • 일부 SSD는 주기적으로 전원이 필요함
    • NAS의 듀티 사이클은 이 요구를 충족할 가능성이 높음
    • 전력 비용이 저렴해짐
    • Backblaze가 드라이브의 전원 켜짐/꺼짐 수명 통계를 모델링하는지 궁금함