GN⁺: 10년간 드라이브 고장 없는 71 TiB ZFS NAS
(louwrentius.com)10년 동안 드라이브 고장 없는 71 TiB ZFS NAS
-
하드웨어
- 24개의 4 TB 드라이브로 구성된 71 TiB ZFS NAS
- 10년 동안 단 한 번도 드라이브 고장 없음
- 두 번째 마더보드와 전원 공급 장치 사용 중
-
드라이브 관리
- 4 TB HGST 드라이브는 10년 동안 약 6000시간 사용
- 서버를 사용하지 않을 때는 꺼두는 것이 드라이브 수명 연장에 도움
- 원격으로 서버를 켜고 끄는 스크립트 사용
- 에너지 절약과 드라이브 수명 연장을 위해 서버를 기본적으로 꺼둠
-
마더보드 교체
- 마더보드 고장으로 인해 몇 년 전에 교체
- BIOS 진입 불가 및 부팅 실패 등의 문제 발생
- Ebay에서 동일한 마더보드를 구입하여 문제 해결
-
ZFS
- ZFS는 여러 운영 체제에서 문제 없이 작동
- zpool scrub을 몇 번 실행했지만 체크섬 오류 없음
- ZFS는 데이터 손실 방지에 매우 효과적
-
소음 관리
- 기본 팬 속도가 매우 높아 소음이 심함
- 팬 속도를 온도에 따라 조절하는 스크립트 작성
- PID 컨트롤러를 사용하여 팬 속도와 소음을 조절
-
네트워킹
- 초기에는 기가비트 네트워크 컨트롤러 사용
- Infiniband 카드로 전환 후 700 MB/s 전송 속도 달성
- 현재는 10Gbit 이더넷 카드 사용
-
전원 공급 장치
- 부팅 시 모든 드라이브가 동시에 스핀업되어 600W 전력 소모
- 전원 공급 장치가 가끔 부팅 시 전력 차단
-
UPS 사용 중지
- UPS가 추가 전력을 소모하여 사용 중지
- 전력 문제로 시스템 손실 위험을 감수
-
백업
- 중요한 데이터는 세 번 백업
- 중요하지 않은 데이터는 백업하지 않음
- 하드웨어 교체와 ZFS로 데이터 손실 방지
-
미래 계획
- 현재로서는 추가 저장소 계획 없음
- 예비 마더보드, CPU, 메모리, HBA 카드 보유
- 드라이브 크기 증가로 인해 더 작은 폼 팩터로 전환 가능성 있음
- 시스템이 고장 나면 저장소 취미를 그만둘 가능성도 있음
GN⁺의 정리
- 이 글은 10년 동안 드라이브 고장 없이 운영된 71 TiB ZFS NAS에 대한 경험을 공유함
- 서버를 사용하지 않을 때 꺼두는 것이 드라이브 수명 연장에 큰 도움이 됨
- ZFS는 데이터 손실 방지에 매우 효과적이며, 팬 속도 조절을 통해 소음을 줄일 수 있음
- 네트워크 전송 속도를 높이기 위해 다양한 네트워크 카드를 사용함
- 백업 전략과 전원 공급 장치 관리에 대한 경험도 공유함
Hacker News 의견
-
ZFS와 BTRFS에 대한 논의가 주로 이루어지지만, bcachefs를 사용해 본 사람이 있는지 궁금함
- bcachefs는 리눅스 커널에 포함되어 있으며, 전체 체크섬 기능을 갖추고 있음
- 파일 시스템의 책임을 진지하게 여기는 저자가 있음
-
드라이브 회전 일정이 있는지에 대한 질문
- 24개의 동일 모델 드라이브를 사용 중이며, 동일한 배치에서 나온 것으로 보임
- 비슷한 마모 상태로 인해 동시에 고장 날 가능성이 높음
- 신뢰할 수 있는 저장소는 까다로움
-
드라이브를 계속 켜두는 것이 전원을 주기적으로 끄는 것보다 마모를 줄일 수 있다는 반대 의견을 들음
- ZFS NAS를 계속 켜두어 정기적으로 데이터를 검사하는 것을 선호함
- 10년 동안 4개의 드라이브 시스템을 운영하면서 2개의 드라이브가 고장났지만, 이는 엔터프라이즈급 드라이브가 아니었음 (WD Green)
-
큰 팬은 낮은 RPM에서도 많은 공기를 이동시킬 수 있으며, 에너지 효율이 높음
- Oxide Computer는 80mm 팬을 사용하여 조용하고 전력 소모가 적다는 점을 강조함
- 다른 서버에서는 팬 전력 소모가 전체 전력의 25%에 달하지만, 이들은 약 1%만 사용함
-
영화 컬렉션에 대한 더 많은 이야기를 듣고 싶어함
- 초기 아이템 선택 방법과 10년 이상 컬렉션에 남아 있는 아이템에 관심이 있음
-
전력 문제로 시스템을 잃는 위험을 감수함
- UPS는 전력 불균형으로 인한 드문 고장을 방지함
- 건설 작업이나 번개로 인해 전력 스파이크가 발생할 수 있음
- UPS는 서버가 손상되기 전에 스스로 고장나서 보호함
-
24개의 드라이브는 성능상의 이점을 제공할 수 있지만, 6베이 NAS와 18TB 디스크를 사용하는 것이 전력 사용, 소음, 공간, 비용 및 신뢰성 측면에서 많은 이점을 제공함
-
드라이브가 작동하는 환경이 수명에 큰 영향을 미침
- 주거 환경은 데이터 센터나 사무실 공간보다 변동성이 큼
- 온도와 습도 변동, 먼지의 영향이 큼
- 깨끗하고 안정적인 환경에서 드라이브 고장이 현저히 줄어듦
-
드라이브를 끄는 것이 비밀이 아니라 단순히 운이 좋았음
- 4TB HGST 드라이브를 10년 넘게 24/7로 사용 중이며, 고장이 없음
- 다른 사람들은 동일한 드라이브로 여러 번 RMA를 경험함
-
전원 주기 변경이 위험한 드라이브도 있었음
- 모든 사람에게 항상 좋은 것은 아님
- 일부 SSD는 주기적으로 전원이 필요함
- NAS의 듀티 사이클은 이 요구를 충족할 가능성이 높음
- 전력 비용이 저렴해짐
- Backblaze가 드라이브의 전원 켜짐/꺼짐 수명 통계를 모델링하는지 궁금함