▲GN⁺ 2024-02-03 | parent | ★ favorite | on: SeaweedFS - 블롭, 객체, 파일 및 데이터레이크를 위한 빠른 분산 스토리지 시스템 (github.com/seaweedfs)Hacker News 의견 JuiceFS의 언급 댓글에서는 Minio, Ceph, GarageFS와 같은 여러 대안들이 언급됨. 아직 언급되지 않은 또 다른 대안으로 JuiceFS가 있음. JuiceFS와 SeaweedFS를 비교한 자료가 있음. SeaweedFS 사용 경험 SeaweedFS를 사용하여 수십억 개의 중간 크기 XML 문서, 이미지 썸네일, PDF 파일 등을 저장함. 데이터베이스와 파일 시스템 사이의 간극을 메움. 문서와 운영 도구는 처음에는 조금 어색하지만, 기능이 풍부하고 잘 작동함. 전원 장애, 하드웨어 오류 등으로부터 데이터 복구가 가능했음. 오픈 소스 S3 API 블롭 스토어에 대한 간극이 놀랍다고 느낌. SeaweedFS에 대한 부정적인 경험 SeaweedFS의 CSI 드라이버를 통해 마운트된 POSIX FS 볼륨에서 Postgres가 초기화되지 않아 SeaweedFS를 사용하지 않기로 결정함. 완전한 POSIX FS와 S3 볼륨을 제공하고, FOSS이며, 관리, 모니터링, 재해 복구 등을 효과적으로 수행할 수 있는 SDS 시스템이 필요함. Ceph와 같은 시스템은 제외됨. GarageFS는 S3만 지원함. SeaweedFS 개발자의 의견 SeaweedFS는 Facebook의 Haystack 논문을 기반으로 한 블롭 스토리지 위에 구축됨. 아직 모든 기능이 완전히 개발되지는 않았지만, 클라우드 시대에 적합한 새로운 프로그래밍 방식을 제공함. 저장 공간이 필요할 때는 공간을 할당하고 파일 ID를 받아 메모리 블록을 가리키는 포인터처럼 사용함. SeaweedFS 사용 사례 50TB 이상의 멀티플레이어 매치 녹화(리플레이)를 저장하는 데 SeaweedFS를 사용함. 내장된 만료 기능을 활용하며, 사용과 새로운 기능의 추가 및 마이그레이션에 문제가 없음. SeaweedFS와 Min.io에 대한 의견 S3와 같은 자체 호스팅 솔루션에 대한 경험을 물어본 결과, SeaweedFS 사용자는 Min.io를, Min.io 사용자는 SeaweedFS를 추천함. SeaweedFS의 장기 사용자 약 25만 개의 객체를 SeaweedFS에 저장하고 있으며, 그 중 많은 부분이 Cloudflare 뒤의 콜드 스토리지임. SeaweedFS는 Facebook의 Haystack에 매료되어 오랫동안 사용해왔으며, 매우 안정적이고 효율적임. 마이크로소프트의 저장 기술 역사 마이크로소프트는 과거에 여러 번 파일과 데이터베이스 사이의 간극을 메우려는 시도를 했으나, 대부분 실패함. 이러한 기술에 대한 빌 게이츠의 관심과 그의 실망감을 언급함. 분산 스토리지 선택 시 고려사항 분산 스토리지가 정말 필요한지, 자체적으로 샤딩할 수 있는지 고려해야 함. 블롭을 수정해야 하는지, 읽기/수정/교체로 충분한지 확인해야 함. 읽기와 쓰기의 비율을 고려해야 함. 메타데이터 변경 빈도를 고려해야 함. 동시에 같은 객체에 대한 쓰기를 관리하는 방법을 고려해야 함. 가용성, 일관성, 속도 중 어떤 것을 중요시하는지 선택해야 함. 분산 스토리지의 동시 실패로부터 복구하는 방법을 고려해야 함. 접근 제어 방법을 고려해야 함. SeaweedFS와 Min.io의 성능 비교 100TB 이상의 오디오 데이터를 HDD에 저렴하게 저장하기 위해 SeaweedFS와 Min.io를 테스트함. SeaweedFS가 해당 사용 사례에 대해 더 나은 성능을 보임.
Hacker News 의견
JuiceFS의 언급
SeaweedFS 사용 경험
SeaweedFS에 대한 부정적인 경험
SeaweedFS 개발자의 의견
SeaweedFS 사용 사례
SeaweedFS와 Min.io에 대한 의견
SeaweedFS의 장기 사용자
마이크로소프트의 저장 기술 역사
분산 스토리지 선택 시 고려사항
SeaweedFS와 Min.io의 성능 비교