지속적인 혁신: AWS 블록 스토리지의 간략한 역사

▲

GN⁺ 2024-08-23 | parent | ★ favorite | on: 지속적인 혁신: AWS 블록 스토리지의 간략한 역사(allthingsdistributed.com)

Hacker News 의견

큰 시스템에 관심이 있다면 이 글을 읽어보는 것이 좋음
- 하드 드라이브 성능은 큐에 있는 다른 트랜잭션에 따라 달라짐
- 무작위 4kB 작업에서는 성능이 크게 떨어질 수 있음
- 큐잉과 스케줄링이 도움이 되지만, 실제 성능은 작업 부하에 따라 100배 이상 차이날 수 있음
- 다중 테넌트 시스템에서는 특히 읽기 작업에서 어려움이 있음
문제를 해결하려면 무엇이 잘못되었는지 알아야 함
- Marc에게 배운 가장 큰 교훈은 시각화를 통해 팀의 관점을 바꾸는 것임
- 성능 데이터를 여러 방식으로 분석하면 보이지 않는 효율성과 기회를 발견할 수 있음
2013년에 EBS 서버에 SSD를 설치한 프로젝트는 AWS의 흥미로운 이야기 중 하나임
- 시스템을 처음부터 비파괴 유지보수 이벤트를 염두에 두고 설계했음
- 분산 시스템을 구축하면 대규모 운영이 가능해짐
AWS의 약 4일간의 장애는 EBS로 인해 발생했으며, 이는 AWS에 대한 신뢰를 흔들었음
- 이로 인해 EBS에 대한 투자가 증가했음
- Apple이 고객이 되던 시기와 맞물려 있었음
Reddit은 2008년에 EBS의 초기 사용자 중 하나였음
- 소프트웨어 RAID를 사용하여 IOPS를 증가시키려 했으나, 성능이 일관되지 않았음
- RAID의 문제를 해결하는 데 시간이 걸렸음
- Netflix는 EBS를 사용하지 않았음
무작위 지연을 추가하면 평균 지연과 이상치가 감소하는 효과가 있음
대규모 인터넷 회사에서 일하면서 많은 교훈을 얻었음
- 견습 과정을 통해 중요한 지식과 기술을 빠르게 습득할 수 있음
- 면접 시 경험과 멘토의 추천이 매우 유용함
2013년에 모든 EBS 유닛에 SSD를 수동으로 설치한 부분이 흥미로웠음
- 2010-2012년 사이에 I/O 성능이 중요한 이슈였음
2009년에 Amazon S3 내부에 대한 강연을 했음
- 이 강연은 EBS 개발에 영향을 미쳤음
클라우드 초기에는 범용 하드웨어를 사용했으나, 이제는 개별 서비스에 특화된 하드웨어를 사용함
- AWS는 Graviton, Inferentia, Tranium 칩을 사용함
- Google은 TPU와 Titan 보안 카드를 사용함
- Azure는 FPGA와 Sphere를 사용함
첫 번째 다이어그램은 잘못되었거나 구식임
- 현대 컴퓨터는 대부분의 PCIe 레인이 CPU로 직접 연결됨
- 이는 I/O 처리량과 지연에 중요한 발전임
새로운 EC2 인스턴스에 빠른 256GB 데이터셋 디렉토리를 제공하는 가장 좋은 방법을 찾고 있음
- EBS 볼륨을 사용하고 있지만 업데이트가 번거로움
- EFS는 너무 느림
- 인스턴스 스토리지 SSD는 일시적임
- FSx Lustre는 아직 시도하지 않음