GN⁺: AMD의 Turin: 5세대 EPYC 출시
(chipsandcheese.com)AMD의 Turin: 5세대 EPYC 출시
-
5 기가헤르츠 서버 CPU
- AMD의 새로운 서버 CPU인 EPYC 9575F에 대한 소개로, 이전의 Granite Rapids와는 달리 직접적인 핸즈온 경험을 통해 작성된 기사임.
- Zen 5 코어의 모바일 및 데스크톱 버전의 차이점은 이미 다루었으므로, 이번 기사에서는 Turin의 메모리 서브시스템 변화에 초점을 맞추고 있음.
메모리 대역폭
- 9575F는 메모리 읽기 대역폭 약 52GB/s, 쓰기 대역폭 48GB/s, 읽기-수정-쓰기 대역폭 95GB/s를 기록함.
- 단일 CCD에서의 메모리 대역폭 사용량을 보면, 단일 코어가 전체 CCD 메모리 읽기 대역폭의 절반 이하, 쓰기 대역폭의 약 55%, 읽기-수정-쓰기 대역폭의 2/3 이상을 사용할 수 있음.
- 9575F는 데스크톱 Zen 5 부품에 비해 CCD에 대한 대역폭이 상당히 높으며, 이는 GMI3-W를 통해 IO 다이에 2개의 GMI 링크를 제공하기 때문임.
- Turin은 DDR5-6400MT/s까지 지원하며, 특정 시스템에서만 1 DIMM당 채널로 지원됨. 대부분의 시스템은 6000MT/s를 지원하며, 2 DIMM당 채널로 구성할 경우 4400 MT/s로 떨어짐.
메모리 지연 시간
- Turin의 비부하 메모리 지연 시간은 Genoa와 유사함.
- 부하 상태에서의 메모리 지연 시간을 측정한 결과, 단일 CCD가 부하 상태일 때 비부하 상태보다 약 39 나노초 증가, 전체 시스템이 부하 상태일 때 약 31 나노초 증가함.
- CCD 내 지연 시간은 약 45ns, CCD 간 지연 시간은 약 150ns, 소켓 간 지연 시간은 약 260ns로, Genoa에 비해 지연 시간이 증가함.
클럭 속도
- 9575F의 모든 64 코어는 단일 스레드 테스트에서 최대 5GHz에 도달할 수 있으며, 메모리 대역폭 테스트에서는 8개의 코어가 5GHz로 작동함.
- Cinebench 2024에서 128개의 스레드가 작동할 때 9575F는 약 4.3GHz를 유지하며, 웹 서버/TLS 트랜잭션 워크로드에서는 약 4.9GHz를 기록함.
결론
- AMD의 Turin은 예상 가능한 세대별 업데이트로, 높은 코어 수의 SKU와 낮은 코어 수의 고주파수 SKU를 제공하여 다양한 시장의 요구를 충족시킴.
- Turin은 Naples에서 Rome으로의 혁신적인 변화보다는 Milan에서 Genoa로의 진화에 가까우며, 메모리 대역폭 증가, 코어 수 증가, 코어 업데이트를 포함함.
- 이 세대는 경쟁력 있는 생태계에서 많은 가치를 제공하며, 많은 사람들에게 흥미를 줄 것임.
GN⁺의 정리
- AMD의 Turin은 서버 CPU 시장에서 중요한 발전을 이루었으며, 특히 메모리 대역폭과 코어 성능에서 향상된 점이 주목받을 만함.
- 이 기사는 AMD의 최신 기술을 이해하고자 하는 사람들에게 유익하며, 서버 성능 최적화에 관심 있는 엔지니어들에게 도움이 될 수 있음.
- Turin과 유사한 기능을 가진 제품으로는 Intel의 Xeon 시리즈가 있으며, AMD와의 비교를 통해 각 제품의 장단점을 파악할 수 있음.
Hacker News 의견
-
AMD EPYC 9175F는 16코어에 512MB L3 캐시를 가진 특이한 제품임. 이는 "코어당" 라이선스 비용을 최소화하려는 고객을 위한 것으로 보임. Oracle이 여전히 이런 라이선스 방식을 사용하는지 궁금함
- HFT 같은 특정 목적을 위해 L3에 전체 알고리즘을 넣어 최소 지연을 추구할 수도 있음
- 그러나 주로 소프트웨어 라이선스와 관련된 문제일 가능성이 높음
-
Phoronix는 196코어 Turin Dense와 192코어 AmpereOne을 비교 리뷰함
- Ampere의 MSRP는 $5.5K, EPYC는 $15K임
- Turin 196은 성능이 1.6배 더 좋음
- Ampere는 에너지 소비가 1.2배 더 효율적임
- 실제 $/성능 측면에서 Ampere 192 코어가 Turin Dense 196 코어보다 1.7배 더 나음
-
$5.5K로 AmpereOne 192 코어 CPU(274w) 또는 Turin Dense 48 코어 CPU(300w)를 구매할 수 있음
- Ampere는 256 코어, 3nm, 12 메모리 채널을 가진 제품을 내년에 출시할 예정이며, 이는 Turin Dense 및 Sierra Forest와의 성능 경쟁에서 더 나은 도전자가 될 가능성이 있음
- 현재로서는 $/성능이 그들의 가치 제안임
-
Qualcomm의 Nuvia 기반 서버 칩의 성능에 매우 관심이 있음
- ARM의 클라이언트 코어 개선이 어떤 지표가 된다면, AWS Graviton, Google Axion, Microsoft Cobalt, Nvidia Grace, Alibaba Yitian 같은 자체 칩들이 더 나은 Neoverse 코어와 어떻게 경쟁할지 매우 궁금함
- Nuvia vs ARM vs AmpereOne의 경쟁이 기대됨
-
지금은 서버 CPU의 황금기일 가능성이 높음
- 7년 전에는 Intel의 Xeon만 있었음
- 이제는 다양한 선택지가 있음
-
Hetzner에 AMD Turin 베어 메탈 서버를 배포하는 것이 기대됨
- 이전 세대도 이미 훌륭한 가치를 제공했지만, 이번에는 한 단계 더 나아간 것 같음
-
20년 전에는 CPU당 1-2개의 코어만 있었고, 듀얼 소켓 서버에서 4개의 코어를 가지는 것이 행운이었음
- 이제는 단일 서버에 거의 400개의 코어를 가질 수 있음
- ARM 코어가 더 많을 수 있지만, 현재로서는 이들만큼 성능이 좋지는 않음
-
Substack으로의 변화가 싫은 사람들을 위해 대안 사이트가 있음
-
12년 된 Dell PowerEdge를 듀얼 Xeon으로 운영 중임
- 첫 번째 세대의 Epyc 서버가 eBay에서 저렴하게 나올 때를 기대함
-
ChipsAndCheese는 새로운 기술 출판물 중 하나로, 특히 심층 벤치마크에서 뛰어난 지식을 가지고 있음
- Anandtech, TechReport, HardCOP 등의 오래된 기술 사이트가 사라진 상황에서, 이러한 스타일을 유지할 수 있는 새로운 출판사가 있어 다행임
-
Factorio 2.0에 맞춰 적절한 시기에 출시됨
-
9965의 실제 작동을 보고 싶음
- 이 부품들은 놀라움
- 이 세대의 머신을 구매할 계획임
-
비디오의 1:11에 TDP 차트가 있음
- 125-500W로 매우 뜨겁게 작동함