3P by neo 1달전 | favorite | 댓글 1개

AMD의 Turin: 5세대 EPYC 출시

  • 5 기가헤르츠 서버 CPU
    • AMD의 새로운 서버 CPU인 EPYC 9575F에 대한 소개로, 이전의 Granite Rapids와는 달리 직접적인 핸즈온 경험을 통해 작성된 기사임.
    • Zen 5 코어의 모바일 및 데스크톱 버전의 차이점은 이미 다루었으므로, 이번 기사에서는 Turin의 메모리 서브시스템 변화에 초점을 맞추고 있음.

메모리 대역폭

  • 9575F는 메모리 읽기 대역폭 약 52GB/s, 쓰기 대역폭 48GB/s, 읽기-수정-쓰기 대역폭 95GB/s를 기록함.
  • 단일 CCD에서의 메모리 대역폭 사용량을 보면, 단일 코어가 전체 CCD 메모리 읽기 대역폭의 절반 이하, 쓰기 대역폭의 약 55%, 읽기-수정-쓰기 대역폭의 2/3 이상을 사용할 수 있음.
  • 9575F는 데스크톱 Zen 5 부품에 비해 CCD에 대한 대역폭이 상당히 높으며, 이는 GMI3-W를 통해 IO 다이에 2개의 GMI 링크를 제공하기 때문임.
  • Turin은 DDR5-6400MT/s까지 지원하며, 특정 시스템에서만 1 DIMM당 채널로 지원됨. 대부분의 시스템은 6000MT/s를 지원하며, 2 DIMM당 채널로 구성할 경우 4400 MT/s로 떨어짐.

메모리 지연 시간

  • Turin의 비부하 메모리 지연 시간은 Genoa와 유사함.
  • 부하 상태에서의 메모리 지연 시간을 측정한 결과, 단일 CCD가 부하 상태일 때 비부하 상태보다 약 39 나노초 증가, 전체 시스템이 부하 상태일 때 약 31 나노초 증가함.
  • CCD 내 지연 시간은 약 45ns, CCD 간 지연 시간은 약 150ns, 소켓 간 지연 시간은 약 260ns로, Genoa에 비해 지연 시간이 증가함.

클럭 속도

  • 9575F의 모든 64 코어는 단일 스레드 테스트에서 최대 5GHz에 도달할 수 있으며, 메모리 대역폭 테스트에서는 8개의 코어가 5GHz로 작동함.
  • Cinebench 2024에서 128개의 스레드가 작동할 때 9575F는 약 4.3GHz를 유지하며, 웹 서버/TLS 트랜잭션 워크로드에서는 약 4.9GHz를 기록함.

결론

  • AMD의 Turin은 예상 가능한 세대별 업데이트로, 높은 코어 수의 SKU와 낮은 코어 수의 고주파수 SKU를 제공하여 다양한 시장의 요구를 충족시킴.
  • Turin은 Naples에서 Rome으로의 혁신적인 변화보다는 Milan에서 Genoa로의 진화에 가까우며, 메모리 대역폭 증가, 코어 수 증가, 코어 업데이트를 포함함.
  • 이 세대는 경쟁력 있는 생태계에서 많은 가치를 제공하며, 많은 사람들에게 흥미를 줄 것임.

GN⁺의 정리

  • AMD의 Turin은 서버 CPU 시장에서 중요한 발전을 이루었으며, 특히 메모리 대역폭과 코어 성능에서 향상된 점이 주목받을 만함.
  • 이 기사는 AMD의 최신 기술을 이해하고자 하는 사람들에게 유익하며, 서버 성능 최적화에 관심 있는 엔지니어들에게 도움이 될 수 있음.
  • Turin과 유사한 기능을 가진 제품으로는 Intel의 Xeon 시리즈가 있으며, AMD와의 비교를 통해 각 제품의 장단점을 파악할 수 있음.
Hacker News 의견
  • AMD EPYC 9175F는 16코어에 512MB L3 캐시를 가진 특이한 제품임. 이는 "코어당" 라이선스 비용을 최소화하려는 고객을 위한 것으로 보임. Oracle이 여전히 이런 라이선스 방식을 사용하는지 궁금함

    • HFT 같은 특정 목적을 위해 L3에 전체 알고리즘을 넣어 최소 지연을 추구할 수도 있음
    • 그러나 주로 소프트웨어 라이선스와 관련된 문제일 가능성이 높음
  • Phoronix는 196코어 Turin Dense와 192코어 AmpereOne을 비교 리뷰함

    • Ampere의 MSRP는 $5.5K, EPYC는 $15K임
    • Turin 196은 성능이 1.6배 더 좋음
    • Ampere는 에너지 소비가 1.2배 더 효율적임
    • 실제 $/성능 측면에서 Ampere 192 코어가 Turin Dense 196 코어보다 1.7배 더 나음
  • $5.5K로 AmpereOne 192 코어 CPU(274w) 또는 Turin Dense 48 코어 CPU(300w)를 구매할 수 있음

    • Ampere는 256 코어, 3nm, 12 메모리 채널을 가진 제품을 내년에 출시할 예정이며, 이는 Turin Dense 및 Sierra Forest와의 성능 경쟁에서 더 나은 도전자가 될 가능성이 있음
    • 현재로서는 $/성능이 그들의 가치 제안임
  • Qualcomm의 Nuvia 기반 서버 칩의 성능에 매우 관심이 있음

    • ARM의 클라이언트 코어 개선이 어떤 지표가 된다면, AWS Graviton, Google Axion, Microsoft Cobalt, Nvidia Grace, Alibaba Yitian 같은 자체 칩들이 더 나은 Neoverse 코어와 어떻게 경쟁할지 매우 궁금함
    • Nuvia vs ARM vs AmpereOne의 경쟁이 기대됨
  • 지금은 서버 CPU의 황금기일 가능성이 높음

    • 7년 전에는 Intel의 Xeon만 있었음
    • 이제는 다양한 선택지가 있음
  • Hetzner에 AMD Turin 베어 메탈 서버를 배포하는 것이 기대됨

    • 이전 세대도 이미 훌륭한 가치를 제공했지만, 이번에는 한 단계 더 나아간 것 같음
  • 20년 전에는 CPU당 1-2개의 코어만 있었고, 듀얼 소켓 서버에서 4개의 코어를 가지는 것이 행운이었음

    • 이제는 단일 서버에 거의 400개의 코어를 가질 수 있음
    • ARM 코어가 더 많을 수 있지만, 현재로서는 이들만큼 성능이 좋지는 않음
  • Substack으로의 변화가 싫은 사람들을 위해 대안 사이트가 있음

  • 12년 된 Dell PowerEdge를 듀얼 Xeon으로 운영 중임

    • 첫 번째 세대의 Epyc 서버가 eBay에서 저렴하게 나올 때를 기대함
  • ChipsAndCheese는 새로운 기술 출판물 중 하나로, 특히 심층 벤치마크에서 뛰어난 지식을 가지고 있음

    • Anandtech, TechReport, HardCOP 등의 오래된 기술 사이트가 사라진 상황에서, 이러한 스타일을 유지할 수 있는 새로운 출판사가 있어 다행임
  • Factorio 2.0에 맞춰 적절한 시기에 출시됨

  • 9965의 실제 작동을 보고 싶음

    • 이 부품들은 놀라움
    • 이 세대의 머신을 구매할 계획임
  • 비디오의 1:11에 TDP 차트가 있음

    • 125-500W로 매우 뜨겁게 작동함