인텔 포기하고 AMD로 전환함 —Ryzen 9950X3D 도입 후기
(michael.stapelberg.ch)- 최근 Intel 285K CPU가 두 번 연속 사망하는 경험을 하며 결국 AMD Ryzen 9950X3D로 전환함
- CPU 고장은 대규모 배치 작업 중 이상 증상을 보이며 시작되었고, 팬만 100%로 돌며 PC가 응답하지 않는 문제를 겪음
- 원인은 외부 온도 문제라기 보다는 CPU 자체의 안정성 문제로 판단했으며, 100도 수준의 온도는 스펙상 정상 범위였음
- 새로 선택한 AMD 9950X3D는 3D V-Cache와 Linux 최적화 기능을 지원하며, Intel 대비 성능은 소폭 우위이나 대기 전력 소모가 높음
- 인텔과 오랜 인연을 돌아보며, 앞으로는 AMD의 개선을 기대하면서도 CPU 시장의 경쟁 회복을 바람
문제 발생과 인텔 CPU의 불안정성 경험
- 사용자는 인텔의 285K CPU를 사용하다가 동일한 모델이 두 번 연속으로 고장을 경험함
- 전자제품 매장의 사용자 리뷰에서도 CPU 교체 사례가 여러 번 언급되어, 인텔 CPU의 안정성 저하를 체감함
- 이러한 이유로, 향후 몇 년간 인텔 대신 AMD Ryzen 9950X3D 모델을 선택함
'죽음의 배치 작업'과 시스템 이상
- 7월 9일, 이미지 문서를 텍스트로 변환하기 위해 layout-parser와 tesseract 도구를 활용하여 대량의 연산 작업을 수행함
- CUDA를 이용하려 했으나 NixOS의 특성상 직접 빌드해야 했고, 빌드 실패 후 CPU로만 작업을 진행함
- 약 4시간 동안 300W 정도를 소모하며 CPU에 고부하가 가해짐
- 작업 도중 컴퓨터가 네트워크에서 사라지며 팬만 100%로 작동하는 이상 현상이 감지됨
- 다음날 PC가 절전 모드에서 복귀하지 않는 현상 발생, 전원을 껐다 켜도 반응이 없어 CPU/Firmware 문제로 추정함
- 파워, 램, 디스크 등은 정상 동작하여 CPU 또는 메인보드 고장으로 결론 내림
고온 환경 문제 아님
- 인텔 CPU 고장 원인이 유럽의 폭염과 에어컨 부족이라는 주장과 달리, 사용자는 작업 중 에어컨을 직접 가동했음
- 실내온도는 25~28도로 적정 범위였고, CPU 온도도 100도였으나 인텔 공식 스펙(110도)에는 미치지 못하는 수치였음
- 일시적 과열로 CPU가 ‘죽는’ 현상은 정상이 아님
AMD CPU 선택 이유 및 신형 사양
- 데스크톱용 AMD CPU 중 최상위 성능을 원해 Ryzen 9 9950X 또는 9950X3D를 고려함
- 3D V-Cache가 적용된 모델이 다양한 벤치마크에서 더 우수한 결과를 보임
- Linux 6.13 이상에서는 대용량 캐시 코어와 고주파수 코어 중 동적으로 선택 가능한 기능도 AMD 모델 선택에 영향을 줌
- 메인보드는 ASUS TUF X870+ 를 채택, 저전력 및 내구성에 초점을 둠
성능 및 전력 소비 비교
성능
- AMD 9950X3D가 인텔 285K보다 소폭 더 나은 성능을 나타냄
- 다양한 리눅스 작업(컴파일, 테스트, 커널 빌드)에서 AMD 모델이 좋은 결과를 보임
전력 소비
-
AMD 9950X3D 기반 PC가 인텔 285K 대비 유휴 및 모니터 사용시 전력 소모가 약간 더 높음
- 인텔 12900k: 40~60W
- 인텔 285k: 46~65W
- AMD 9950X3D: 55~80W
- 가정 내 하루 총 전력 사용량이 9.x kWh → 10~11 kWh로 소폭 증가함
- AMD 시스템에서 피크 및 평균 전력 소모가 모두 더 높음
결론 및 시장에 대한 기대
- 과거 Intel은 성능·저소음·Linux 호환성을 동시에 만족시켜 오랜 기간 신뢰를 쌓음
- 하지만 최근 세대 CPU는 안정성이 떨어지면서 더 이상 같은 공식이 통하지 않음
- 한편, 과거부터 AMD에 대한 친근감과 호감을 가져왔음
- AMD가 향후 대기 전력 최적화를 향상하고, 인텔도 안정성 회복에 성공하길 기대함
- CPU 업계에서 지속적인 경쟁이 이루어지길 바람
Hacker News 의견
- 나는 CPU 선택과 직접적으로 관련이 없긴 하지만, 직접 PC를 조립하는 사람들에게 도움이 될 만한 팁을 남기고 싶음. 예산 여유가 생기고, 시장에 제품이 나와 있을 때마다 항상 제대로 된 ECC 지원이 있는 데스크톱 시스템을 구입해 왔음. 직접 조립한 시스템에서 오버클록 등으로 인한 크고 작은 안정성 문제를 여러 번 겪으면서, ECC가 가능한 하드웨어에 추가 비용을 투자해서라도 이런 원인을 미리 제거하는 게 훨씬 낫다는 결론에 이르게 됨. ECC 없는 플랫폼에서의 안정성 검증은 실제로 꽤 어렵고, memtest 같은 도구로는 미묘한 문제를 잘 탐지하지 못하는 경우가 많음. 개인적 경험으론 PRIME95, y-cruncher, linpack이 더 효과적이지만, 이것도 완벽하지 않음. 요즘 대부분의 AMD CPU가 ECC UDIMM을 완전히 지원하지만, 메인보드 벤더가 펌웨어에서 ECC 지원을 활성화해 주는 경우는 소수라서, 구입 전 반드시 체크할 필요가 있음. DJB가 오래전에 했던 말로 마무리하고 싶음: https://cr.yp.to/hardware/ecc.html
- ECC를 쓰고 싶어도, 메모리 가격이 너무 비쌈. 정상적인 프리미엄이라면 이해하지만, 실제로는 ECC UDIMM이 2배 넘게 비싸서 쉽게 선택하기 어려움
- 문제는 펌웨어에서 ECC 지원을 활성화하는 메인보드가 소수이며, 지원되더라도 제대로 광고를 안 한다는 거임. ASUS PRIME TRX40 PRO 같은 비싼 메인보드를 써도 ECC가 OS에 실제로 지원되는지는 명확히 나와 있지 않음. 즉, 가격대로 기능을 추측할 수 없고, ECC 지원 여부는 복불복임
- 결국 ECC는 마음의 안정이 가장 큰 이점임. 집 서버에선 ECC 에러를 한 번도 못 봤음. 오히려 고클록에 한계 가까운 데스크톱에서나 더 많을 수도 있음. 참고로 DDR5는 ECC 마케팅을 하곤 하지만, DDR5의 기본 내장 ECC와 진짜 ECC는 다름에 속지 않아야 함
- ECC가 없어 발생하는 안정성 이슈를 추적하는 데 정말 많은 시간이 들기 때문에, 나는 결국 추가 비용을 내고서라도 ECC를 고집하게 됨. memtest 같은 기본 도구로는 미묘한 메모리 이슈를 잡지 못하는 경우가 많고, 스트레스 테스트도 완벽하진 않기 때문에, ECC는 정말 든든한 보험임. 최신 AMD CPU 대부분이 ECC UDIMM을 지원하므로, 결국 관건은 메인보드 펌웨어에서의 지원 여부임. 이 때문에 구매 전 꼭 확인이 필수임. 내 경우 안정성과 마음의 평화를 얻는 대가로 추가 비용을 내는 게 충분히 가치 있다고 느낌
- 오래 전에 사라진 제조사의 메인보드는 사지 말라는 경고가 마음에 듦
- 지난 30여 년 동안 직접 부품을 골라 데스크탑을 조립해왔음. 매년 한 번씩 새로 만들고 이전 것은 중고로 팔곤 함. 부품 단위의 이해와 최적화라는 취미와 실질적 이득이 만족을 주고, 부품 선택이나 마케팅의 혼란에도 불구하고 직접 고르는 접근이 더 좋음. Linux 환경이 만족스러워서 Mac에 끌리지 않음. 최적화된 구성의 PC는 훨씬 저렴하게 원하는 작업을 잘 해냄. 하지만 올해는 업그레이드를 망설이고 있음. 로컬 AI 작업을 종종 하지만, 메모리가 빨라야 효과가 있는데, 데스크탑 부품 접근으로는 워크스테이션/서버급 부품(비싸고 일반적이지 않음)으로 가지 않으면 한계가 있음. MR-DIMM이나 CU-DIMM 등 새로운 시도가 보이지만, 결국 메인보드와 CPU가 더 많은 메모리 채널을 지원해줘야 하는 상황임. Intel이 AMD보다 약간 앞서지만, Mac Pro 같은 시스템이 보여주는 메모리 속도엔 비할 바가 아님. Strix Halo 같은 4채널 지원이 나오긴 했지만 노트북용이라 확장성도 한계가 있음. 부품 생태계가 이런 한계를 넘지 못하면 결국 통합 시스템이 주류가 될 가능성이 큼. 이런 점이 x86 부품 시장의 근본적 약점이고, 앞으로 점점 더 마이너해지고 비싸질 것이라는 우려임
- 메타적으로 볼 때, Apple Silicon 같은 새로운 사업 부문이 기존 인재를 빼오는 숨겨진 이점이 있다고 봄. SpaceX가 NASA/Boeing에서, OpenAI가 Google ML 부서에서 유사한 현상이 있었음. 기존 대기업은 최고의 인재를 모으긴 하지만, 예산과 목표 변동, 경직된 전략 때문에 신입 인재가 차세대 기술을 개발할 공간이 부족함(이미 중견급 인력이 기회를 다 차지함). Apple Silicon(M 칩)이나 SpaceX(Falcon-9)는 더 모험적이고 집중적인 인재에게 자율과 위험 감수의 기회를 주고, 몇 년만에 성과 격차를 만드는 경우가 많음. 이 패턴을 Innovator’s Dilemma보다 더 깊이 다룬 연구나 더 좋은 사례가 있다면 추천 바람
- Apple unified memory SoC가 혁신적으로 앞섰다는 얘기는 사실 Nvidia 이외의 로컬 AI 개발에 실제로 심각하게 뛰어든 경험이 없는 사람들에게서 나옴. AMD AI Max나 Apple Silicon Ultra처럼 보이지만, 실제로 뛰어들면 unified memory가 정답이 아니라는 걸 알게 됨. Nvidia 외에 다른 업체가 진짜 경쟁 가능한 제품을 내놓은 적 없음
- 지금 대부분의 PC 부품은 게이머 타깃임. 서버가 필요하면 오히려 구형/값싼 CPU를 이용한 멀티 CPU 시스템을 더 선호해 옴. AI 용으론 HEDT가 답임. 과거엔 9980XE도 $2,000 수준이었음. 최근 Threadripper 9980 + 192GB RAM 시스템을 조립했는데, 정말 비쌌음. 회사의 지원 덕분에 쓸 수 있지만, 일반적으론 게이밍용 소비자 하드웨어와 워크스테이션 성능 하드웨어 사이에 뚜렷한 간극이 있다는 게 문제임. 9960 Threadripper 조립은 가격이 그리 높진 않으니 고려해볼 만함. 올해는 새로 업그레이드할 만한 제품도 마땅치 않다고 느낌
- 나는 9950X 사용자로서 매우 만족 중임. 게임을 하진 않지만, 벤치마크나 인터넷 정보상, 추가 비용이 오직 게임 워크로드에만 의미 있다고 함. 나는 Arch를 씀
- AMD의 경우 최고 사양으로 가는 게 상대적으로 합리적이라고 느낌. 최상급 AMD PC는 $2,500면 되지만, Intel/Nvidia 조합은 GPU 가격을 빼도 쉽게 $5,000 이상임
- OP의 CPU 쿨러(Noctua NH-D15 G2)가 CPU 온도를 100도 미만으로 낮추지 못했다면, 오버클럭(의도적이든, Asus의 멀티 코어 강화 기능 때문이든)을 했거나 써멀 페이스트를 제대로 바르지 않았거나 쿨러 플라스틱 스티커를 떼지 않았을 수도 있음. 블로그를 오래 봐왔고 신뢰하는 분인데 이 부분이 놀라움. 그리고 현재 세대의 Intel CPU는 200W 넘어서면 급격히 효율이 떨어지기에 150W에서 300W로 20% 속도 올리려고 무리하는 게 의아함
- Fractal Define 7 Compact 케이스를 사용했고, 사진을 보면 140mm 팬 딱 하나만 보임. 이 케이스는 방음 성능이 좋지만, 패딩이 좋게 열도 함께 가둠. 메인보드와 RAM도 발열이 심해서 팬 속도를 저소음 위주로 맞췄다면 내부가 무척 뜨거웠을 것임. 나는 예전에 2080 Ti가 장착된 비슷한 구조의 케이스에서 패딩 때문에 내부 발열이 너무 심해 게임 후엔 부품을 만지기도 힘들었고, 팬 세팅을 많이 바꿨음. OP의 CPU 역시 열 방출량이 비슷한데, 나는 비콤팩트 케이스에 팬 2개를 썼었음. https://michael.stapelberg.ch/posts/…
- CPU 온도도 문제지만, D15 G2로도 100도면 환기 상태도 나쁘고 시스템 다른 부품(VRM 등)도 고온이었을 거임. PRIME 시리즈(실제로는 저가형) Asus 메인보드가 이런 쪽에서 특히 안 좋음. 또, Arrow Lake를 기본 옵션에서 쓰는 건 에너지 낭비. TDP 반만 써도 멀티스레드 환경에서 15% 정도 성능만 손해 보면 됨
- Intel이 285K 기준 최대 동작 온도를 105도라고 명시함. 그리고 요즘 CPU는 쿨링이 부족하면 알아서 속도를 낮춰 온도를 맞추므로 갑자기 망가질 수는 없어야 함. https://intel.com/content/www/…
- 데스크탑 CPU 안정성 면에서 Intel, AMD 모두 별로임. Ryzen 9900X 머신에서 아이들 상태에서 멈춤 현상을 겪었고, 그 전의 5950X는 부하 시 자주 다운됐음(프리빌트라 교체로 해결). 부품 여러 개를 바꿔볼 여력이 없으면 이런 문제는 정말 찾기 어려움. 최근엔 아예 ThinkStation 프리빌트로 바꾸고, 현장 방문 서비스를 받기로 함. 쿨링은 덜하지만 문제 발생 시 시간을 낭비하지 않아 좋음. CPU 비교할 때 놀라웠던 점은, 심지어 패시브 쿨링 M4가 많은 데스크탑 CPU보다 빠르다는 것(단일 스레드 기준, 때론 멀티 스레드도)
- M4가 단일 스레드에선 무조건 빠르지만, 멀티스레드에선 저가형/구형 아니면 그렇지 않음. 10코어 M4는 14세대 모바일 i5 정도 성능으로, 훨씬 적은 전력을 쓰긴 하지만 논점은 성능임. 패시브 쿨링(MacBook Air 수준)에서 실제로는 열 스로틀링 때문에 30% 정도는 성능이 떨어짐. Apple CPU가 효율 좋은 건 맞지만, 최대 부하로 오래 돌리면 결국 팬 소음이 생기고, 고성능 지속은 어려운 게 현실임. 대부분의 작업이 짧고 빠른 워크로드라서 Apple이 좋은 것에 불과함
- 5950X 시스템이 이유 없이 셧다운돼서 CPU RMA, RAM, GPU, PSU, 메인보드를 다양한 조합으로 바꿔봤지만 해결 못하고, 결국 새로 조립하기로 결정함
- 5950X를 특정 .NET 8 콘솔 앱으로만 확실히 크래시시킬 수 있음(평소엔 Unity 등에서도 24/7 오버로드에도 문제 없음). 결국 로드 프로파일과 전력 공급 문제가 핵심일 수 있는데, 2500VA 더블 컨버전 UPS가 콘솔 앱 구동 때 전력 부하 변동을 못 버텨 팬이 도는 등 주변 환경에 영향이 감. PC 내부에서 PWM 소음까지 발생해 GPU가 아닌데도 놀람
- 간헐적 문제는 정말 고통. 예전에 게임과 브라우저 영상을 같이 켜면 5초 잠깐 멈췄고, 타이탄폴2에선 항상 AHCI 에러가 로그에 있어서 NVMe로 바꿨음. 특정 게임들에서만 몇 시간 단위로 셧다운되기도 했는데, 오블리비언 리마스터에서 특정 마법 써서 100% 재현하게 됨. 결국 PSU가 트랜지언트 전압 스파이크를 못 버텨서 문제가 생겼고, Seasonic Prime Ultra Titanium인데도 PSU 교체로 해결함
- 최근의 하이엔드 CPU와 하드웨어 호환성은 오히려 더 복잡해지고 후퇴한 느낌임. 5900X는 아이들에서 다운되고, 285K는 매우 안정적이면서도 전반적으로 더 쾌적함. 두 제조사모두 벤치마크 사수를 위해 너무 극한으로 밀어붙인 결과가 아닐까 생각임
- 내 PC에서 AMD CPU가 전기 소모가 더 큰 것 같음. 에너지 미터를 보면 인덕션 요리 등 다 합쳐도 평소 하루 9.x kWh였는데, Intel에서 AMD로 바꾼 후엔 10-11 kWh로 늘어남. 이 현상은 Zen 1 이후 계속된 데스크탑 AMD CPU의 숙명임. Zen 6에선 고쳐지길 바라지만 기대는 크지 않음
- 9950X3D는 Intel Core Ultra 9 285K와 비슷한 급인데, 오히려 전력 소모가 더 큼. X3D 시리즈는 극한의 게임용 칩임
- 아이들 파워가 왜 55와트나 되는지 궁금함. 나는 8코어 Zen4 기반의 beelink 미니 PC에서 아이들 시 10와트로 측정했었음
- 무슨 말인지 모르겠음. AMD는 3D CPU가 나오기 전까지는 전력 효율 면에서 정말 좋았음. 3D CPU는 캐시 메모리 때문에 전기를 더 쓰지만 이건 끌 수 없음. 인텔은 3nm 공정으로 최근 바꿨고, AMD는 아직 4nm임. 하지만 인텔은 오랫동안 10nm에 머물렀고, AMD는 오래 전부터 5nm까지 갔음
- 최근 libgmp에서 AMD 관련 유사 사례가 나왔음. https://gmplib.org/gmp-zen5
- PC를 조립하면서 이런 경우는 그리 신기하진 않음. 전체 SKU 또는 세대 단위로 결함이 있는 경우도 많고, 제조사와 판매처가 RMA를 피하려 드는 경향도 큼. 시스템 전체에서 성능 향상 여유가 줄어들수록, 사소한 문제 하나로도 조립 실패하기 쉬워진다고 느낌
- 해당 사례는 예산형 메인보드에 쿨러도 제대로 갖추지 않은 게 원인이라는 평이 많음
- 실제로 하드웨어 문제라고 오인하는 것 중엔 신형 CPU에서만 드러나는 소프트웨어 버그도 많다고 생각함. 최근 내 PC(9900X3D)에서 프리릴리즈 Linux 커널을 테스트하다가 비슷한 현상을 만났고, 구형 Skylake 머신 100여 시간 테스트에선 일어나지 않던 버그가 최신 AMD 칩에서는 몇 시간 내에 거의 항상 발생함. https://lore.kernel.org/lkml/20250623083408.jTiJiC6_@linutronix.de/
- 왜 저자는 실내 온도 차트를 보여주는지 모르겠음. 중요한 건 CPU 온도임. CPU가 100도에서 안정적이길 기대하면 문제를 불러옴. 케이스 쿨링 강화로 막을 수 있었음
- CPU가 온도 한계에서 클럭 다운해서 자체 보호하지 않고 바로 고장난 게 사실이라면 2025년에 이게 정상이라고 생각할 수 없음
- 나 역시 고성능 노트북의 i7(8세대)이 5년간 24/7 100도 언저리에서 문제없었던 경험이 있음. 요즘 CPU는 온도 리밋에 맞춰 달리는 게 설계임. 실제로 위험한 건 전압에 의한 일렉트로마이그레이션이고, 오히려 쿨링이 너무 좋아서 thermal headroom을 남기면 CPU가 계속 전압/클럭을 밀어붙여서 망가진 사례가 있었음. 만약 온도 리밋에 맞춰졌으면, 오히려 전압/클럭을 줄였을 거라는 아이러니가 있었음
- 본문은 그 부분을 분명히 설명하고 있음
- 요즘 노트북 CPU와 쿨링 시스템은 지속 부하에서 항상 Tjmax 근처로 설계되어 있고, 최대 온도와 성능을 맞추기 위해 지속적으로 스로틀링하는 게 맞음
- 고성능 게이밍 노트북은 몇 시간이고 100도 언저리로 돌려도 아무 문제 없음. 문제가 있다면 CPU가 허용하지 않아야 함
- 나는 AVX512가 데스크탑에 맞지 않는 E-코어 때문에 제한되는 거나 불안한 SMT(하이퍼스레딩)보다는 제대로 구현한 AMD Zen5를 더 선호함. TSMC 공정도 장점임. 그래도 최근 AMD에도 여러 문제가 있었음. https://www.theregister.com/2025/08/29/amd_ryzen_twice_fails_in/