1P by GN⁺ 4시간전 | ★ favorite | 댓글 1개
  • 범용 DRAM 수급 부족이 장기화되며, 2027년 말까지 제조사 공급량이 수요의 60퍼센트만 충족할 수 있다는 전망
  • 수요를 맞추려면 2026년과 2027년에 각각 연간 12퍼센트 생산 증가가 필요하지만, 계획된 증가는 7.5퍼센트에 그침
  • Samsung, SK Hynix, Micron 모두 생산 능력 확대를 추진 중이지만, 대부분의 신규 설비는 2027년 또는 2028년에야 가동 예정
  • 새 시설이 주로 HBM 생산에 집중되고, AI 데이터센터용 HBM이 컴퓨터와 휴대폰용 범용 DRAM보다 우선 배정되며 소비자용 메모리 수급 개선 효과는 확인되지 않음
  • 부족 여파가 phones, laptops, VR headsets, gaming handhelds 가격 인상으로 이어졌고, 소비자 전자제품 전반의 가격 압박 확대 가능성 부각

공급 부족 전망

  • DRAM 생산 확대가 진행 중이어도 2027년 말까지 제조사 공급량은 수요의 60퍼센트만 충족 예상
  • RAM 부족이 2027년까지 이어질 수 있다는 Nikkei Asia 보도와 함께, SK Group 회장은 2030년까지 지속 가능성 언급
  • 세계 최대 메모리 업체인 Samsung, SK Hynix, Micron 모두 신규 생산 능력 확대 추진 중이지만, 대부분의 설비는 2027년 또는 2028년에야 가동 예정
    • 2026년 생산 증가 사례로는 2월 Cheongju에서 가동한 SK 공장이 유일
  • 수요 충족을 위해서는 2026년과 2027년에 각각 연간 12퍼센트 생산 증가가 필요하지만, Counterpoint Research 기준 계획된 증가는 7.5퍼센트에 그침
  • 신규 시설은 주로 HBM 생산 중심이며, 이미 AI 데이터센터용 HBM이 컴퓨터와 휴대폰용 범용 DRAM보다 우선순위를 받고 있어 소비자 전자제품 가격 압박 완화 효과는 확인되지 않음

소비자 제품 영향

  • 범용 DRAM 부족 여파로 소비자 전자제품 가격 인상 발생
  • 가격 인상 사례로 phones, laptops, VR headsets, gaming handhelds 언급
  • 신규 팹이 소비자용 메모리 수급 개선에 얼마나 기여할지는 확인되지 않음
Hacker News 의견들
  • 내 이해로는 Samsung, SK Hynix, Micron이 수요를 감당할 생산능력이 없고, 있는 물량도 DRAM보다 HBM에 우선 배정 중임. HBM은 소비자 전자제품으로 쉽게 돌리기 어려워 보여서, 앞으로 3~4년은 일반 소비자 시장이 꽤 힘들어 보임. 여기에 OpenAI도 자본 압박에 묶여 있고 소모율과 매출에 대한 질문이 커지면서, 이번 RAM 패닉을 촉발한 구매 약속조차 끝까지 이행하지 않을 가능성이 보여서 결국 메모리 업체가 재고를 떠안을 수도 있겠다는 생각임

    • 나는 2019년 Radeon VII가 700달러짜리 소비자 GPU인데도 HBM2로 1TB/s 대역폭을 냈던 점을 떠올리게 됨. 당시 AMD는 중급 라인업까지 HBM을 넣었는데, 예전엔 일반 소비자에게도 팔 수 있던 기술을 왜 이제는 마치 신의 기술처럼 비싸고 특별한 것으로 말하는지 납득이 잘 안 됨
    • 지역 변수도 큼. 네덜란드는 전력망 포화 때문에 데이터센터를 지으려던 기업들이 이미 비용을 내고 연결 보장까지 받았는데도 2030년 전에는 접속이 어렵다는 통보를 받고 있음. 그러면 아직 짓지도 못한 데이터센터를 전제로 메모리 용량이 예약된 셈이어서, 건설이 연기되거나 취소되면 공급과 수요가 더 이상하게 꼬일 수 있겠다는 생각임
    • 내 느낌엔 메모리 업체가 마지막에 떠안는 구조가 늘 반복됐음. 적어도 세 번은 비슷한 장면을 본 것 같음
    • 그래도 이번에는 메모리 업체들이 예전처럼 크게 증설하지 않았고, 바로 그 점이 재고 폭탄 회피를 위한 선택이었다고 봄
    • 나는 Altman의 각종 인프라 건설 약속이 무너지면서 생각보다 빨리 공급 과잉 쪽으로 추가 기울 거라고 봄. 금융권도 이제는 그런 인프라를 그렇게 빨리 지을 수 없고, 지어도 수익이 안 난다는 현실을 알아차리는 중이라는 판단임
  • 내가 아직 정리 못 한 의문은 이것임. AI가 소프트웨어 제작을 더 쉽게 만들면 가격은 내려갈 텐데, 이미 AI 지출 규모가 전 세계 소프트웨어 총지출보다 몇 배나 큰 상황에서 소프트웨어 회사들이 어떻게 그 비용을 감당할지 모르겠음. 그래서 지금의 RAM 수요는 모래 위의 기반 같고, 결국엔 대규모 공급 과잉으로 돌아설 가능성이 높아 보임

    • 나는 그렇게까지 보지 않음. LLM은 이미 도구로서 충분히 유용해서 사라지지 않을 것이고, 핵심 문제는 결국 확장성과 비용 절감임. 작은 회사가 못 써도 큰 회사는 국방, 자원 개발, 금융 같은 영역에서 먼저 다양한 활용처를 찾을 수 있음. 반대로 비용이 충분히 내려가면 작은 팀도 쓰게 되지만, 너무 싸지면 예비 소비자들이 집에서 직접 소프트웨어를 만들게 되는 역설도 생길 수 있다는 생각임
    • 분석가 계산으로는 iPhone 사용자마다 월 35달러, Netflix 구독자마다 월 180달러짜리 새 구독이 필요하다는 얘기까지 나옴. Claude Max 가격이 올랐다고 해도 모든 Netflix 사용자가 그런 비용을 낼지는 회의적임. 관련 내용은 Tom's Hardware 기사 참고 가능함
    • 다들 Jevons paradox에 베팅하는 분위기임. AI가 다음 반도체, 다음 인터넷이 되기를 기대하는 셈임
    • 나는 이걸 트로이 목마처럼 봄. 결국 세상이 이 기술에 익숙해지고 의존하게 되길 기대하는 전략처럼 느껴짐
  • 나는 이 상황이 오래갈 거라고 봄. 코로나 이후 제조사들은 공급 제한이 이익을 극대화한다는 걸 배웠고, 자동차 가격이 예전처럼 쉽게 내려가지 않는 걸 보면 RAM도 비슷한 길을 갈 가능성이 큼. Apple이나 OpenAI 같은 대형 고객과 달리 일반 소비자는 대형 계약을 못 하니 결국 우리가 비용을 떠안는 쪽이 될 것 같음

  • 나는 조금 낙관적임. 이번 일이 RAM을 함부로 쓰는 개발자들에게 경고가 돼서 앞으로 앱들이 더 메모리 효율적으로 바뀔 수밖에 없다고 기대함

    • 이 모습이 약간 1973년 오일 쇼크 이후 V8 엔진 시대가 저문 장면과 겹쳐 보인다는 생각임
    • 다만 현재 수요를 끄는 건 주로 추론 inference라서, 실제로 개발자들이 절박하게 최적화할 동기가 크지 않을 수도 있다고 봄
    • 나는 이 기회에 Electron이 힘을 잃었으면 좋겠음. 화면에 단순한 내용을 띄우는 데 500KB면 될 일을 300MB 넘는 앱으로 띄우는 건 늘 이해가 안 됐음
      • 그건 정말 꿈같은 시나리오라고 느낌
    • RAM을 적게 쓰려면 종종 CPU를 더 많이 써야 해서, RAM 가격이 올라도 전체적으로는 좋은 트레이드오프가 아닐 때가 많다고 봄
  • 나는 기사에서 Google의 TurboQuant를 전혀 언급하지 않은 점이 의외였음. 26일 전에 공개됐고 KV 캐시 메모리를 6배 줄이고 속도도 최대 8배 높인다고 알려졌으며, 이미 llama.cpp에도 반영돼 더 큰 컨텍스트를 더 작은 모델로 타협하지 않고 돌릴 수 있게 돕고 있음. 물론 나도 이게 RAM 문제를 크게 완화할지는 아직 회의적임. 수요가 절감 효과보다 더 클 가능성이 커 보임. 관련 링크는 이 HN 글 참고 가능함

    • 업계에서는 TurboQuant가 최첨단 SOTA는 아니라는 인식도 강함. 비트레이트별 KV 양자화에는 더 나은 방식이 있고, 예를 들면 SpectralQuant 같은 대안도 있음. 게다가 6배라는 수치는 BF16 KV 캐시와 비교한 스타일의 수치라서, 이미 존재하는 8비트나 4비트 방식과 비교하면 얘기가 달라짐
    • 정정할 점도 있음. TurboQuant 논문은 사실 2025년 4월 arXiv에 올라왔고, 현재 구현은 압축률이 대략 3.8배에서 4.9배 수준이며 상단 수치는 GSM8K 성능 저하를 꽤 감수해야 함. 속도도 기준 대비 80~100% 수준이라 개선이 없거나 오히려 느려질 수 있음. 구현 현황은 vLLM PR, 논의는 vLLM 이슈에서 확인 가능함. 나는 개인적으로 DMS를 실험 중인데 더 유망해 보이고 다른 양자화와도 겹쳐 쓸 수 있다고 느낌. 더 큰 절감은 Gemma 4의 SWA 글로벌 하이브리드, MLA, DSA, 선형 레이어, SSM 같은 모델 아키텍처 개선에서 나오며, 다만 이런 것들도 결국 Jevons paradox 때문에 총 메모리 수요 자체를 줄이진 못한다고 봄. 내 코딩 도구만 해도 월 100억~150억 캐시 토큰을 쓰고 있고, 에이전트와 주류 개발자 사용이 늘어나면 사람들이 원하는 토큰 수에는 사실상 상한이 없을 것 같음
    • 로컬 모델 쪽 작업이 저RAM 저VRAM을 목표로 가는 건 분명 도움이 된다고 봄. 예를 들어 Gemma 4 32B는 시중 노트북에서도 돌릴 수 있고, 2년 전 SOTA였던 gpt-4o급 지능과 비슷하거나 더 낫다고 느껴짐. 메모리 가격이 안정될 즈음이면 Opus 4.7급도 로컬 실행이 가능해질 수 있다고 기대함. 큰 모델은 내장 지식이 더 많지만, 웹 검색 같은 도구 호출만 제대로 판단해도 상당 부분 보완 가능하다는 생각임
    • 내 생각에 순효과는 같은 일을 더 적은 메모리로 하는 방향이 아니라, 같은 메모리로 더 많은 일을 하게 되는 방향임. 기업들은 제공 상품의 컨텍스트 윈도를 더 키울 것이고 사람들은 그걸 그대로 쓰게 될 것임. 그게 메모리의 미래에 대한 다소 씁쓸한 현실처럼 보임
    • 그래도 모델 자체를 메모리에 올려두는 비용은 여전히 큼. 예를 들어 RAM이 16GB라면 체감되는 이득이 그렇게 크지 않다고 봄
  • 나는 기사에서 중국의 신규 메모리 업체들 얘기가 빠진 것도 의외였음. 관련 사례로 이 기사를 떠올리게 됨

    • 기사 자체에도 나오듯 CXMT는 고급 DRAM 공정에서 Samsung, SK Hynix, Micron보다 약 3년 뒤처져 있고, 2026년 하반기 라인은 2027년 전까지 글로벌 수급 균형에 큰 영향을 주기 어렵다고 함. 반면 원문 기사는 2028년에 수요가 공급을 넘는다고 보고 있으니, 중국 생산이 현재 기술 수준을 따라잡는 시점은 2029년쯤이 될 수 있음. 장기적으로 가격 인하에는 도움 되겠지만, 당장 부족을 막을 정도의 생산 효율은 아직 아니라는 판단임
  • 최근에 게임용 PC를 새로 맞추려 했는데, 가격 충격과 개별 부품 수급 문제 때문에 계속 미루게 됐음. 그러다 우연히 근처 Microcenter에서 5090과 고급 파워까지 들어간 사실상 풀옵션 프리빌트를 5천 달러 미만에 보고 바로 샀음. 10여 년 전만 해도 프리빌트는 돈이 정말 많고 주말 하루도 못 쓸 때만 사는 선택지였는데, 지금은 오히려 고민할 필요가 없는 선택처럼 느껴졌음

    • 나는 여전히 기본 원칙은 직접 조립이 유리함이라고 봄. 프리빌트는 조립비가 포함되니 구조적으로 더 비쌀 수밖에 없고, 메인보드나 파워처럼 덜 눈에 띄는 부품에서 타협했을 가능성도 낮지 않음. 물론 좋은 딜을 찾았을 수는 있지만, 그 예외가 전체 원칙을 바꾸진 않는다는 생각임
  • 이번 일이 더 메모리 효율적인 소프트웨어를 쓰게 만드는 계기가 될지 궁금함. 요즘은 아주 사소한 프로그램도 RAM을 수백 MB씩 먹는 경우가 너무 많다고 느낌

    • 나도 실제로 vibe-coding을 하면서 RAM 사용량을 줄이는 걸 명시적인 목표로 둔 적이 분명히 있었음
  • 나는 드디어 최적화의 시대가 온 것 같아서 기대됨

    • 다만 나는 조금 회의적임. 내가 쓰는 앱들은 대체로 락인이 강해서 최적화할 조직적 의지가 없거나, 반대로 최적화할 자원이 부족한 경우가 많음. 그래서 현실적인 최적화는 내가 무거운 도구를 버리고 가벼운 도구로 옮겨 가는 정도이고, 그런 선택이 많이 모여 가벼운 도구들의 재정과 개발 자원이 좋아지길 바라는 쪽임
    • 나는 오래전부터 OS 개발자들이 과감한 최적화에 집중해야 한다고 말해왔음. 칩 부족이 아니더라도 반도체 미세화 속도 둔화는 이미 진행 중이고, 소프트웨어 최적화는 모든 하드웨어에 도움 되지만 판매를 직접 끌어올리진 못함. 그 점에서 Linux는 덜 얽매여 있고, 어쩌면 Haiku OS 같은 선택지가 다시 주목받을지도 모르겠다는 상상도 하게 됨
  • 내 눈에는 RAM 제조사들이 여전히 증산에 소극적으로 보임. 투자자들이 모르는 장기 수요 신호를 업체들이 먼저 보고 있는 건지 궁금함

    • 그들은 예전에 여러 번 크게 데였음. DRAM 업계는 호황과 불황의 반복이 길었고, 수요가 늘 때마다 다들 새 팹을 지었다가 가격이 급락해 투자금을 못 건지고 도산하곤 했음. 80년대, 90년대, 2000년대에도 그랬고, 이제는 제조사가 셋만 남아서 수요가 본질적으로 순환적이라는 걸 누구보다 잘 알고 있다는 생각임
    • 반도체 업계는 50년 넘게 붐 앤 버스트 산업이었음. 관련 이미지도 있고, 나 역시 30년 업계 경력 동안 고객 주문의 30%만 겨우 맞추던 시기와 2년 뒤 팹 가동률 50%로 적자를 보던 시기를 모두 경험했음. 최신 팹 하나 짓는 데 200억 달러와 3~4년이 드니, AI가 거품일 수도 있다고 본다면 수요 붕괴 뒤 반짝이는 빈 공장만 남기는 선택은 너무 위험하다는 판단임
    • 현실을 보는 사람이라면 다들 비슷하게 생각할 것 같음. OpenAI의 구매 약정은 지나치게 비현실적이고 지속 가능하지 않아 보인다는 판단임
    • 그들 입장에선 손해 시나리오가 아주 크지 않을 수도 있음. 사실상 카르텔에 가까운 구조이고, RAM은 어차피 필요한 제품이니 덜 만들어도 가격과 수요의 균형 속에서 자기들에게 가장 유리한 위험 대비 보상을 계산했을 것이라고 봄. 소비자의 호감이나 평판보다, 시장이 그들을 더 필요로 한다는 점이 핵심처럼 보임