1P by GN⁺ 3일전 | ★ favorite | 댓글 1개
  • AWS가 EC2 Capacity Blocks for ML의 GPU 인스턴스 가격을 약 15% 인상, p5e.48xlarge와 p5en.48xlarge 인스턴스의 시간당 요금이 대부분 지역에서 각각 $34.61→$39.80, $36.18→$41.61로 상승
  • 미국 서부(북부 캘리포니아) 지역에서는 $43.26→$49.75로 더 큰 폭의 인상 발생
  • AWS는 이메일을 통해 “이번 조정은 공급과 수요 패턴을 반영한 것”이라고 설명
  • 이번 인상은 과거 GPU 인스턴스 최대 45% 인하 발표(7개월 전) 이후 발생했으며, AWS가 드물게 직접 가격을 올린 사례
  • 클라우드 업계의 가격 인하 불문율이 깨진 사건으로, 향후 다른 리소스 서비스에도 영향을 미칠 가능성 있음

AWS의 GPU 가격 인상 개요

  • AWS가 주말인 토요일에 EC2 Capacity Blocks for ML 가격을 약 15% 인상
    • p5e.48xlarge 인스턴스는 시간당 $34.61에서 $39.80, p5en.48xlarge는 $36.18에서 $41.61로 상승
    • 미국 서부(북부 캘리포니아) 지역은 $43.26에서 $49.75로 인상폭이 더 큼
  • AWS 공식 가격 페이지에는 “2026년 1월에 가격이 업데이트될 예정”이라는 문구가 있었으나, 인상 방향은 명시되지 않았음
  • AWS는 이메일을 통해 “가격은 공급과 수요 패턴에 따라 변동되며, 이번 조정은 해당 분기의 예상 패턴을 반영한 것”이라고 설명

Capacity Blocks의 성격과 이용자층

  • Capacity Blocks는 특정 시점에 GPU 자원을 예약·보장받는 방식으로, ML 학습 작업을 안정적으로 수행하기 위한 서비스
    • 하루에서 몇 주 후까지 특정 기간을 지정해 GPU 인스턴스를 예약하고, 선불로 고정 요금을 지불
  • 이 서비스를 사용하는 고객은 대부분 대규모 ML 프로젝트를 수행하는 기업 팀으로, 예산 규모가 수백만 달러 단위에 달함
  • AWS는 7개월 전 GPU 인스턴스의 온디맨드 및 세이빙스 플랜 가격을 최대 45% 인하한 바 있으나, 이번 인상은 Capacity Blocks에만 적용됨

업계 및 고객에 미치는 영향

  • AWS가 과거에도 가격을 조정한 적은 있으나, 직접적인 인상(line-item increase) 은 드문 사례
    • 이전에는 가격 구조를 변경하거나, “대부분 고객에게는 인하 효과가 있다”고 홍보하는 방식이 일반적이었음
  • 이번 인상은 Azure와 GCP에 유리한 비교 포인트를 제공
    • 두 경쟁사는 ML 워크로드 유치를 적극 추진 중이며, “AWS가 GPU 가격을 15% 올렸다”는 사실이 영업 무기로 활용될 가능성 있음
  • Enterprise Discount Program(EDP) 을 이용하는 기업 고객은 할인율이 유지되더라도 기준 가격 상승으로 실질 비용이 증가하게 됨

시장 상황과 향후 전망

  • GPU 공급이 전 세계적으로 제한된 상황에서 이번 인상은 수급 불균형의 신호로 해석됨
  • AWS는 20년간 “가격은 항상 내려간다”는 인식을 형성해왔으나, 이번 조치로 그 전제가 무너짐
  • 일단 한 번 가격을 올리고 시장 반응이 크지 않으면, 추가 인상 가능성이 높아지는 구조
  • 향후 Graviton 인스턴스데이터 전송 비용 등 다른 서비스에서도 유사한 조정이 발생할 가능성 언급
  • 기사에서는 “클라우드 가격이 한 방향으로만 간다는 믿음은 2026년 1월 토요일에 사라졌다”고 표현

결론

  • 이번 GPU 가격 인상은 AWS의 가격 정책 전환점으로 평가
  • 클라우드 시장에서 비용 안정성에 대한 신뢰가 흔들리는 계기가 되었으며,
    향후 공급 제약이 있는 리소스에서 추가 인상이 이어질 가능성이 제기됨
Hacker News 의견들
  • GPU, RAM, 하드디스크 가격이 모두 오르는 상황을 보며, 결국 가정용 컴퓨터가 얇은 클라이언트(thin client) 로 대체되고 모든 연산이 구독 서비스로 이동하는 미래를 상상하게 됨
    ‘저장공간이 필요 없다, 클라우드 구독을 쓰라’, ‘처리 성능이 필요 없다, 게임을 스트리밍하라’는 식의 구호가 현실이 될 수도 있음
    게임사들이 이미 시간당 과금 모델을 검토 중이라, Call of Duty나 GTA 같은 게임의 구조가 완전히 바뀔 수도 있음
    물리 매체는 사라지고, iPhone 저장공간도 줄어들며 모든 게 iCloud로 강제될 가능성도 있음
    자동차 소유 대신 자율주행 차량 공유, 오프라인 마트 폐점 후 드론 배송 중심의 사회로 가는 그림을 떠올리게 됨

    • 구독 서비스 가격도 같이 오르고 있음. 이미 컴퓨터를 산 사람은 몇 년은 버틸 수 있지만, 렌털 사용자는 즉각적인 영향을 받는 중임
    • 크리스마스 선물로 받은 알람시계(Hatch.co)가 연 50달러 구독 없이는 작동하지 않음. 소비자들이 총소유비용(TCO)을 더 잘 이해해야 함. 정부가 가전제품처럼 연간 비용 스티커를 붙이게 해야 할지도 모름
    • 공급망이 워낙 취약해서, TSMC가 60% 시장 점유율을 가진 상황에서 만약 중국이 대만을 침공하면 전 세계 CPU·GPU 생산의 절반 이상이 사라질 수 있음. 그땐 iPhone이 아예 판매 중단되고, PC 한 대가 5천 달러가 될 수도 있음
    • MMORPG는 이미 월 구독 모델을 오래전부터 사용 중임. 하지만 대부분의 게임은 시간당 과금으로 전환하면 오히려 수익이 줄 것 같음. 사람들은 게임을 많이 사지만 실제로는 거의 플레이하지 않기 때문임
    • 이런 흐름은 이미 Technofeudalism(기술 봉건제) 이라 불리는 개념으로 이론화되어 있음 (Wikipedia 링크)
  • 기사 제목의 “hopes you weren't paying attention”은 과도하게 자극적으로 느껴짐
    GPU와 RAM 수요가 공급을 초과한 단순한 시장 원리로 보임

    • The Register 특유의 자극적인 헤드라인임. 클릭을 유도하려는 의도가 있지만, 이번엔 확실히 효과가 있었음
    • GPU와 RAM 공급은 주말 사이에 갑자기 변하지 않음. 굳이 토요일에 가격을 올릴 이유가 없었음
    • 고객이 일하지 않는 토요일에 가격 인상을 발표한 건 의문임
    • 고등학교 경제학으로도, 이런 기업들이 지금까지 부채와 부실한 생산성만 내고 있다는 점을 지적할 수 있음
  • AWS 가격 인상 관련 기사에 대해, “업데이트 예정”이라 써놓고 방향(인상인지 인하인지)을 명시하지 않은 점이 혼란스러움
    이미 고객인 사람은 가격 페이지를 매일 확인하지 않기 때문에, 이런 식의 공지는 사실상 불투명한 커뮤니케이션

    • 댓글 중에는 《은하수를 여행하는 히치하이커를 위한 안내서》의 “표지판이 잠긴 화장실 서랍 안에 있었다”는 농담으로 AWS의 공지 방식을 풍자함
  • GPU 감가상각 기간을 3년에서 5년으로 늘린다는 비판이 있었는데, 이번 가격 인상은 오히려 GPU의 가치 수명이 길어지고 있음을 보여주는 것 같음

    • 비전문가지만, 가격 상승은 오히려 수명이 짧아졌다는 신호일 수도 있음. 공급 감소나 수요 증가 모두 가능성이 있음. GPU 수요가 비탄력적이 되어 가격이 더 오르는 구조일 수도 있음
    • NVIDIA가 얼마나 성능 향상을 과장했는지에 따라 다름. RL 기능 추가, prefill/decode 분리, nvfp4 같은 구조적 개선으로 효율이 높아졌다면 오래된 칩도 충분히 유용함
    • 고급 GPU는 실제로 6년 이상 쓸 수 있음. 냉각만 잘되면 10년 가까이 쓸 수도 있음. 특히 80GB VRAM 이상 모델은 장기 가치가 높음
  • 클라우드 AI는 대부분의 기업에 편의세(convenience tax) 에 불과함
    문서, 예측, 모니터링, 지원, 제어 시스템 등은 로컬 모델로 충분히 처리 가능함. 데이터 중력, 지연, 프라이버시 문제를 고려하면 엣지 하드웨어 보유가 더 합리적임

    • 나도 LLM을 여러 용도로 프로토타이핑 중인데, 비용보다 신뢰성이 더 큰 문제임. 99.95%와 99%의 차이는 인건비보다 더 큰 손실을 초래할 수 있음. 이런 계산이 가능한 영역에서는 여전히 사람이 낫다고 생각함
  • AI 산업 전반에 곧 가격 충격이 닥칠 것 같음

    • 우리 팀은 API·인프라 비용이 폭등할 때를 대비한 계획이 전혀 없음. 지금은 무료나 다름없는 AI 기능을 마케팅용으로 넣고 있지만, 진짜 비용이 붙으면 다 빼야 할지도 모름
    • 결국 많은 사용이 중국산 오픈웨이트 모델로 이동할 것 같음. 최고급 모델을 제외하면 대부분의 용도에서 이미 충분히 ‘good enough’ 수준임
    • 이 충격은 AI 산업만이 아니라 모든 업계에 영향을 줄 것임
    • 나도 Claude 사용자로서 이런 가격 상승이 걱정됨
  • AI가 모든 자원을 빨아들이며 다른 산업을 질식시키는 중

    • Philip K. Dick과 Frank Herbert가 이미 이런 자본주의의 불변 구조를 정확히 예견했음
  • GPU 가격 변동을 시간 단위로 추적해주는 서비스가 있는지 궁금함

    • 나는 그걸 위해 computeprices.com을 1년째 사이드 프로젝트로 개발 중임
    • AWS가 특정 인스턴스 가격을 올린 건 이례적임. 하지만 더 큰 문제는 사전 공지 없이 가격을 올린 불투명성임. 고객 입장에서는 신뢰를 잃는 방식임
  • Corey Quinn이 The Register에 등장했다는 걸 보고 반가웠음

  • GPU 대량 구매로 인한 자본 지출 급증이 메모리 등 다른 부품 수요를 밀어올리고 있음
    하지만 실제로 그 GPU들이 얼마나 활용되고 있는지 의문임. 놀고 있는 재고에 우리가 비용을 지불하고 있는 건 아닌지 생각하게 됨