OpenAI, Oracle과의 Stargate 데이터센터 확장 계획 철회

(cnbc.com)

2P by GN⁺ 3달전 | ★ favorite | 댓글 1개

OpenAI가 텍사스 애빌린의 Stargate 데이터센터 확장 계획을 중단하고, 차세대 Nvidia 칩을 사용하는 새로운 시설에 집중
Oracle은 1,000억 달러 이상의 부채 기반 투자로 AI 인프라 확장을 추진 중이며, 자유현금흐름이 마이너스 상태
데이터센터 건설 속도가 칩 세대 교체 주기를 따라가지 못해, 인프라 투자 전체에 기술 노후화 위험 존재
Nvidia는 매년 새로운 GPU를 출시하며, 최신 Vera Rubin 칩은 이전 세대 대비 추론 성능 5배 향상
Oracle은 1,000억 달러 이상의 부채를 보유한 유일한 하이퍼스케일러로, 잉여현금흐름이 마이너스로 전환된 상태
Oracle의 주가는 올해 들어 23% 하락, AI 인프라 투자 지속 가능성에 대한 시장 우려 확대

OpenAI와 Oracle의 협력 중단

OpenAI는 Oracle과의 Stargate 데이터센터 확장 계획을 철회하고, 차세대 Nvidia GPU를 사용하는 다른 지역의 대규모 클러스터로 전환
- 애빌린 시설은 Nvidia Blackwell 프로세서를 사용할 예정이었으나, 전력 공급이 1년 후에야 가동 예정
- OpenAI는 그 시점에 더 진보된 Nvidia 칩을 확보해 다른 지역에서 확장하기를 기대
Oracle은 해당 부지 확보, 하드웨어 주문, 수십억 달러 규모의 건설 및 인력 투자를 이미 진행한 상태
Bloomberg가 이 소식을 최초 보도했으며, Oracle은 X 게시물에서 "허위 보도"라고 반박했으나, 기존 프로젝트 진행만 언급하고 확장 계획에 대해서는 언급하지 않음

칩 세대 교체 속도와 인프라 구축의 불균형

AI 칩 업그레이드 주기가 데이터센터 건설 속도보다 빠르게 진행되고 있음
- Nvidia는 과거 2년마다 신제품을 내놓았으나, 현재는 매년 새로운 GPU 출시
- 최신 Vera Rubin 칩은 Blackwell 대비 추론 성능 5배 향상
AI 모델 개발 기업들은 성능 격차가 벤치마크·사용량·매출·기업가치에 직접 영향을 미치기 때문에 최신 칩을 선호
인프라 기업은 부지 확보·전력 연결·시설 완공에 최소 12~24개월이 걸려, 기술 세대 차이가 불가피
그러나 고객은 매년 업그레이드되는 최신 칩을 원하므로, 건설 완료 시점에 이미 하드웨어가 구세대가 되는 리스크 존재
오늘 체결되는 모든 인프라 계약이 전력 연결 전에 이미 구식 하드웨어에 대한 투자가 될 가능성이 있음

Oracle의 부채 기반 확장 구조

Oracle은 주요 하이퍼스케일러 중 유일하게 부채로 AI 인프라를 확장
- 총 부채 1,000억 달러 이상, 자유현금흐름은 마이너스로 전환되었음
- Google, Amazon, Microsoft는 자체 현금 창출력으로 투자 진행
파트너사인 Blue Owl은 추가 시설 자금 지원을 거부하고, 최대 3만 명 감원 계획을 발표
Oracle은 3분기 실적 발표를 앞두고 있으며, 500억 달러 규모의 자본지출 계획과 자금 조달 지속성이 가능할지가 투자자 관심사

시장 반응과 주가 동향

Oracle 주가는 올해 23% 하락, 2025년 9월 고점 대비 절반 이상 하락
투자자들은 AI 인프라 투자 지속 가능성과 부채 부담에 주목하고 있음

GPU 감가상각과 AI 시장 전반의 리스크

GPU 감가상각은 Oracle을 넘어 AI 인프라 시장 전체에 파급 효과를 미칠 수 있는 리스크임
칩 성능 향상 속도와 데이터센터 건설 기간 간의 불일치가 AI 인프라 투자 전반의 핵심 위험 요소
이러한 구조적 문제는 AI 생태계 전반의 효율성과 투자 회수율에 영향을 미칠 가능성이 있음

GN⁺ 3달전 [-]

Hacker News 의견들

나는 작은 오픈소스 LLM 추론 회사 Synthetic.new를 운영하고 있음
CNBC의 보도는 정확하지 않다고 봄. Oracle이 ‘어제의 데이터센터’를 짓는 게 아니라, Blackwell DC를 짓고 있음. 문제는 ‘오늘의 DC’를 ‘내일’ 완성한다는 점임. 그때쯤이면 Vera Rubin이 출시되어 효율이 5배 높아질 텐데, Oracle이 가격을 5배 낮출 가능성은 낮음
Nvidia의 rack-scale 머신(GB200-NVL72, GB300-NVL72) 은 전원과 네트워크만 연결하면 되는 완성형 랙임. Oracle이 그냥 Vera Rubin 랙을 사서 새 DC에 넣으면 ‘내일의 DC’를 ‘내일’ 가질 수 있음
다만, Oracle이 Blackwell을 내일 납품받기로 이미 계약했거나, DC 건설이 지연되어 GPU들이 놀고 있을 수도 있음. CNBC 보도만으로는 실제 상황이 얼마나 심각한지 불분명함
- 한 세대 만에 5배 효율 향상은 너무 과한 것 같음. 최근 공정 미세화로 인한 개선폭이 줄고 있음
  이 GPU 성능/전력 벤치마크를 보면, 1080 Ti(9년 전)와 5090의 차이는 약 2.56배 수준임. 실제 워크로드에서는 이런 수치가 유지되지 않을 가능성이 높음
  구형 데이터센터 GPU들도 여전히 잘 쓰이고 있음
- 이건 아마 국방·기밀 환경용으로 맞춰진 전략일 가능성이 높음. 이런 환경에서는 펌웨어 검증, 암호화 인증 등으로 상용 출시 후 18~36개월 뒤에야 승인됨
  이미 배포된 Blackwell은 민간용으로 남고, 정부는 새 하드웨어를 따로 구매해야 함. Oracle은 이런 보안 시장의 느린 주기를 노리고 있을 수 있음
  또한 정부는 대규모 GPU 인프라를 직접 운영한 적이 거의 없기 때문에, Oracle이 나중에 이 수요를 흡수할 가능성이 있음
- CNBC의 Deirdre Bosa도 비슷한 말을 했음. 내부에서도 사태의 심각성을 잘 모르는 사람이 많음
  Oracle이 장기적으로 부채 리스크를 안고 있어서 이런 결정이 첫 신호일 수도 있음
- 다른 보도에 따르면 실제로 건설 지연이 맞음. Stargate 부지는 아직 정리 중이고, GPU 설치는 2026년까지 예정되어 있음
  Nvidia가 다른 기업에 수십억 달러 규모의 Blackwell 계약을 주는 것도, 생산 라인을 유지하기 위한 조치로 보임. 이미 납품된 칩들이 창고에 쌓여 있다는 말도 있음
- 데이터센터가 특정 GPU 세대에 묶여 있다는 전제가 이해되지 않음. AWS도 새 Xeon이 나올 때마다 건물을 새로 짓지 않음
Stargate 프로젝트의 핵심은 ‘추론 경제학’임
하이퍼스케일러 인프라와 전문 네오클라우드 간의 비용 차이가 약 75%에 달함. 이 격차가 OpenAI 같은 기업의 직접 구축 vs 외부 구매 결정을 어렵게 만듦
a7om.com에서 40개 이상의 벤더의 추론 단가를 추적 중인데, 이런 데이터가 5000억 달러 규모의 DC 투자가 얼마나 위험한지 보여줌
나는 Stargate가 ‘어제의 데이터센터’라는 말에 동의하지 않음
Oracle은 Nvidia 로드맵을 알고 있고, 200kW/rack 수준의 전력 밀도를 대비해 단계적으로 짓고 있음. 후속 단계에서는 Rubin과 Feynman 세대도 충분히 수용 가능함
- 200kW/rack은 정말 어마어마한 전력 소모임. 이런 규모의 시설은 상상하기 어려움
- 그렇다면 CNBC가 왜 OpenAI가 ‘새 GPU를 원해서 떠난다’고 보도했는지 의문임. 단순 오보인지, 내부 소스의 왜곡인지 설명이 필요함
구형 데이터센터 GPU의 행방이 궁금함. 혹시 2차 시장이 존재하는지, 아니면 Nvidia가 재판매 금지 조항을 넣는지 궁금함
- 이미 eBay에서 A100/H100을 살 수 있음. 전기요금 때문에 집에서는 비경제적이지만, 재미로 돌리는 사람도 있음
- 일반 서버 부품은 중고 시장이 활발하지만, GPU는 너무 특수화된 장비라 개인이 쓰기 어려움. H200 같은 건 가정용 PC에 넣기도 힘듦
  GPU는 비싸고, 무어의 법칙이 이 분야에 그대로 적용될지도 불확실함. 성능 향상이 크지 않으면 교체 주기도 길어질 것임
- AWS는 아직도 T4 GPU(2018년 출시) 기반 g4dn 인스턴스를 제공 중임. 초대형 클라우드는 감가상각 후에도 오래 돌리며, 우리가 버린 GPU를 쓸 일은 없을 것임
- 데이터센터 GPU는 24/7 기준 5~7년 내구성으로 설계되지만, 실질 수명은 3~4년 정도임. Meta의 벤치마크에 따르면 매년 약 9%가 고장남. 초기 3개월의 불량률이 특히 높음
- 일부 GPU는 수냉 전용 랙에 맞춰 설계되어 일반 PC 케이스에 맞지 않음. 나도 NEC SX Aurora TSUBASA를 사봤는데, 팬이 없어 직접 40mm 팬을 세 개 달아야 했음
OpenAI는 그동안 모든 컴퓨트 파트너와 문제를 겪어왔음. 이번 사태도 과장된 면이 있음. 차세대 칩을 더 빨리 공급할 수 있는 파트너는 사실상 없음
Oracle의 재무 구조와 인수 가능성이 더 흥미로운 주제임
정부·금융권 등 핵심 산업이 여전히 Oracle DB를 쓰고 있지만, 부채 상환 압박으로 가격 인상이 이어질 것임. 결국 고객 이탈이 가속화되고, 적대적 인수가 현실적인 선택이 될 수도 있음
- IBM도 Oracle처럼 구식 기술로 여전히 운영 중인 게 신기함
왜 Oracle이 구형 GPU를 대량 구매했는지 이해하기 어려움. 전자제품은 빠르게 감가상각되는데, 2년 뒤 쓸 칩을 지금 정가로 사는 건 비합리적 투자처럼 보임
데이터센터가 매년 GPU를 교체할 수 있느냐는 질문이 있음
- 경쟁력을 유지하려면 매년 업그레이드가 필요함

답변달기

OpenAI, Oracle과의 Stargate 데이터센터 확장 계획 철회

OpenAI와 Oracle의 협력 중단

칩 세대 교체 속도와 인프라 구축의 불균형

Oracle의 부채 기반 확장 구조

시장 반응과 주가 동향

GPU 감가상각과 AI 시장 전반의 리스크

함께 보면 좋은 글 β

댓글과 토론

Hacker News 의견들