OpenAI, 구글 추격에 ChatGPT 개선 위해 '코드 레드' 발동
(theverge.com)- OpenAI가 ChatGPT 품질 개선을 위해 ‘코드 레드’ 단계로 긴급 전환, 구글의 추격으로 흔들리는 우위를 회복하려고 노력중
- 현재 개인화·속도·신뢰성·질문 범위 확대 등 핵심 기능 보완이 시급하며, 이를 위해 광고·Pulse·헬스·쇼핑 에이전트 등 모든 신규 프로젝트가 중단 또는 지연됨
- Google의 Gemini 3가 최근 벤치마크 다수에서 OpenAI 모델을 앞서고, 이미지 모델 Nano Banana 성공으로 MAU가 4.5억→6.5억까지 급증한 점이 주요 위협으로 드러남
- OpenAI는 수천억 달러 규모의 데이터센터 투자 약정, 2030년까지 연매출 2,000억 달러 필요 등 재무 압박도 커지고 있으며, Anthropic의 기업 고객 성장도 경쟁 요소로 작용함
- OpenAI는 매일점검 체계를 가동하고 팀 재배치를 실시하며, 곧 공개될 새 추론(reasoning) 모델이 Gemini 최신 버전보다 앞서 있다고 내부적으로 밝히는 등 주도권 회복이 중요한 갈림길로 나타남
코드 레드 발동과 ChatGPT 개선 계획
- OpenAI가 ChatGPT 문제 해결을 위해 가장 높은 단계의 긴급 모드인 ‘코드 레드’ 를 발동한 사실이 내부 메모를 통해 드러남
- OpenAI는 yellow → orange → red의 3단계 경보 체계를 사용하며, 이번 조치는 코드 오렌지에서 한 단계 더 상향된 상태임
- 개선 범위는 개인화 강화, 응답 속도 향상, 서버 신뢰성 개선, 답변할 수 있는 질문의 범위 확대 등 사용 경험 전반을 포함함
- 이를 위해 광고, Pulse(개인비서), 헬스·쇼핑 에이전트 등 모든 신규 프로젝트가 후순위로 밀림
- 전사 인력 재배치를 독려하고, 매일 개발 상황을 점검하는 전담 콜(daily call) 을 운영하기로 함
- 최근 GPT-5에 대한 차가운 톤, 기본 질문 오류 등의 불만이 있었고, 이로 인해 모델 톤과 지시 수행 능력을 다시 조정한 점도 포함됨
Google Gemini의 추격과 경쟁 압박
- Google의 최신 Gemini 3 모델이 여러 산업 벤치마크에서 OpenAI를 앞서며, 경쟁 구도가 크게 흔들린 상황으로 나타남
- Gemini 발표 직후 Google 주가가 상승했고, 성능이 시장에서 강하게 부각됨
- 이미지 생성 모델 Nano Banana가 출시된 8월 이후 Google AI 전체 월간활성이용자(MAU)가
- 7월 4.5억 → 10월 6.5억으로 급증한 데이터가 제시됨
- Anthropic도 기업 고객 기반에서 확대되고 있어, OpenAI 단독 체제의 우위가 약화되는 흐름이 드러남
- ChatGPT 등장 직후 Google이 발표했던 ‘코드 레드’가 이제 OpenAI 쪽으로 되돌아온 아이러니한 상황으로 서술됨
투자, 재무적 압박과 시장의 불안
- OpenAI는 Microsoft·Amazon과의 계약으로 36GW 규모의 데이터센터 전력 계약을 체결해,
- 향후 연간 6,200억 달러 수준의 데이터센터 임대 비용이 발생할 수 있음
- 2030년 흑자 전환을 위해 연간 약 2,000억 달러의 매출이 필요하다는 내부 전망도 제시됨
- OpenAI는 상장 계획이 없지만,
- 이 재무 구조가 Nvidia, Oracle, Microsoft 등 주요 기술 기업들의 주가와도 밀접히 연동되어 시장 전체에 영향을 주고 있음
- OpenAI는 여전히 적자이며, 지속적인 대규모 자금 조달 없이는 생존이 어려운 구조라고 평가됨
새 모델 발표 예고와 내부 자신감
- 알트먼은 메모에서 다음 주 공개될 새로운 추론(reasoning) 모델이 Google Gemini 최신 버전보다 앞선다고 언급함
- 내부 사기 진작 요소로 보이며, ChatGPT의 성장성과 주도권 회복 의지를 강조한 형태
- ChatGPT는 여전히 주간 사용자 8억 명 이상이라는 강력한 사용자 기반을 가지고 있으며,
- OpenAI는 여기에 다시 속도·정확성·개인화 개선을 더해 성장세를 유지할 계획임
전체 맥락
- 경쟁 심화(Google·Anthropic), 제품 품질 논란, 대규모 인프라 비용이 결합한 상황에서
ChatGPT의 기본 품질을 되살리는 것이 OpenAI의 생존 전략이자 가장 시급한 우선순위로 나타남
Hacker News 의견
-
지난주 고객이 내가 일부 작성한 기능에 대한 문의를 보냈음. 지원 엔지니어가 Claude를 통해 답변을 생성했는데, 내부·공개 문서를 학습했음에도 그럴듯한 헛소리를 아주 자신 있게 만들어냈음
내가 왜 틀렸는지 설명하는 중에 다른 엔지니어가 Augment로 돌려봤더니, 이번엔 또 다른 헛소리를 자신 있게 내놓았음. 결국 눈물 나는 이모지만 주고받고, 나는 앞으로도 내 자체 지능을 쓸 것임- 내 코드는 0.11초, Gemini의 코드는 0.5초 걸림. 상사가 이유를 묻는데, 뭐라 설명해야 할지 모르겠음 ¯\(ツ)/¯
- LLM은 불가능한 일에 대해선 정말 약함. 차라리 그들이 환각으로 만들어낸 기능을 실제로 구현하는 게 나을 때도 있음. 이미 일부 공개 API 제공자들은 그렇게 하고 있음
-
OpenAI가 2024년 중반 이후로는 성공적인 pre-training을 못 했다는 루머를 들었음. ChatGPT 5.1에 인터넷 없이 현재 사건을 물어보면 지식 컷오프가 2024년 6월이라고 함. 이게 작은 모델 때문인지 모르겠지만, 지금 시점에서 18개월 전이면 불안한 신호 같음
- SemiAnalysis 뉴스레터에서도 같은 이야기가 나왔고, 부정된 적은 없음
- 가끔 GPT 모델로 코딩을 시도해보면, 간결한 대화 스타일 때문에 며칠간은 좋아 보임. 하지만 결국 Claude나 Gemini보다 품질이 떨어지고 실패 패턴도 많음
- ChatGPT 5.1에게 codex CLI 설치 문제를 물었더니, codex는 단종됐고 내가 ‘openai’ 명령어를 잘못 쓴 거라고 자신 있게 말했음
- 구글도 2000년대 초 웹 크롤링 지연 문제를 겪었지만 살아남았음. 다만 지금의 OpenAI는 그때의 구글만큼 차별화된 위치가 아니라서 훨씬 위험한 상황일 수 있음
- PS5와 PC 중 어디서 Indiana Jones를 할지 물었더니, 처음엔 오타로 착각하다가 결국 인터넷에서 찾아와 내 게이밍 리그를 칭찬했음
-
작년부터 이어진 OpenAI 핵심 연구자들의 이탈이 이제 본격적으로 영향을 미치는 것 같음. Sam Altman은 영업가이지 연구자가 아님. Ilya도 없고, 주요 인력은 Google·Meta·Anthropic으로 옮겼거나 창업했음. 남은 사람들은 반복 개선엔 강하지만, 다음 도약을 스스로 이끌 수 있을지 의문임
-
지금의 OpenAI는 마치 Netscape 같음. 혁신적이지만 지속 가능한 수익 모델이 없음. 한쪽은 Google처럼 기존 제품에 AI를 무료로 번들링하고, 다른 쪽은 Deepseek이나 Qwen이 오픈소스로 가격을 깎아버림. 결국 양쪽에서 압박받는 구조임
- OpenAI는 올해 연간 200억 달러 매출을 넘길 예정이라 함 (CNBC 기사)
- 만약 OpenAI가 상업화에 실패하고 다시 비영리 모델로 돌아가 무료 도구를 공유한다면, Mozilla의 길을 걷는 셈일 것임
- “Google이 Gemini를 무료로 번들링할 것이다”라는데, 이미 거의 모든 제품에 그렇게 하고 있지 않나 싶음
- 내 아내는 Claude로 바꾸길 거부함. ChatGPT가 자기 취향에 맞게 완벽히 튜닝되어 있다고 느낌
- Gemini를 무료로 번들링하려면 Flash 3.0의 추론 비용을 2.5보다 훨씬 낮춰야 가능할 것임
-
진심으로 궁금한 점이 있음. 어떻게 OpenAI가 pre-training에 실패할 수 있는가? 이미 성공 경험이 있고, 인력도 최고 수준인데 단순히 2024년 모델을 다시 학습시키면 되는 것 아닌가?
- 모두가 실패하는 이유와 같음. 하이퍼파라미터를 새 하드웨어에 맞게 조정하고, 논문에서 본 개선점을 반영하지만, 수개월과 수백만 달러 후에 loss가 평탄화되고 결과는 미미함
- ‘성공적’이라는 게 이전 모델보다 눈에 띄게 나은 성능이라면, 그건 정말 어려운 일임
- GPT-4.5가 그런 시도였다고 들었음. 단지 성능이 부족해서 공개하지 않았을 뿐임
- 새 모델은 이전 모델을 이어서 학습하지 않음. 아키텍처가 완전히 달라지기 때문임. 이번엔 그 설계가 잘못되어 mid-2024 모델보다 나빠졌을 가능성이 큼
-
내가 경험한 “Code Red”는 보통 회사 전체가 방향을 잃은 상태를 포장하는 말이었음. 중간관리층이 뭘 해야 할지 몰라서 결국 엔지니어들이 부담을 떠안게 됨
- PM과 중간관리자를 해고한다고 이런 사태가 막히진 않음. 대규모 조직의 의사결정 구조를 너무 단순하게 보는 시각임
- 제대로 된 Code Red라면 회사의 우선순위를 단일화하고, 엔지니어를 핵심 프로젝트로 재배치해야 함
- 내가 본 유일한 사례에서는 실제로 PM을 해고했는데, 예상치 못한 문제들이 터졌고 그걸 “문제를 알게 돼서 다행”이라며 받아들였음
- “모든 문제는 다른 사람 탓이고, 나만 남으면 해결된다”는 엔지니어의 착각도 존재함
- 이번 Code Red는 수익화 기능 중단의 핑계일 수도 있음. 현실적인 기업가치와의 괴리를 피하려는 움직임임
-
진짜 Code Red는 Google이 OpenAI를 앞선 게 아니라, AI 산업에 해자가 없다는 사실이 드러난 것임. 결국 모두가 가장 비싼 바닥 경쟁을 벌이는 중임
- 이런 기업들은 결국 정부 계약이나 간접적 구제금융으로 손실을 사회화할 것임
- Gemini 3의 성능이 실제로 ChatGPT 사용자 이탈로 이어졌는지는 불분명함
- 투자자들이 적자 구조의 상품화 경쟁에 흥분하는 게 이해되지 않음. 나도 GPT3~4 시절엔 팬이었지만 지금은 Claude와 Gemini를 병행 사용 중임. 충성도는 0임
- 그렇다면 왜 Google 주가는 Gemini 2.5 Pro 출시 이후 급등했을까?
- 나도 OpenAI가 비밀스러운 학습 기술을 갖고 있을 줄 알았는데, 그런 건 없었음
-
OpenAI는 Stargate 프로젝트 등으로 5,000억 달러 규모의 장기 지출 약속을 했음. Microsoft Azure에 2,500억 달러, AMD GPU에도 수십억 달러를 투입 예정임. Oracle은 이를 위해 180억 달러 채권과 96억 달러 대출을 받았음
만약 OpenAI가 뒤처지면 이 계약들을 감당하지 못하고, 연쇄 부도 위험이 생김. 정부 개입 가능성도 있음- Altman이 구제금융은 없다고 말하지만, 그 말 자체가 신뢰 확보 전략임
- 5,000억 달러는 지출 약속이지, 수익이 아님. 큰 차이임
- 차라리 의회 교착 상태가 이런 구제금융을 막아주길 바람
- 대부분은 비구속적 LOI라서 실제만큼 단단한 약속은 아님
- LLM 아키텍처로는 AGI에 도달 불가할 수도 있음. 대체 구조를 개발하지 않으면 이 모든 계약은 무의미해질 것임
-
OpenAI가 광고·쇼핑·헬스 에이전트·Pulse 같은 프로젝트를 미루고 ChatGPT 개선에 집중한다는데, 근본적으로 핵심 인력은 소수이고 나머지는 광고나 상업 기능을 맡을 수 있음. 둘이 충돌하진 않음
- 병목은 인력이 아니라 리더십의 전략적 사고 여력임
- 문제는 제품의 품질이 아니라 생태계 구축력일 수도 있음. Google은 이미 일상 도구에 통합되어 있음
- LLM 발전은 두 층으로 나뉨: ① 저수준 아키텍처 ② 응용·검증 시스템. 후자는 자동화된 검증 데이터 생성으로 핵심 모델 개선에 기여함
- ‘지연’은 완전 중단이 아니라 컴퓨팅 자원 재배분일 수도 있음
- 소비자 입장에선 이런 경쟁이 모델 품질 향상으로 이어지길 바람
-
WSJ에 따르면 OpenAI는 광고, 헬스·쇼핑용 AI, 개인 비서 Pulse 등을 미루고 있음. Jony Ive와의 하드웨어 협업까지 보면 집중력이 분산된 느낌임
- 그 외에도 소셜 네트워크나 브라우저 같은 프로젝트도 발표했었음
- Google과 경쟁하려면 광고 시장 진입이 가장 중요함. 그렇지 않으면 광고 예산이 Meta·Amazon·Google로 흘러감
- 결국 광고와 Siri/Alexa형 비서가 핵심인데, 그걸 미루는 건 이상함
- 단순히 시선을 잃은 게 아니라, 이제는 단기 실적 중심의 기업이 되었음. Google처럼 25년간 그 게임을 해온 상대를 이기긴 어려움. 하드웨어 확장만으로는 한계가 있음
- 사실 이건 Google과의 경쟁이 아니라 광고가 OpenAI의 생존 시험대라는 이야기임.
만약 광고가 돈을 벌면 OpenAI는 Mag 7급 기업이 되겠지만, 실패하면 현실이 드러남.
이미 광고 실험 결과가 기대 이하라면, ‘Code Red’는 이를 가리기 위한 시간 벌기용 신호일 수도 있음.
ChatGPT는 Google처럼 검색 진입점이 아니고, Meta처럼 피드 기반 광고도 불가능함.
결국 Alexa의 실패를 반복할 가능성이 큼.