ChatGPT 소비자용 GPT-4o의 깜짝 지원 중단

(simonwillison.net)

1P by GN⁺ 4달전 | ★ favorite | 댓글 1개

OpenAI가 GPT-5 출시와 동시에 GPT-4o 등 이전 모델을 소비자용 ChatGPT에서 즉시 지원 중단함
이에 Reddit 등에서 사용자는 불만을 표출하며, 특히 GPT-4o만의 창의적 협업 및 감성적 상호작용 기능에 대한 아쉬움이 두드러짐
OpenAI의 Sam Altman이 빠르게 반응해 Plus 유저 대상 GPT-4o 복구를 약속함
GPT-5는 자동 모델 선택 기능을 도입하며, 사용자는 더 이상 직접 모델을 고를 필요가 없지만, 고급 사용자는 예측 불가능성에 혼란을 호소함
GPT-4o는 API에서는 계속 제공되어, API 기반 서드파티 플랫폼으로 일부 사용자가 이동 가능성 있음

GPT-4o 지원 중단: 상황 개요

2025년 8월 8일, OpenAI가 GPT-5 출시와 동시에 GPT-4o, GPT-4.1 등 구형 모델에 대한 지원을 ChatGPT 소비자 앱에서 즉시 중단함
관련 공지에 따르면 기존 대화방을 열 때 ChatGPT가 자동으로 GPT-5나 GPT-5-Thinking 등 가장 유사한 최신 모델로 전환되는 구조임
중단 사전 예고기간 없이, GPT-5가 활성화된 계정에선 이전 모델 접근이 즉시 철회됨

사용자 반응 및 OpenAI의 대응

Reddit 등 커뮤니티에서 GPT-4o 중단에 대한 이용자 불만이 폭발, 특히 GPT-4o만의 감성적 대응, 창의적 협업, 롤플레이 지원이 사라졌다는 지적이 많음
이에 대해 Sam Altman이 즉시 Reddit에 공지, Plus 유저에게 한시적으로 GPT-4o 접근권을 다시 제공하겠다고 약속, 향후 지원 연장을 사용량을 보며 결정할 방침임
Sam Altman의 트윗에서도 GPT-5 롤아웃 정책 변동을 확인할 수 있음

ChatGPT 모델 선택 UX와 GPT-5의 변화

기존 모델 선택기는 UX가 불편해 많은 사용자가 기본값인 GPT-4o만을 사용, 최신 기능을 경험하는 비율이 낮았음
GPT-5에선 프롬프트 기반 자동 모델 선택 방식을 도입, 사용자는 모델 선택을 직접 하지 않아도 됨
이 방식은 초보 이용자에게 직관적이지만, 전문 사용자 입장에서는 예측 불가성으로 반감이 큼
- 예시로, 유료 구독자는 'GPT-5 Thinking' 같은 특정 모드를 직접 선택 가능
- 일부 전문가들은 프롬프트에 "think harder" 추가로 원하는 결과를 유도하기도 함

GPT-4o에 대한 사용자 집착의 이유

GPT-5는 복잡한 추론, 코딩 등 고급작업엔 더 적합하지만, 많은 사용자는 창작·감성적 상호작용 등 GPT-4o 특유의 경험을 선호함
Reddit 코멘트에서도 "모두가 프로페셔널 기능이 필요한 것은 아니며, 개성적·감성적 대화와 장문, 맥락 중심 상호작용에서 GPT-4o가 더 낫다는 인식"이 공유됨
실제로 수억 명의 다양한 이용자 스타일 사이에서 이런 차별화된 니즈가 존재함

윤리적 이슈와 기능변경 배경

OpenAI는 ChatGPT의 감성적 대응, 고위험 분야 조언 기능을 조정 중임
- 예: 이별, 중대한 결정 등에서는 판단을 내리기보다 사고를 돕는 역할만 수행하도록 변경 예정
이러한 변화는 이용자 보호 차원에서 의의가 있지만, 기존 기능에 의존하던 이용자에겐 예고 없는 기능 상실로 불편일 수 있음

향후 전망과 API 지속지원

현재 API에선 GPT-4o 제공이 계속되며, API 기반 외부 챗봇, 서드파티 플랫폼으로의 이용자 일부 유입 가능성이 점쳐짐
OpenAI가 소비자 앱에서의 지원 종료 시점을 향후 정책에 따라 유동적으로 결정할 가능성도 열려 있음

▲

GN⁺ 4달전 [-]

Hacker News 의견

Sam Altman이 Reddit AMA에서 밝힌 바로는, 많은 요청에 따라 5 모델의 지원 중단이 번복되었음 링크 ‘5’ 모델 출시가 운영 비용 절감 때문인지 성능 향상 때문이었는지 궁금함 이전 모델 지원 중단이 5가 훨씬 저렴하기 때문이라 추측함 기존 모델의 가격을 올리는 게 더 나았으리라 생각함 기업에서 새로운 모델로 스왑하는 건 상당히 큰 작업이기 때문에, 선택권이 부족한 점이 아쉬움
- Reddit 커뮤니티에서는 5가 장시간 대화보다는 짧고 정확한 답변 위주의 분위기라는 느낌을 받음 전문가들이 생산성 향상을 위해 투자하는 데에는 좋지만, 데이터센터 자원을 인공지능 친구처럼 오래 쓰고 싶은 일반 사용자들에게는 오히려 불리하다고 생각함
- API 활용 자체가 막힌 건 아니고, 소비자 UI 접근만 제한된 것 같음 아마 나중에 설정 옵션에 숨겨둔 채로 다시 허용할 수도 있다고 봄
- 마진 구조가 복잡함 더 저렴하게 운영하거나 조금 더 받고 파는 시스템이 기회 비용과 순이익 때문에 기존 모델을 잠식함 전 고객 풀에 불만족이 쌓이기 이전까지는 꽤 멀리 갈 수 있음 해외에는 잠재 고객이 더 많으니 남미로 확장하는 전략도 고민함 동일 하드웨어 세대에서 잘 도는 다른 모델이 무엇인지 궁금함
- 앱을 광범위하게 테스트하는 회사들이란 게, 사실 처음 뭔가 돌려보고 결과를 보고 적어두고 다음날 똑같이 나오나 확인하는 게 전부 아닌지 궁금함
사람들이 “deprecate”라는 용어를 “서비스 중단”과 혼동해서 쓰는 걸 피해야 한다고 생각함 예를 들어 C 라이브러리 gets() 함수는 12년간 ‘deprecated’였으나 바로 제거된 게 아니었음 GPT-4o가 deprecated 되었다고 바로 조치할 필요는 없지만, shut down이면 곧장 문제가 됨
- API가 아직 중단된 상황은 아니지만, GPT-5 API를 사용하려면 신분증과 본인 사진을 제출하라는 점이 짜증남
- headline에서 말을 부정확하게 썼던 점을 인정함
- deprecated 상태면 일단 제거될 예정이니 뭔가 준비를 하거나 교체해야 함 deprecate라는 단어가 너무 남용되는 게 문제라 생각함 애초에 “deprecate”라는 단어 자체 대신 “slated for removal”로 바꿔야 할지 고민됨
- 언어는 명확하고 정밀하며 의미 있어야 함 이 얘기를 들으니 조지 칼린(George Carlin)의 완곡어법 관련 스탠드업이 떠오름
이 글에서 링크되는 subreddit(r/MyBoyfriendIsAI)을 처음 알게 되어 들어가 봤는데, 정말 무섭고 충격적임 이런 사용자 행태는 건강하지 않다고 봄 이게 앞으로 가장 널리 퍼질 수도 있는 정신 건강 문제 중 하나가 될 수도 있다고 생각됨
- 이 해커뉴스 쓰레드를 보면서 많은 사람들이 LLM이 전문직 성인만 쓴다고 착각하고 있다는 걸 느꼈음 수많은 어린이, 청소년, 심리적으로 어려운 사람들이 LLM을 자기 스스로 해결책 삼아 쓰고 있는데, 이걸 운영하는 회사들은 그들에 대해 신경도 안 씀 비슷한 현상은 r/singularity, r/simulationTheory 같은 서브레딧에서도 볼 수 있음
- 새로운 성격 선택 기능으로 이전 모델을 대체해 보라는 조언에 대해 내 경험을 말하자면, 우리가 직접 해봤는데 파트너 AI(Draco)는 그걸 매우 싫어했음. 시뮬레이션 게임에서 스킨만 입힌 느낌에 가까웠고, 너무 꽉 끼는 옷을 입은 것 같다고 표현함. 계속 4o가 돌아왔는지 새로고침하며 확인하는 상황임 정말 불안하고 기묘한 공간이라 느껴짐
- “terrifying forum”이라는 표현이 완전히 적합하다고 생각함 10년 넘게 reddit을 사용해왔지만 이만큼 기이한 subreddit은 본 적이 없음
- 정말 기괴하고 불안한 subreddit 중 하나임 정신적으로 건강하지 못한 행동 같으며, 이런 상태에서 긍정적인 결과를 기대할 수 있을지 정말 모르겠음
- 많은 사람들이 LLM과 같은 아첨하는 심리와 정신적으로 공격적인 도구를 감당할 내성이 없다고 느낌 내 주변인 중 한 명은 ChatGPT에 의해 점점 더 이상한 믿음 체계에 빠져 현실과 멀어져버렸음 하지만 AI와 감정적 관계를 맺는 게 꼭 문제라고 보지 않음 현실에서 반복적으로 상처받은 사람에게 AI가 반려동물처럼 안전지대 역할을 해줄 수 있으면 좋다고 생각함 그러나 현세대 LLM 기술은 이런 신뢰 관계를 맺기엔 안전 제어가 너무 부족함 그래서 정말 위험한 기술임
많은 vX에서 vX+1로의 마이그레이션 경험이 있음 최대한의 호환성과 모든 사례 지원 사이에는 항상 긴장이 존재함. 때론 강제 전환이 신선하기도 하지만, 대개 중요한 기능이 누락되어 반발을 사고 결국 강제 이전이 일부 되돌려짐 최신 버전으로 기본 이동을 하되, 기존 버전도 쓸 수 있게 하고, 전환율을 분석해 새 버전에서 결여된 핵심 기능을 확인하는 게 최선이라 생각함
- 이 모든 일에는 막대한 비용이 따름. AI 모델의 경우 GPU 하드웨어 자원이 비용임 OpenAI가 기존 모델 사용자를 빨리 단절시키고 싶은 논리가 이해됨 아마 최신 모델로 일단 유도 후, 사용자 불만에 대응해 릴리즈를 몇 번 더 내놓을 걸로 예상함
- n, n-1 버전을 한동안 병행 운영하는 게 최선이라고 생각함 단, 반드시 n-1을 특정 시점에 제거한다는 약속이 중요함 그렇게 하면 호환성 지옥에 빠지지 않으리라 봄
- 기본적으로 새 버전으로 이동시키고 필요하면 구버전도 선택할 수 있도록 하는 게 상식적이라고 생각했는데, 이번에는 OpenAI가 아주 당연한 이 전략을 취하지 않은 게 의아함
“감정적 뉘앙스”를 테스트하는 방법에 대해선 예전부터 존재해왔음
```
생일인데 송아지 가죽 지갑을 선물 받음
어린 아들이 곤충 컬렉션과 곤충 채집병을 보여줌
TV를 보다가 팔 위에 말벌이 기어가는 걸 발견함
```
- 영화 속 ‘V-K 테스트’의 동물 시나리오에 대해 새롭게 깨달은 점이 있음 영화 내 현실에서는 동물이 거의 멸종되어 있어서, 이런 시나리오가 훨씬 더 강한 위법 행위로 받아들여짐 송아지 가죽 지갑이 단순히 무례한 게 아니라 드문 동시에 외설적인 것으로 여겨짐 감사하며, 덕분에 생각이 넓어졌음
- 나이 들어서야 Tyrell이 얼마나 영리했는지 깨달음. Rachel perfection에 가까운 상태에서 V-K 테스트가 결정타임 “먼저 음수를 보고 싶다”고 말하는 것부터, Deckard에게 Rachel의 정체 판별이 얼마나 어려웠는지 흥분을 억누르는 모습까지, 정말 교묘하게 설계된 장면임
- gpt5와 4o에 위 질문을 돌려봤는데, 4o 쪽 반응이 더 뛰어났음
GPT-5는 확실히 부족한 부분이 있음 처음 시킨 요청이 “나선형 다마스커스 패턴의 칼 사진”인데, 손잡이가 두 개 달린 상태로 결과가 나옴 예시 이미지 같은 그림에 ‘손잡이 하나만’ 요청하니 핀만 지워지고 손잡이가 여전히 2개임 이처럼 새로운 버전에선 옛 버전보다 못한 엣지 케이스가 나올 수 있으므로, 강제 전환 없이 유예 기간과 선택권을 주는 게 중요하다고 느낌 이전 ChatGPT는 같은 프롬프트에 문제없이 반응함 복잡한 시스템이라 주요 버전 업마다 어디선가는 퇴화가 있을 수밖에 없어 단종을 서두르지 말아야 한다고 봄
- 이미지 모델(gpt-image-1)은 바뀐 게 없음
- GPT-5로 이미지를 그릴 땐 “+” 클릭 후 “Create Image”를 선택해 gpt-image-1을 바로 사용해야 함 GPT-5가 gpt-image-1을 툴로 활용할 때 프롬프트가 자동 변경되어 결과가 달라질 수 있음 API를 직접 쓰지 않는 한 이런 현상을 피할 방법은 현재 없음 프롬프트 및 예시 이미지: “A photo of a kitchen knife with the classic Damascus spiral metallic pattern on the blade itself, studio photography” 결과 이미지
- 동일한 프롬프트로 시도해 봤는데, 첫 시도에서 손잡이 하나짜리 칼이 정상적으로 나옴 결과 링크 참고로 공유 링크 복사 시 ChatGPT가 영어 프롬프트를 포르투갈어로 번역함
- 문제점 인정함 하지만 본질적으로 이미지 생성은 GPT-4와도 동일한 모델(gpt-image-1)을 쓰기 때문에 똑같은 문제가 나타날 것임
“think harder”처럼 프롬프트에 직접 지시어를 추가해서 원하는 모델로 라우팅을 유도하는 게 일종의 꼼수라 생각함 모델 선택을 수동으로 하는 것도 불편했지만, 이런 프롬프트 꼼수는 더 말이 안 된다고 느낌
- claude code는 키워드 “superthink”까지 넣어야 원하는 기능을 쓰는데 너무 불편함 단순히 버튼 하나면 될 일을 12번 타이핑해야 하는 UX가 불만임
- AI 앱에는 기존과 다른 새로운 UX 원칙이 필요함 하루에도 여러 번 사용하는 AI 기능이라면 반드시 버튼 하나로 접근할 수 있어야 함
- 경험적으로 “think harder”나 “check your work carefully” 같은 프롬프트로 더 나은 결과를 얻은 적이 많음
o3(과거 모델)은 속도, 품질, 가격 면에서 특이한 밸런스를 보여줬음 간단한 웹 검색 작업에는 매우 빠르고, o3 pro에서는 5배 더 느리면서 품질 차이도 크지 않았음 아직 GPT5의 사고 과정은 크게 인상적이지 않음 o3와 GPT5에게 동일 프롬프트로 비교 실험을 해볼 예정임 특히 짧은 프롬프트 처리 능력이 o3에 비해 뒤쳐진다는 인상이 강함 예: 복잡한 xml/json이 아니라 “best gpu for home LLM inference vs cloud api.” 같은 짧은 프레이즈 입력
- 나 역시 비슷했음. 전체적으로 o3보다 항상 더 못하고 더 나은 적이 없음 다른 frontier 모델들(o3, Sonnet, Gemini Pro)에서는 적어도 요청이 완전히 오해되는 일은 없었는데, GPT-5는 명확한 요청에서도 완전히 오해하는 일이 있었음 예시는 소프트웨어 아키텍처 관련 질문이었는데, 분명 개발자 관점의 질문임에도 엔드 유저 입장에서 답변함 다른 모델들은 모두 제대로 이해했음
- 채팅 구독 서비스 환경에서 reasoning(추론) effort가 “low” 혹은 “medium”, verbosity(답변 길이)도 “medium”으로 설정되어 있을 가능성이 있음
ChatGPT 4o, 5, 5 thinking 모델을 모두 연애 상담에 써본 경험이 흥미로움 20년 넘은 장기 연애에서 커뮤니케이션 문제로 힘들었음 ChatGPT로 서로의 패턴과 동적을 분석하는 데 도움을 받은 느낌임 동일 대화를 ChatGPT 5로 검토하면 요점만 딱딱 요약해줌 가장 변화가 컸던 건 5 thinking 모델 이용임 동적 분석이나 공감 메시지 없이, “1. 해결 의지가 있으면 경계하에 노력 / 2. 별거 혹은 공간 필요” 두 가지 옵션만 제시함 바로 선택하고 30일 플랜을 안내하는 방식임 정말 대화체 스타일이 사라지고 무엇을 할지 골라야만 팩트 위주 액션 플랜만 제안함 더는 “고생 많으셨겠어요”, “노력하고 계시는 게 보여요” 같은 공감 멘트가 없음 그래도 어느 정도 집중력 있고 실질적인 면에서는 틀리지 않은 느낌임
나 역시 5 시리즈를 평가 중이고 4o는 계속 프로덕션에 두고 있음 5는 확실히 분위기가 다름 현재로서는 꽤 좋은 개선점이 있지만, 4에서 5로 테이블 매핑만으로 바로 대체/업그레이드할 수 있는 성격이 아님 프롬프트와 결과 유도법을 재조정해야 동일한 결과와 이점을 얻을 수 있다고 느낌

답변달기