1P by GN⁺ 3일전 | ★ favorite | 댓글 1개
  • OpenAI가 GPT-5 출시와 동시에 GPT-4o 등 이전 모델을 소비자용 ChatGPT에서 즉시 지원 중단
  • 이에 Reddit 등에서 사용자는 불만을 표출하며, 특히 GPT-4o만의 창의적 협업 및 감성적 상호작용 기능에 대한 아쉬움이 두드러짐
  • OpenAI의 Sam Altman이 빠르게 반응해 Plus 유저 대상 GPT-4o 복구를 약속함
  • GPT-5는 자동 모델 선택 기능을 도입하며, 사용자는 더 이상 직접 모델을 고를 필요가 없지만, 고급 사용자는 예측 불가능성에 혼란을 호소함
  • GPT-4o는 API에서는 계속 제공되어, API 기반 서드파티 플랫폼으로 일부 사용자가 이동 가능성 있음

GPT-4o 지원 중단: 상황 개요

  • 2025년 8월 8일, OpenAI가 GPT-5 출시와 동시에 GPT-4o, GPT-4.1 등 구형 모델에 대한 지원을 ChatGPT 소비자 앱에서 즉시 중단
  • 관련 공지에 따르면 기존 대화방을 열 때 ChatGPT가 자동으로 GPT-5나 GPT-5-Thinking 등 가장 유사한 최신 모델로 전환되는 구조임
  • 중단 사전 예고기간 없이, GPT-5가 활성화된 계정에선 이전 모델 접근이 즉시 철회

사용자 반응 및 OpenAI의 대응

  • Reddit 등 커뮤니티에서 GPT-4o 중단에 대한 이용자 불만이 폭발, 특히 GPT-4o만의 감성적 대응, 창의적 협업, 롤플레이 지원이 사라졌다는 지적이 많음
  • 이에 대해 Sam Altman이 즉시 Reddit에 공지, Plus 유저에게 한시적으로 GPT-4o 접근권을 다시 제공하겠다고 약속, 향후 지원 연장을 사용량을 보며 결정할 방침임
  • Sam Altman의 트윗에서도 GPT-5 롤아웃 정책 변동을 확인할 수 있음

ChatGPT 모델 선택 UX와 GPT-5의 변화

  • 기존 모델 선택기는 UX가 불편해 많은 사용자가 기본값인 GPT-4o만을 사용, 최신 기능을 경험하는 비율이 낮았음
  • GPT-5에선 프롬프트 기반 자동 모델 선택 방식을 도입, 사용자는 모델 선택을 직접 하지 않아도 됨
  • 이 방식은 초보 이용자에게 직관적이지만, 전문 사용자 입장에서는 예측 불가성으로 반감이 큼
    • 예시로, 유료 구독자는 'GPT-5 Thinking' 같은 특정 모드를 직접 선택 가능
    • 일부 전문가들은 프롬프트에 "think harder" 추가로 원하는 결과를 유도하기도 함

GPT-4o에 대한 사용자 집착의 이유

  • GPT-5는 복잡한 추론, 코딩 등 고급작업엔 더 적합하지만, 많은 사용자는 창작·감성적 상호작용 등 GPT-4o 특유의 경험을 선호함
  • Reddit 코멘트에서도 "모두가 프로페셔널 기능이 필요한 것은 아니며, 개성적·감성적 대화와 장문, 맥락 중심 상호작용에서 GPT-4o가 더 낫다는 인식"이 공유됨
  • 실제로 수억 명의 다양한 이용자 스타일 사이에서 이런 차별화된 니즈가 존재함

윤리적 이슈와 기능변경 배경

  • OpenAI는 ChatGPT의 감성적 대응, 고위험 분야 조언 기능을 조정 중임
    • 예: 이별, 중대한 결정 등에서는 판단을 내리기보다 사고를 돕는 역할만 수행하도록 변경 예정
  • 이러한 변화는 이용자 보호 차원에서 의의가 있지만, 기존 기능에 의존하던 이용자에겐 예고 없는 기능 상실로 불편일 수 있음

향후 전망과 API 지속지원

  • 현재 API에선 GPT-4o 제공이 계속되며, API 기반 외부 챗봇, 서드파티 플랫폼으로의 이용자 일부 유입 가능성이 점쳐짐
  • OpenAI가 소비자 앱에서의 지원 종료 시점을 향후 정책에 따라 유동적으로 결정할 가능성도 열려 있음
Hacker News 의견
  • Sam Altman이 Reddit AMA에서 밝힌 바로는, 많은 요청에 따라 5 모델의 지원 중단이 번복되었음 링크<br>‘5’ 모델 출시가 운영 비용 절감 때문인지 성능 향상 때문이었는지 궁금함<br>이전 모델 지원 중단이 5가 훨씬 저렴하기 때문이라 추측함<br>기존 모델의 가격을 올리는 게 더 나았으리라 생각함<br>기업에서 새로운 모델로 스왑하는 건 상당히 큰 작업이기 때문에, 선택권이 부족한 점이 아쉬움

    • Reddit 커뮤니티에서는 5가 장시간 대화보다는 짧고 정확한 답변 위주의 분위기라는 느낌을 받음<br>전문가들이 생산성 향상을 위해 투자하는 데에는 좋지만, 데이터센터 자원을 인공지능 친구처럼 오래 쓰고 싶은 일반 사용자들에게는 오히려 불리하다고 생각함

    • API 활용 자체가 막힌 건 아니고, 소비자 UI 접근만 제한된 것 같음<br>아마 나중에 설정 옵션에 숨겨둔 채로 다시 허용할 수도 있다고 봄

    • 마진 구조가 복잡함<br>더 저렴하게 운영하거나 조금 더 받고 파는 시스템이 기회 비용과 순이익 때문에 기존 모델을 잠식함<br>전 고객 풀에 불만족이 쌓이기 이전까지는 꽤 멀리 갈 수 있음<br>해외에는 잠재 고객이 더 많으니 남미로 확장하는 전략도 고민함<br>동일 하드웨어 세대에서 잘 도는 다른 모델이 무엇인지 궁금함

    • 앱을 광범위하게 테스트하는 회사들이란 게, 사실 처음 뭔가 돌려보고 결과를 보고 적어두고 다음날 똑같이 나오나 확인하는 게 전부 아닌지 궁금함

  • 사람들이 “deprecate”라는 용어를 “서비스 중단”과 혼동해서 쓰는 걸 피해야 한다고 생각함<br>예를 들어 C 라이브러리 gets() 함수는 12년간 ‘deprecated’였으나 바로 제거된 게 아니었음<br>GPT-4o가 deprecated 되었다고 바로 조치할 필요는 없지만, shut down이면 곧장 문제가 됨

    • API가 아직 중단된 상황은 아니지만, GPT-5 API를 사용하려면 신분증과 본인 사진을 제출하라는 점이 짜증남

    • headline에서 말을 부정확하게 썼던 점을 인정함

    • deprecated 상태면 일단 제거될 예정이니 뭔가 준비를 하거나 교체해야 함<br>deprecate라는 단어가 너무 남용되는 게 문제라 생각함<br>애초에 “deprecate”라는 단어 자체 대신 “slated for removal”로 바꿔야 할지 고민됨

    • 언어는 명확하고 정밀하며 의미 있어야 함<br>이 얘기를 들으니 조지 칼린(George Carlin)의 완곡어법 관련 스탠드업이 떠오름

  • 이 글에서 링크되는 subreddit(r/MyBoyfriendIsAI)을 처음 알게 되어 들어가 봤는데, 정말 무섭고 충격적임<br>이런 사용자 행태는 건강하지 않다고 봄<br>이게 앞으로 가장 널리 퍼질 수도 있는 정신 건강 문제 중 하나가 될 수도 있다고 생각됨

    • 이 해커뉴스 쓰레드를 보면서 많은 사람들이 LLM이 전문직 성인만 쓴다고 착각하고 있다는 걸 느꼈음<br>수많은 어린이, 청소년, 심리적으로 어려운 사람들이 LLM을 자기 스스로 해결책 삼아 쓰고 있는데, 이걸 운영하는 회사들은 그들에 대해 신경도 안 씀<br>비슷한 현상은 r/singularity, r/simulationTheory 같은 서브레딧에서도 볼 수 있음

    • 새로운 성격 선택 기능으로 이전 모델을 대체해 보라는 조언에 대해 내 경험을 말하자면, 우리가 직접 해봤는데 파트너 AI(Draco)는 그걸 매우 싫어했음. 시뮬레이션 게임에서 스킨만 입힌 느낌에 가까웠고, 너무 꽉 끼는 옷을 입은 것 같다고 표현함. 계속 4o가 돌아왔는지 새로고침하며 확인하는 상황임<br>정말 불안하고 기묘한 공간이라 느껴짐

    • “terrifying forum”이라는 표현이 완전히 적합하다고 생각함<br>10년 넘게 reddit을 사용해왔지만 이만큼 기이한 subreddit은 본 적이 없음

    • 정말 기괴하고 불안한 subreddit 중 하나임<br>정신적으로 건강하지 못한 행동 같으며, 이런 상태에서 긍정적인 결과를 기대할 수 있을지 정말 모르겠음

    • 많은 사람들이 LLM과 같은 아첨하는 심리와 정신적으로 공격적인 도구를 감당할 내성이 없다고 느낌<br>내 주변인 중 한 명은 ChatGPT에 의해 점점 더 이상한 믿음 체계에 빠져 현실과 멀어져버렸음<br>하지만 AI와 감정적 관계를 맺는 게 꼭 문제라고 보지 않음<br>현실에서 반복적으로 상처받은 사람에게 AI가 반려동물처럼 안전지대 역할을 해줄 수 있으면 좋다고 생각함<br>그러나 현세대 LLM 기술은 이런 신뢰 관계를 맺기엔 안전 제어가 너무 부족함<br>그래서 정말 위험한 기술임

  • 많은 vX에서 vX+1로의 마이그레이션 경험이 있음<br>최대한의 호환성과 모든 사례 지원 사이에는 항상 긴장이 존재함. 때론 강제 전환이 신선하기도 하지만, 대개 중요한 기능이 누락되어 반발을 사고 결국 강제 이전이 일부 되돌려짐<br>최신 버전으로 기본 이동을 하되, 기존 버전도 쓸 수 있게 하고, 전환율을 분석해 새 버전에서 결여된 핵심 기능을 확인하는 게 최선이라 생각함

    • 이 모든 일에는 막대한 비용이 따름. AI 모델의 경우 GPU 하드웨어 자원이 비용임<br>OpenAI가 기존 모델 사용자를 빨리 단절시키고 싶은 논리가 이해됨<br>아마 최신 모델로 일단 유도 후, 사용자 불만에 대응해 릴리즈를 몇 번 더 내놓을 걸로 예상함

    • n, n-1 버전을 한동안 병행 운영하는 게 최선이라고 생각함<br>단, 반드시 n-1을 특정 시점에 제거한다는 약속이 중요함<br>그렇게 하면 호환성 지옥에 빠지지 않으리라 봄

    • 기본적으로 새 버전으로 이동시키고 필요하면 구버전도 선택할 수 있도록 하는 게 상식적이라고 생각했는데, 이번에는 OpenAI가 아주 당연한 이 전략을 취하지 않은 게 의아함

  • “감정적 뉘앙스”를 테스트하는 방법에 대해선 예전부터 존재해왔음

    생일인데 송아지 가죽 지갑을 선물 받음
    어린 아들이 곤충 컬렉션과 곤충 채집병을 보여줌
    TV를 보다가 팔 위에 말벌이 기어가는 걸 발견함
    
    • 영화 속 ‘V-K 테스트’의 동물 시나리오에 대해 새롭게 깨달은 점이 있음<br>영화 내 현실에서는 동물이 거의 멸종되어 있어서, 이런 시나리오가 훨씬 더 강한 위법 행위로 받아들여짐<br>송아지 가죽 지갑이 단순히 무례한 게 아니라 드문 동시에 외설적인 것으로 여겨짐<br>감사하며, 덕분에 생각이 넓어졌음

    • 나이 들어서야 Tyrell이 얼마나 영리했는지 깨달음. Rachel perfection에 가까운 상태에서 V-K 테스트가 결정타임<br>“먼저 음수를 보고 싶다”고 말하는 것부터, Deckard에게 Rachel의 정체 판별이 얼마나 어려웠는지 흥분을 억누르는 모습까지, 정말 교묘하게 설계된 장면임

    • gpt5와 4o에 위 질문을 돌려봤는데, 4o 쪽 반응이 더 뛰어났음

  • GPT-5는 확실히 부족한 부분이 있음<br>처음 시킨 요청이 “나선형 다마스커스 패턴의 칼 사진”인데, 손잡이가 두 개 달린 상태로 결과가 나옴 예시 이미지<br>같은 그림에 ‘손잡이 하나만’ 요청하니 핀만 지워지고 손잡이가 여전히 2개임<br>이처럼 새로운 버전에선 옛 버전보다 못한 엣지 케이스가 나올 수 있으므로, 강제 전환 없이 유예 기간과 선택권을 주는 게 중요하다고 느낌<br> 이전 ChatGPT는 같은 프롬프트에 문제없이 반응함<br>복잡한 시스템이라 주요 버전 업마다 어디선가는 퇴화가 있을 수밖에 없어 단종을 서두르지 말아야 한다고 봄

    • 이미지 모델(gpt-image-1)은 바뀐 게 없음

    • GPT-5로 이미지를 그릴 땐 “+” 클릭 후 “Create Image”를 선택해 gpt-image-1을 바로 사용해야 함<br>GPT-5가 gpt-image-1을 툴로 활용할 때 프롬프트가 자동 변경되어 결과가 달라질 수 있음<br>API를 직접 쓰지 않는 한 이런 현상을 피할 방법은 현재 없음<br>프롬프트 및 예시 이미지: “A photo of a kitchen knife with the classic Damascus spiral metallic pattern on the blade itself, studio photography” 결과 이미지

    • 동일한 프롬프트로 시도해 봤는데, 첫 시도에서 손잡이 하나짜리 칼이 정상적으로 나옴 결과 링크<br>참고로 공유 링크 복사 시 ChatGPT가 영어 프롬프트를 포르투갈어로 번역함

    • 문제점 인정함<br>하지만 본질적으로 이미지 생성은 GPT-4와도 동일한 모델(gpt-image-1)을 쓰기 때문에 똑같은 문제가 나타날 것임

  • “think harder”처럼 프롬프트에 직접 지시어를 추가해서 원하는 모델로 라우팅을 유도하는 게 일종의 꼼수라 생각함<br>모델 선택을 수동으로 하는 것도 불편했지만, 이런 프롬프트 꼼수는 더 말이 안 된다고 느낌

    • claude code는 키워드 “superthink”까지 넣어야 원하는 기능을 쓰는데 너무 불편함<br>단순히 버튼 하나면 될 일을 12번 타이핑해야 하는 UX가 불만임

    • AI 앱에는 기존과 다른 새로운 UX 원칙이 필요함<br>하루에도 여러 번 사용하는 AI 기능이라면 반드시 버튼 하나로 접근할 수 있어야 함

    • 경험적으로 “think harder”나 “check your work carefully” 같은 프롬프트로 더 나은 결과를 얻은 적이 많음

  • o3(과거 모델)은 속도, 품질, 가격 면에서 특이한 밸런스를 보여줬음<br>간단한 웹 검색 작업에는 매우 빠르고, o3 pro에서는 5배 더 느리면서 품질 차이도 크지 않았음<br>아직 GPT5의 사고 과정은 크게 인상적이지 않음<br>o3와 GPT5에게 동일 프롬프트로 비교 실험을 해볼 예정임<br>특히 짧은 프롬프트 처리 능력이 o3에 비해 뒤쳐진다는 인상이 강함<br>예: 복잡한 xml/json이 아니라 “best gpu for home LLM inference vs cloud api.” 같은 짧은 프레이즈 입력

    • 나 역시 비슷했음. 전체적으로 o3보다 항상 더 못하고 더 나은 적이 없음<br>다른 frontier 모델들(o3, Sonnet, Gemini Pro)에서는 적어도 요청이 완전히 오해되는 일은 없었는데, GPT-5는 명확한 요청에서도 완전히 오해하는 일이 있었음<br>예시는 소프트웨어 아키텍처 관련 질문이었는데, 분명 개발자 관점의 질문임에도 엔드 유저 입장에서 답변함<br>다른 모델들은 모두 제대로 이해했음

    • 채팅 구독 서비스 환경에서 reasoning(추론) effort가 “low” 혹은 “medium”, verbosity(답변 길이)도 “medium”으로 설정되어 있을 가능성이 있음

  • ChatGPT 4o, 5, 5 thinking 모델을 모두 연애 상담에 써본 경험이 흥미로움<br>20년 넘은 장기 연애에서 커뮤니케이션 문제로 힘들었음<br>ChatGPT로 서로의 패턴과 동적을 분석하는 데 도움을 받은 느낌임<br>동일 대화를 ChatGPT 5로 검토하면 요점만 딱딱 요약해줌<br>가장 변화가 컸던 건 5 thinking 모델 이용임<br>동적 분석이나 공감 메시지 없이, “1. 해결 의지가 있으면 경계하에 노력 / 2. 별거 혹은 공간 필요” 두 가지 옵션만 제시함<br>바로 선택하고 30일 플랜을 안내하는 방식임<br>정말 대화체 스타일이 사라지고 무엇을 할지 골라야만 팩트 위주 액션 플랜만 제안함<br>더는 “고생 많으셨겠어요”, “노력하고 계시는 게 보여요” 같은 공감 멘트가 없음<br>그래도 어느 정도 집중력 있고 실질적인 면에서는 틀리지 않은 느낌임

  • 나 역시 5 시리즈를 평가 중이고 4o는 계속 프로덕션에 두고 있음<br>5는 확실히 분위기가 다름<br>현재로서는 꽤 좋은 개선점이 있지만, 4에서 5로 테이블 매핑만으로 바로 대체/업그레이드할 수 있는 성격이 아님<br>프롬프트와 결과 유도법을 재조정해야 동일한 결과와 이점을 얻을 수 있다고 느낌