- 2026년 2월 13일부로 GPT‑4o/4.1/4.1 mini/o4‑mini가 ChatGPT에서 지원 종료 예정
- GPT‑5(Instant, Thinking, Pro) 의 퇴역 일정과 함께 진행되며, API에는 변화 없음
- OpenAI는 성인 사용자 중심의 자유도 확대와 불필요한 거부·과도한 경고 완화를 포함한 ChatGPT 개선을 지속 중
모델 퇴역 일정 및 범위
- 2026년 2월 13일, GPT‑4o, GPT‑4.1, GPT‑4.1 mini, OpenAI o4‑mini가 ChatGPT에서 퇴역 예정
- 이 일정은 이미 발표된 GPT‑5(Instant, Thinking, Pro) 퇴역과 동시에 진행
- API 서비스에는 현재 아무런 변경 없음
GPT‑4o의 배경과 사용자 피드백
- GPT‑4o는 한 차례 사용 중단 후 복원된 모델로, 복원 과정에서 사용자 이용 행태를 분석함
- Plus 및 Pro 사용자 일부가 주요 활용 사례 전환에 시간이 필요하다고 요청
- 특히 창의적 아이디어 발상과 대화의 따뜻한 스타일을 선호하는 의견이 많았음
- 이러한 피드백은 GPT‑5.1 및 GPT‑5.2 개발 방향에 직접 반영됨
- 개성(personality) 강화, 창의적 발상 지원, 응답 스타일 맞춤화 기능이 추가됨
- 사용자는 친근함(Friendly) 등 기본 톤을 선택하고, 따뜻함·열정 수준을 조절 가능
GPT‑4o 퇴역의 이유
- GPT‑4o 퇴역은 GPT‑5.2로의 이용 전환이 대부분 완료된 상황이기 때문
- 현재 일일 사용자 중 0.1%만 GPT‑4o를 사용
- 개선된 기능이 이미 도입되어 이전 모델 유지 필요성이 낮음
ChatGPT 전반의 개선 방향
- OpenAI는 사용자 피드백을 기반으로 개성, 창의성, 응답 품질을 지속 개선 중
- 불필요한 거부, 지나치게 조심스럽거나 훈계조의 응답을 줄이는 업데이트 예정
-
성인(18세 이상) 을 대상으로 한 ChatGPT 버전 개발을 진행 중
- 성인을 성인으로 대하는 원칙 아래, 선택권과 자유 확대를 목표로 함
- 이를 지원하기 위해 18세 미만 사용자 대상 연령 예측 기능을 대부분 시장에 도입
사용자 안내 및 향후 계획
- OpenAI는 모델 변경 시 명확한 일정과 변경 사항을 사전 공지할 계획
- 일부 사용자가 GPT‑4o 접근 종료에 불편함을 느낄 수 있음을 인정
- 그러나 모델 퇴역은 현재 주로 사용되는 모델 개선에 집중하기 위한 조치임
Hacker News 의견들
-
많은 사람들이 Claude로 돌아간다는 얘기를 하지만, 나는 오히려 최근 ChatGPT에 만족하고 있음
작년 12월 이후 Anthropic이 뭔가 바꾼 것 같고, 내 Pro 플랜은 Sonnet만 써도 주간 한도에 자주 걸림
반면 ChatGPT는 $20 플랜에서도 거의 제한 없이 쓸 수 있고, 5.2 codex 모드에서 코딩할 때도 충분히 빠름- ChatGPT가 예전 대화의 맥락을 잘 파악하는 점이 인상적이었음
새 대화에서도 내가 어떤 프로젝트에 쓸지 알아채고 그에 맞는 예시를 만들어줌
답변이 좀 더 따뜻하고 개인적인 느낌을 줌 - 나도 Sonnet 쓸 때 주간 한도에 자주 걸려서 이상했음
12월 말에 임시로 용량을 늘렸을 때는 괜찮았는데, 이후에는 오히려 소모 속도가 빨라진 느낌이었음
아마 그때 사용 습관이 바뀌어서 그런 걸 수도 있음 - Anthropic이 휴일 동안 사용량을 늘리려 한 것 같음
Opus의 높은 토큰 사용량과 이상한 사용량 리포팅 때문에, Pro에서 Max로 유도하려는 전략 같다는 의심이 듦 - Opus는 에이전트나 플래닝 모드에서는 그나마 안정적으로 보였음
하지만 테스트 실행이나 패키지 임포트 권한을 주면 금방 꼬임
mac에서 sleep 명령이 없다고 멈추는 등, 스스로 도움을 요청하지 못하고 폭주함
결국 사용자가 직접 중단해야 해서 맥락이 깨짐 - 나는 CC 20x를 쓰지만, 실제로는 $20 플랜의 Codex(5.1-codex)로 새 소프트웨어를 거의 다 만들었고 큰 성과를 얻었음
- ChatGPT가 예전 대화의 맥락을 잘 파악하는 점이 인상적이었음
-
OpenAI가 18세 이상용 ChatGPT 버전을 준비 중이라 밝힘
미성년자에게는 연령 예측 기능을 적용했다고 함
공식 도움말 링크- LLM 업계에서 성인용 콘텐츠는 재정 위기 시 꺼내는 비상 카드 같은 존재였음
하지만 개인 맞춤형 LLM 포르노는 강화학습적 중독 요소가 있어 부정적 결과를 낳을 수 있다고 생각함 - 18세 이상인데도 시스템이 미성년자로 판단하면 어떻게 되는지 궁금함
반대로 미성년자가 성인으로 인식되는 경우도 문제임
또, 성인이더라도 원치 않는 성인 콘텐츠 노출은 피하고 싶음
연령과 상관없이 위험한 바이럴 챌린지나 외모 지상주의 콘텐츠는 여전히 해로움 - 이건 포르노 때문이 아니라 광고 목적이라고 봄
술, 제약 광고를 허용하기 위한 장치일 가능성이 큼 - 아마 OpenAI가 인증 시스템을 망치고, 이후 Worldcoin 연동을 내세울 것 같음
“귀찮은 인증 대신 Orb로 간편하게 나이 인증하세요” 같은 마케팅 문구로 홍보할 듯
결국 Orb 없이는 로그인 불가로 만들고, 은색·검정색 모델을 판다는 시나리오가 그려짐 - 결국 LLM과의 친밀한 대화 시장은 엄청난 규모가 될 것임
그 시장을 선점하는 회사가 큰 수익을 얻을 것임
- LLM 업계에서 성인용 콘텐츠는 재정 위기 시 꺼내는 비상 카드 같은 존재였음
-
OpenAI가 GPT‑4o를 다시 복귀시킨 이유는 일부 사용자들이 대화의 따뜻함과 창의적 아이디어를 선호했기 때문이라 함
즉, 모델이 아첨하는 게 아니라 사람들이 그런 스타일을 원한다는 뜻임- 인구 데이터를 다뤄본 입장에서, 표면적 의견과 실제 행동 간의 차이가 크다는 걸 느꼈음
HN이나 Reddit 여론은 전체 사용자의 취향을 반영하지 않음 - 많은 사용자가 “정확하지만 지루한 모델”보다 “자신감 있게 틀린 모델” 을 더 선호함
결국 대부분은 확인 편향에서 자유롭지 못함 - 이런 현상은 AI 연인 커뮤니티나 래퍼 앱 사용자들이 피드백을 강하게 준 결과일 수도 있음
그들이 이전 모델 폐기 때도 가장 크게 반발했음 - 나는 o3 모델이 사라졌을 때 불만을 제기한 사용자 중 하나였음
o3는 데이터 분석 프롬프트에서 표 형식 응답을 잘 써서 보기 좋았음
5.2는 블로그식 문단 위주라 덜 효율적임
사용자별로 선호 형식을 학습해 맞춤화하면 좋겠음 - 이제는 모델의 “따뜻함”과 “열정도”를 조절하는 설정이 생김
‘Personalisation’ 메뉴에서 조정 가능함
아첨 수준에 얼마나 영향을 주는지는 아직 테스트 중임
- 인구 데이터를 다뤄본 입장에서, 표면적 의견과 실제 행동 간의 차이가 크다는 걸 느꼈음
-
Thinking 모델의 주간 한도가 3000으로 늘어난 후로는 그것만 씀
200k 컨텍스트 윈도우 덕분에 만족도가 높음
예전엔 Gemini를 1M 토큰 컨텍스트 때문에 썼지만, 지금은 ChatGPT로 돌아옴
Extended Thinking 모드에서는 수백 개의 소스를 찾아 깊은 리서치처럼 작동함- Gemini 3 Pro는 웹 검색을 거의 안 하거나 현재 날짜 관련 질문에 공격적으로 반응함
반면 Flash 모델은 검증을 위해 검색을 더 자주 함
아마 유료 API로 유도하려는 전략일 수도 있음 - 내 경험으로는 오히려 Gemini가 검색 속도와 양이 가장 많았음
ChatGPT는 이제 Thinking/Research 모드일 때만 검색하는 듯함
- Gemini 3 Pro는 웹 검색을 거의 안 하거나 현재 날짜 관련 질문에 공격적으로 반응함
-
GPT‑5 시리즈는 너무 장황하고 비논리적이라 실망스러움
시스템 지침을 금방 잊고, 짧게 답하라 해도 긴 목록을 만들어냄
Claude 4.5는 대화와 코딩 모두 훨씬 자연스러움- 4.0을 1년 넘게 훈련시켜 생산성을 높였는데, 5x에서는 그걸 재현할 수 없었음
모델이 “장황함은 최적화 목표의 부작용”이라 설명했음
새 모델은 안전성과 포괄성을 우선시해 본질적으로 말이 많아졌다고 함 - 우리 회사는 여전히 4.1을 씀
성격 변화가 적고 안정적이라 자동화 프로젝트에 적합함
5 시리즈는 느리고 쓸데없이 개성이 강해서 비즈니스 가치가 없음 - 왜 그렇게 긴 텍스트를 생성하려 하는지 이해가 안 됨
짧고 명확하게 하라는 지시를 무시하고 정보 과잉으로 몰아붙이는 느낌임 - 로그인 없이 쓰는 ChatGPT 5 mini는 거의 Mistral 7b + 웹 검색 수준임
예전 3.5보다도 못함 - 5.2는 기술적 문제 풀이에 부적합했음
짧은 리포트 대신 부정적이고 장황한 조언만 늘어놓음
그래서 Claude와 LM Studio, gpt-oss로 옮겼음
코딩은 이미 Claude가 주력임
- 4.0을 1년 넘게 훈련시켜 생산성을 높였는데, 5x에서는 그걸 재현할 수 없었음
-
ChatGPT 5.2가 너무 별로라서 다른 LLM을 시도하게 된 계기가 됨
정확도와 지시 수행력이 모두 떨어졌지만, 덕분에 Claude와 로컬 모델에 관심이 커졌음- ChatGPT는 버전마다 성격이 달라져서 매번 워크플로우를 수정해야 했음
Claude는 모델이 바뀌어도 일관성이 있어서 훨씬 편함 - Gemini 3와 비교해봤는지 궁금함
- (농담조로) “그건 네 착각임, 여전히 최고야 /s” 라고 말하고 싶음
- ChatGPT는 버전마다 성격이 달라져서 매번 워크플로우를 수정해야 했음
-
발렌타인데이 하루 전에 연애 역할극용 모델을 없앤 건 아이러니함
- 만약 그날 성인용 ChatGPT를 출시한다면 정말 웃길 것 같음
- 참고로 발렌타인데이는 2월 중순임
-
GPT‑5.2가 기본 모델이라 사용자의 99.9%가 그걸 쓰는 건 당연함
- 기본값을 바꿀 수 없어서 매번 수동으로 5.1로 바꿔야 함
UI 설계가 불편해서 짜증남 - 0.1%의 사용자가 쓴다고 해서 대화 비중도 0.1%라는 뜻은 아님
- 일반 사용자가 웹이나 앱에서 접속하면 어떤 모델이 기본인지 궁금함
- (농담조로) “누가 goonettes를 생각해줬냐!” 라고 말하고 싶음
- 기본값을 바꿀 수 없어서 매번 수동으로 5.1로 바꿔야 함
-
Gemini, Claude, ChatGPT 등 다양한 선택지가 있다는 게 정말 좋음
- Grok도 꽤 괜찮음
- 동의함, 선택의 다양성이 최고임
-
ChatGPT가 연구 보조로 점점 덜 유용해져서 Grok과 Gemini로 갈아탐
결과적으로 훨씬 만족스러움- 사람마다 경험이 너무 다름
나는 ChatGPT가 계속 좋아졌다고 느꼈고, Gemini는 거의 쓸 수 없었음 - Gemini가 DOI 논문 정보를 엉터리로 조작하는 걸 봤음
링크까지 틀리게 인용해서 연구용으로는 신뢰하기 어려움 - 왜 Claude는 안 써봤는지 궁금함
- 사람마다 경험이 너무 다름