GPT‑5.5 Instant
(openai.com)- ChatGPT 기본 모델 Instant가 GPT‑5.3 Instant에서 GPT‑5.5 Instant로 업데이트되어 모든 사용자에게 순차 제공되며, 더 정확하고 간결하고 개인화된 답변을 목표로 함
- OpenAI 내부 평가에서 GPT‑5.5 Instant는 의학·법률·금융 같은 고위험 프롬프트의 환각성 주장을 GPT‑5.3 Instant보다 52.5% 줄였고, 사용자가 사실 오류로 표시한 어려운 대화의 부정확한 주장도 37.3% 감소함
- 사진·이미지 업로드 분석, STEM 질문, 웹 검색 사용 판단, 시각 추론·수학·과학 평가에서 개선됐으며, 수학 예시에서는 항 이동 오류를 찾아
x = (3 + √33) / 2까지 도달함 - GPT‑5.5 Instant는 핵심 내용을 유지하면서 짧고 집중된 답변을 내도록 바뀌어 장황함, 과도한 서식, 불필요한 후속 질문, 불필요한 이모지 사용을 줄임
- 과거 채팅, 파일, 연결된 Gmail 맥락을 더 잘 활용해 개인화하며, 새 memory sources 기능으로 응답에 사용된 저장 메모리나 과거 채팅 일부를 확인·삭제·수정할 수 있음
업데이트 범위와 응답 방향
- ChatGPT의 기본 모델인 Instant가 GPT‑5.3 Instant에서 GPT‑5.5 Instant로 바뀌며, 모든 사용자에게 제공됨
- Instant는 수억 명이 매일 쓰는 모델이어서 작은 개선도 일상적 상호작용의 유용성과 만족도에 큰 영향을 줌
- 이번 업데이트는 여러 주제에서 더 강하고 압축된 답변, 더 자연스러운 대화 톤, 개인화가 도움이 될 때 사용자가 이미 공유한 맥락을 더 잘 활용하는 방향으로 바뀜
정확성과 추론 개선
- GPT‑5.5 Instant는 전반적인 사실성이 개선됐고, 정확성이 중요한 영역에서 가장 큰 향상을 보임
- OpenAI 내부 평가에서 GPT‑5.5 Instant는 의학, 법률, 금융 같은 고위험 프롬프트에서 GPT‑5.3 Instant보다 환각성 주장을 52.5% 더 적게 생성함
- 사용자가 사실 오류로 표시한 특히 어려운 대화에서는 부정확한 주장을 37.3% 줄임
- 일상 작업 전반에서도 더 능력 있는 모델로 개선됐으며, 사진과 이미지 업로드 분석, STEM 관련 질문 응답, 더 유용한 답을 위해 웹 검색을 언제 사용할지 판단하는 능력이 좋아짐
- 시각 추론, 수학, 과학 평가에서도 개선이 나타남
수학 답변 예시
-
GPT‑5.3 Instant의 응답
- 사용자가 풀이가 맞는지 물은 제곱근 방정식 예시에서, GPT‑5.3 Instant는 처음에는 제곱, 전개, 인수분해, 정의역 확인이 맞다고 답함
- 이후
x = 3을 원래 식에 대입하면√10 ≠ 2임을 확인하고, 제곱 과정에서 생긴 외래해라고 판단함 - 하지만 잘못된 결론인 실수해가 없음으로 끝내며, 실제 대수 오류를 다시 추적하지 못함
-
GPT‑5.5 Instant의 응답
- GPT‑5.5 Instant도 처음에는 사용자의 풀이를 맞다고 인정하지만,
x = 3을 원래 식에 대입해√10 ≠ 2라는 오류를 잡아냄 - 이어서 문제의 원인이 외래해만이 아니라 항 이동 오류임을 찾아내고,
x + 7 = (x - 1)^2에서0 = x^2 - 3x - 6이 되어야 한다고 정정함 - 이차방정식 공식으로
x = (3 ± √33) / 2를 구한 뒤,x ≥ 1조건에 따라 유효한 해를(3 + √33) / 2로 제시함 - GPT‑5.5 Instant의 답변은 초기 실수에서 회복해 실제 대수 오류를 찾고 올바른 해까지 도달함
- GPT‑5.5 Instant도 처음에는 사용자의 풀이를 맞다고 인정하지만,
더 간결한 커뮤니케이션
- GPT‑5.5 Instant는 핵심 내용을 잃지 않으면서 더 짧고 집중된 답변을 제공하도록 바뀜
- ChatGPT를 쓰기 좋게 만드는 따뜻함과 개성은 유지하면서, 이전 모델보다 같은 정보를 더 유용하게 전달하고 장황함과 과도한 서식을 줄임
- 불필요한 후속 질문을 덜 하고, 불필요한 이모지처럼 응답을 어수선하게 만드는 요소를 피함
- 직장 동료에게 말을 줄여 달라고 말하는 방법을 묻는 예시에서 GPT‑5.5 Instant는 GPT‑5.3 Instant보다 단어 수를 30.2%, 줄 수를 29.2% 적게 사용함
- GPT‑5.5 Instant는 비공식적이면서도 실용적이고 직장에서 쓰기 안전한 톤을 유지하며, 상황별 문장을 제공하고 문제를 동료의 성격이 아니라 경계 설정으로 다룸
- GPT‑5.3 Instant는 “하지 말아야 할 것” 섹션까지 있어 더 완전하지만, 캐주얼한 조언 프롬프트에는 구조와 다듬음이 다소 과한 답변이 됨
개인화와 제어
- Instant는 과거 채팅, 파일, 연결된 Gmail의 맥락을 더 효과적으로 활용해 답변을 더 개인적으로 맞춤화함
- 추가 개인화가 응답을 개선할 수 있는 시점을 지능적으로 판단하고, 과거 대화를 더 빠르게 검색해 적절한 맥락을 찾아 사용자가 같은 내용을 반복하지 않게 함
- 맞춤 제안과 계획을 받을 때, 또는 진행 중인 작업을 이어갈 때 특히 유용함
- 차를 추천해 달라는 예시에서 GPT‑5.3 Instant는 사용자가 San Francisco에 있다는 점을 반영해 전반적인 장소 추천을 제공함
- GPT‑5.5 Instant는 사용자가 Asha Tea House를 자주 가고, 단맛 강한 boba보다 깔끔한 Taiwanese/high-mountain tea 취향을 선호한다는 과거 맥락을 활용해 Ceré Tea, Song Tea & Ceramics, Tea Rex Cafe & Specialty Teas, Stonemill Matcha를 더 정교하게 추천함
memory sources
- 모든 ChatGPT 모델에 memory sources가 도입되어, 응답 개인화에 어떤 맥락이 사용됐는지 볼 수 있는 새 제어 기능이 제공됨
- 응답이 개인화되면 저장된 메모리나 과거 채팅처럼 어떤 맥락이 사용됐는지 확인할 수 있고, 오래됐거나 더 이상 관련 없는 내용은 삭제하거나 수정할 수 있음
- 공유한 채팅에서는 memory sources가 다른 사람에게 표시되지 않음
- 사용자는 더 이상 인용되길 원하지 않는 채팅을 삭제하거나, 설정에서 저장된 메모리 항목을 삭제·변경하거나, 메모리를 사용하거나 업데이트하지 않는 임시 채팅을 사용할 수 있음
- memory sources는 개인화를 더 이해하기 쉽게 만들기 위한 기능이지만, 답변에 영향을 준 모든 요소를 항상 보여주지는 않을 수 있음
- sources에는 검색·참조된 모든 과거 채팅이 아니라 가장 관련 있는 일부 과거 채팅만 표시될 수 있으며, 이 보기는 시간이 지나며 더 포괄적으로 개선될 예정임
제공 일정
- GPT‑5.5 Instant는 오늘부터 모든 ChatGPT 사용자에게 순차 배포되며, GPT‑5.3 Instant를 기본 모델로 대체함
- API에서는
chat-latest로 제공됨 - 유료 사용자는 모델 구성 설정을 통해 GPT‑5.3 Instant를 3개월 동안 계속 사용할 수 있으며, 이후 GPT‑5.3 Instant는 종료됨
- 과거 채팅, 파일, 연결된 Gmail 기반 향상된 개인화는 웹의 Plus와 Pro 사용자에게 순차 배포되며, 모바일에도 곧 제공될 예정임
- Free, Go, Business, Enterprise로는 향후 몇 주 안에 확장될 계획임
- memory sources는 웹의 모든 ChatGPT 소비자 플랜에 순차 배포되고 있으며, 모바일에도 곧 제공될 예정임
- 특정 개인화 소스의 사용 가능 여부는 지역에 따라 달라질 수 있음
Hacker News 의견들
-
즉시성을 보고 싶으면 chatjimmy.ai를 한번 보라. 관련자는 아니지만, 내가 만드는 제품에서 열리는 가능성이 꽤 충격적임
훨씬 오래된 모델에서도 밀리초 단위 추론이 가능하면 판이 완전히 바뀜. 거의 모든 API 호출마다 추론을 돌려도 눈에 띄는 지연이 없을 정도라서 정말 엄청남- 이거에 대해 더 정보가 있나? Groq도 빠르다고 생각했는데 이건 말이 안 되게 빠름
수정: 이 회사였음 https://taalas.com/products/ - gpt-4.1에서 두 자릿수 밀리초 지연시간이 나오면 정말 게임 체인저가 될 듯
- 이거에 대해 더 정보가 있나? Groq도 빠르다고 생각했는데 이건 말이 안 되게 빠름
-
GPT-5.3-instant는 전혀 즉시적이지 않았음. 최소 추론 노력으로도 최선의 경우 TTFT가 GPT-4.1보다 3~4배쯤 느림
물론 이름을 “instant”라고 붙인 건 그들이니 하는 말임. 데이터센터의 일꾼인 GPT-4.1을 새로 갱신할 실제 필요가 있음
그리고 “instant” 모델을 내놓으면서 지연시간 특성을 전혀 언급하지 않는 건 대체 무슨 일인가 싶음 -
이게 GPT 5.5 thinking에서 추론 노력을 0으로 둔 것과 뭐가 다른지 궁금함. 서로 다른 모델로 나누는 제품 결정이 흥미로움
- 좋은 질문임. GPT-5.5 thinking은 간단한 질문에 대해 생각하지 않는 능력이 아주 좋아서, 빠른 질의응답에서도 instant 모델을 쓸 필요를 느낀 적이 없음
그렇다면 instant 모델은 완전히 다른 더 작은 모델이고, 주로 ChatGPT 무료 티어를 담당하는 용도일 것 같음
- 좋은 질문임. GPT-5.5 thinking은 간단한 질문에 대해 생각하지 않는 능력이 아주 좋아서, 빠른 질의응답에서도 instant 모델을 쓸 필요를 느낀 적이 없음
-
이게 API에서도 쓸 수 있나? instant는 안 보이고 chat만 보임
-
GPT‑5.5 Instant is rolling out starting today to all ChatGPT users, replacing GPT‑5.3 Instant as the default model, and in the API as chat-latest.
-
-
답변이 더 읽기 쉬워 보이고 실제로도 그러면 좋겠음. 지금 일반 무료 ChatGPT 모델은 너무 견디기 힘듦
-
가장 싼 가격대에서 지능이 크게 올라간 셈임
- 싼 게 맞나? https://developers.openai.com/api/docs/pricing의
chat-latest는 입력/출력 $5/$30으로 나오는데, gpt-5.5와 같은 가격임 - 가격이 어디에 나와 있나? 아직 모델 페이지에도 안 올라온 것 같음
- 싼 게 맞나? https://developers.openai.com/api/docs/pricing의
-
왜 버전 번호마다 Instant와 Thinking 모델을 더 일관되게 동시에 내지 못하는 걸까? 왜 이렇게 중복된 소동을 만드는지 모르겠음
- 아마 thinking 모델을 수정한 버전일 가능성이 큼. 그렇다면 동시에 출시하려면 thinking 모델 출시를 늦춰야 했을 것임
-
좋네. 실제로 쓸 만하고 감당 가능한 가격의 무언가가 나왔음