# GPT‑5.5 Instant

> Clean Markdown view of GeekNews topic #29241. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=29241](https://news.hada.io/topic?id=29241)
- GeekNews Markdown: [https://news.hada.io/topic/29241.md](https://news.hada.io/topic/29241.md)
- Type: GN+
- Author: [xguru](https://news.hada.io/@xguru)
- Published: 2026-05-07T07:06:38+09:00
- Updated: 2026-05-07T07:06:38+09:00
- Original source: [openai.com](https://openai.com/index/gpt-5-5-instant/)
- Points: 1
- Comments: 1

## Topic Body

- ChatGPT 기본 모델 **Instant**가 GPT‑5.3 Instant에서 **GPT‑5.5 Instant**로 업데이트되어 모든 사용자에게 순차 제공되며, 더 정확하고 간결하고 개인화된 답변을 목표로 함
- OpenAI 내부 평가에서 GPT‑5.5 Instant는 의학·법률·금융 같은 고위험 프롬프트의 **환각성 주장**을 GPT‑5.3 Instant보다 52.5% 줄였고, 사용자가 사실 오류로 표시한 어려운 대화의 부정확한 주장도 37.3% 감소함
- 사진·이미지 업로드 분석, STEM 질문, 웹 검색 사용 판단, 시각 추론·수학·과학 평가에서 개선됐으며, 수학 예시에서는 항 이동 오류를 찾아 `x = (3 + √33) / 2`까지 도달함
- GPT‑5.5 Instant는 핵심 내용을 유지하면서 **짧고 집중된 답변**을 내도록 바뀌어 장황함, 과도한 서식, 불필요한 후속 질문, 불필요한 이모지 사용을 줄임
- 과거 채팅, 파일, 연결된 **Gmail** 맥락을 더 잘 활용해 개인화하며, 새 **memory sources** 기능으로 응답에 사용된 저장 메모리나 과거 채팅 일부를 확인·삭제·수정할 수 있음

---

### 업데이트 범위와 응답 방향
- ChatGPT의 기본 모델인 **Instant**가 GPT‑5.3 Instant에서 GPT‑5.5 Instant로 바뀌며, 모든 사용자에게 제공됨
- Instant는 수억 명이 매일 쓰는 모델이어서 작은 개선도 일상적 상호작용의 유용성과 만족도에 큰 영향을 줌
- 이번 업데이트는 여러 주제에서 더 강하고 압축된 답변, 더 자연스러운 대화 톤, 개인화가 도움이 될 때 사용자가 이미 공유한 맥락을 더 잘 활용하는 방향으로 바뀜

### 정확성과 추론 개선
- GPT‑5.5 Instant는 전반적인 사실성이 개선됐고, 정확성이 중요한 영역에서 가장 큰 향상을 보임
- **OpenAI 내부 평가**에서 GPT‑5.5 Instant는 의학, 법률, 금융 같은 고위험 프롬프트에서 GPT‑5.3 Instant보다 환각성 주장을 52.5% 더 적게 생성함
- 사용자가 사실 오류로 표시한 특히 어려운 대화에서는 부정확한 주장을 37.3% 줄임
- 일상 작업 전반에서도 더 능력 있는 모델로 개선됐으며, 사진과 이미지 업로드 분석, STEM 관련 질문 응답, 더 유용한 답을 위해 웹 검색을 언제 사용할지 판단하는 능력이 좋아짐
- 시각 추론, 수학, 과학 평가에서도 개선이 나타남

### 수학 답변 예시
- ## GPT‑5.3 Instant의 응답
  - 사용자가 풀이가 맞는지 물은 제곱근 방정식 예시에서, GPT‑5.3 Instant는 처음에는 제곱, 전개, 인수분해, 정의역 확인이 맞다고 답함
  - 이후 `x = 3`을 원래 식에 대입하면 `√10 ≠ 2`임을 확인하고, 제곱 과정에서 생긴 외래해라고 판단함
  - 하지만 잘못된 결론인 **실수해가 없음**으로 끝내며, 실제 대수 오류를 다시 추적하지 못함
- ## GPT‑5.5 Instant의 응답
  - GPT‑5.5 Instant도 처음에는 사용자의 풀이를 맞다고 인정하지만, `x = 3`을 원래 식에 대입해 `√10 ≠ 2`라는 오류를 잡아냄
  - 이어서 문제의 원인이 외래해만이 아니라 항 이동 오류임을 찾아내고, `x + 7 = (x - 1)^2`에서 `0 = x^2 - 3x - 6`이 되어야 한다고 정정함
  - 이차방정식 공식으로 `x = (3 ± √33) / 2`를 구한 뒤, `x ≥ 1` 조건에 따라 유효한 해를 `(3 + √33) / 2`로 제시함
  - GPT‑5.5 Instant의 답변은 초기 실수에서 회복해 실제 대수 오류를 찾고 올바른 해까지 도달함

### 더 간결한 커뮤니케이션
- GPT‑5.5 Instant는 핵심 내용을 잃지 않으면서 더 **짧고 집중된 답변**을 제공하도록 바뀜
- ChatGPT를 쓰기 좋게 만드는 따뜻함과 개성은 유지하면서, 이전 모델보다 같은 정보를 더 유용하게 전달하고 장황함과 과도한 서식을 줄임
- 불필요한 후속 질문을 덜 하고, 불필요한 이모지처럼 응답을 어수선하게 만드는 요소를 피함
- 직장 동료에게 말을 줄여 달라고 말하는 방법을 묻는 예시에서 GPT‑5.5 Instant는 GPT‑5.3 Instant보다 단어 수를 30.2%, 줄 수를 29.2% 적게 사용함
- GPT‑5.5 Instant는 비공식적이면서도 실용적이고 직장에서 쓰기 안전한 톤을 유지하며, 상황별 문장을 제공하고 문제를 동료의 성격이 아니라 경계 설정으로 다룸
- GPT‑5.3 Instant는 “하지 말아야 할 것” 섹션까지 있어 더 완전하지만, 캐주얼한 조언 프롬프트에는 구조와 다듬음이 다소 과한 답변이 됨

### 개인화와 제어
- Instant는 과거 채팅, 파일, 연결된 **Gmail**의 맥락을 더 효과적으로 활용해 답변을 더 개인적으로 맞춤화함
- 추가 개인화가 응답을 개선할 수 있는 시점을 지능적으로 판단하고, 과거 대화를 더 빠르게 검색해 적절한 맥락을 찾아 사용자가 같은 내용을 반복하지 않게 함
- 맞춤 제안과 계획을 받을 때, 또는 진행 중인 작업을 이어갈 때 특히 유용함
- 차를 추천해 달라는 예시에서 GPT‑5.3 Instant는 사용자가 San Francisco에 있다는 점을 반영해 전반적인 장소 추천을 제공함
- GPT‑5.5 Instant는 사용자가 Asha Tea House를 자주 가고, 단맛 강한 boba보다 깔끔한 Taiwanese/high-mountain tea 취향을 선호한다는 과거 맥락을 활용해 Ceré Tea, Song Tea & Ceramics, Tea Rex Cafe & Specialty Teas, Stonemill Matcha를 더 정교하게 추천함

### memory sources
- 모든 ChatGPT 모델에 **memory sources**가 도입되어, 응답 개인화에 어떤 맥락이 사용됐는지 볼 수 있는 새 제어 기능이 제공됨
- 응답이 개인화되면 저장된 메모리나 과거 채팅처럼 어떤 맥락이 사용됐는지 확인할 수 있고, 오래됐거나 더 이상 관련 없는 내용은 삭제하거나 수정할 수 있음
- 공유한 채팅에서는 memory sources가 다른 사람에게 표시되지 않음
- 사용자는 더 이상 인용되길 원하지 않는 채팅을 삭제하거나, 설정에서 저장된 메모리 항목을 삭제·변경하거나, 메모리를 사용하거나 업데이트하지 않는 임시 채팅을 사용할 수 있음
- memory sources는 개인화를 더 이해하기 쉽게 만들기 위한 기능이지만, 답변에 영향을 준 모든 요소를 항상 보여주지는 않을 수 있음
- sources에는 검색·참조된 모든 과거 채팅이 아니라 가장 관련 있는 일부 과거 채팅만 표시될 수 있으며, 이 보기는 시간이 지나며 더 포괄적으로 개선될 예정임

### 제공 일정
- **GPT‑5.5 Instant**는 오늘부터 모든 ChatGPT 사용자에게 순차 배포되며, GPT‑5.3 Instant를 기본 모델로 대체함
- API에서는 `chat-latest`로 제공됨
- 유료 사용자는 모델 구성 설정을 통해 GPT‑5.3 Instant를 3개월 동안 계속 사용할 수 있으며, 이후 GPT‑5.3 Instant는 종료됨
- 과거 채팅, 파일, 연결된 Gmail 기반 향상된 개인화는 웹의 Plus와 Pro 사용자에게 순차 배포되며, 모바일에도 곧 제공될 예정임
- Free, Go, Business, Enterprise로는 향후 몇 주 안에 확장될 계획임
- memory sources는 웹의 모든 ChatGPT 소비자 플랜에 순차 배포되고 있으며, 모바일에도 곧 제공될 예정임
- 특정 개인화 소스의 사용 가능 여부는 지역에 따라 달라질 수 있음

## Comments


### Comment 56978

- Author: neo
- Created: 2026-05-07T07:06:39+09:00
- Points: 1

###### [Hacker News 의견들](https://news.ycombinator.com/item?id=48025274) 
- 즉시성을 보고 싶으면 chatjimmy.ai를 한번 보라. 관련자는 아니지만, 내가 만드는 제품에서 열리는 가능성이 꽤 충격적임  
  훨씬 오래된 모델에서도 **밀리초 단위 추론**이 가능하면 판이 완전히 바뀜. 거의 모든 API 호출마다 추론을 돌려도 눈에 띄는 지연이 없을 정도라서 정말 엄청남
  - 이거에 대해 더 정보가 있나? **Groq**도 빠르다고 생각했는데 이건 말이 안 되게 빠름  
    수정: 이 회사였음 [https://taalas.com/products/](<https://taalas.com/products/>)
  - **gpt-4.1**에서 두 자릿수 밀리초 지연시간이 나오면 정말 게임 체인저가 될 듯

- **GPT-5.3-instant**는 전혀 즉시적이지 않았음. 최소 추론 노력으로도 최선의 경우 TTFT가 GPT-4.1보다 3~4배쯤 느림  
  물론 이름을 “instant”라고 붙인 건 그들이니 하는 말임. 데이터센터의 일꾼인 GPT-4.1을 새로 갱신할 실제 필요가 있음  
  그리고 “instant” 모델을 내놓으면서 **지연시간 특성**을 전혀 언급하지 않는 건 대체 무슨 일인가 싶음

- 이게 **GPT 5.5 thinking**에서 추론 노력을 0으로 둔 것과 뭐가 다른지 궁금함. 서로 다른 모델로 나누는 제품 결정이 흥미로움
  - 좋은 질문임. GPT-5.5 thinking은 간단한 질문에 대해 생각하지 않는 능력이 아주 좋아서, 빠른 질의응답에서도 instant 모델을 쓸 필요를 느낀 적이 없음  
    그렇다면 instant 모델은 완전히 다른 더 작은 모델이고, 주로 ChatGPT 무료 티어를 담당하는 용도일 것 같음

- 이게 **API**에서도 쓸 수 있나? instant는 안 보이고 chat만 보임
  - > GPT‑5.5 Instant is rolling out starting today to all ChatGPT users, replacing GPT‑5.3 Instant as the default model, and in the API as chat-latest.

- 답변이 더 읽기 쉬워 보이고 실제로도 그러면 좋겠음. 지금 일반 무료 **ChatGPT 모델**은 너무 견디기 힘듦

- 가장 싼 가격대에서 **지능이 크게 올라간** 셈임
  - 싼 게 맞나? [https://developers.openai.com/api/docs/pricing](<https://developers.openai.com/api/docs/pricing>)의 `chat-latest`는 입력/출력 **$5/$30**으로 나오는데, gpt-5.5와 같은 가격임
  - 가격이 어디에 나와 있나? 아직 모델 페이지에도 안 올라온 것 같음

- 왜 버전 번호마다 **Instant와 Thinking 모델**을 더 일관되게 동시에 내지 못하는 걸까? 왜 이렇게 중복된 소동을 만드는지 모르겠음
  - 아마 thinking 모델을 수정한 버전일 가능성이 큼. 그렇다면 동시에 출시하려면 thinking 모델 출시를 늦춰야 했을 것임

- 좋네. 실제로 쓸 만하고 **감당 가능한 가격**의 무언가가 나왔음