# OpenAI, 텍스트, 오디오, 이미지 기능을 갖춘 멀티모달 AI 모델 GPT-4o 공개

> Clean Markdown view of GeekNews topic #14799. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=14799](https://news.hada.io/topic?id=14799)
- GeekNews Markdown: [https://news.hada.io/topic/14799.md](https://news.hada.io/topic/14799.md)
- Type: news
- Author: [brainer](https://news.hada.io/@brainer)
- Published: 2024-05-14T02:52:00+09:00
- Updated: 2024-05-14T02:52:00+09:00
- Original source: [openai.com](https://openai.com/index/hello-gpt-4o/)
- Points: 11
- Comments: 5

## Topic Body

• 텍스트, 오디오, 이미지를 동시에 처리하고 생성할 수 있는 획기적인 AI 모델  
• 인간 대화에 버금가는 실시간 응답 시간으로 GPT-4o는 자연스러운 인간-컴퓨터 상호 작용에 대한 새로운 표준을 설정  
• API에서 더 빠르고 비용 효율적이면서도 텍스트와 코드, 특히 비영어 언어에서 GPT-4 터보의 성능을 능가  
• GPT-4o의 멀티모달 기능을 통해 오디오 입력을 이해하고 응답하며 오디오 출력을 생성하고 실시간 대화에 참여할 수 있음  
• 이 모델은 향상된 추론, 다국어 숙련도, 오디오 및 시각 이해, 시각 인식을 보여줌  
• OpenAI는 잠재적 위험을 완화하기 위해 GPT-4o의 설계 및 사후 훈련에서 구현된 안전 조치를 강조  
• 초기 릴리스에는 텍스트 및 이미지 입력 및 텍스트 출력이 포함되며 오디오 및 비디오 기능은 향후 API의 신뢰할 수 있는 파트너가 사용 가능

## Comments



### Comment 25239

- Author: bluejoyq
- Created: 2024-05-14T11:40:05+09:00
- Points: 1

속도가 정말 빨라진게 체감이 됍니다

### Comment 25240

- Author: brainer
- Created: 2024-05-14T12:31:51+09:00
- Points: 1
- Parent comment: 25239
- Depth: 1

한국어로 질문한다면,  
  
모델 자체의 성능2배 * 1.7(한글 토큰 개선) = 3.4배 빨라졌어요

### Comment 25233

- Author: xguru
- Created: 2024-05-14T10:59:23+09:00
- Points: 1

4O의 O는 Omni 를 의미합니다.

### Comment 25225

- Author: corelyai
- Created: 2024-05-14T10:28:02+09:00
- Points: 1

##### ChatGPT의 최신 업데이트: GPT-4o 모델 및 향상된 사용자 접근성  
ChatGPT는 누구나 무료로 고급 AI 도구를 이용할 수 있도록 하는 데 중점을 두고 있습니다. 데스크톱 버전과 새로운 플래그십 모델인 GPT-4o의 출시는 사용자의 자연스러움과 사용 편의성을 개선하는 것을 목표로 합니다. GPT-4o는 텍스트, 시각, 오디오 전반에 걸쳐 더욱 빠르고 향상된 기능을 제공하여 인간과 기계의 협업에 있어 중요한 진전을 이룰 것입니다.  
  
##### GPT-4o를 통한 ChatGPT의 확장  
이제 모든 사용자에게 음성, 텍스트, 시각 추론 기능을 제공하는 GPT-4o를 제공합니다. 새로운 기능에는 실시간 대화 음성, 메모리, 실시간 정보 검색, 고급 데이터 분석이 포함됩니다. GPT-4o는 50개 언어로 제공되며, 품질과 속도가 개선되고 유료 사용자의 경우 용량 제한이 더 높아질 예정입니다.  
  
##### ChatGPT의 새로운 실시간 및 반응형 기능  
ChatGPT의 새로운 기능은 실시간 반응성과 사용자의 감정을 파악할 수 있는 기능을 제공합니다. 이 모델은 드라마틱한 목소리, 로봇 목소리, 노래하는 목소리 등 다양한 스타일의 음성을 생성할 수 있습니다. 또한 ChatGPT는 이제 시각적 작업을 지원하고 라이브 데모 환경에서 사용자와 상호 작용할 수 있습니다.  
  
##### 선형 방정식 풀기: 단계별  
Barrett Zoph와 ChatGPT는 3X + 1 = 4라는 방정식을 풀면서 먼저 X항을 분리한 다음 X를 구한 다음 비용, 여행 계획, 비즈니스 계산 등 일상 생활에서 선형 방정식의 실제 적용에 대해 논의합니다. 이를 통해 수학을 이해하고 실제 문제에 사용하는 데 새로운 자신감을 얻게 됩니다.  
  
##### ChatGPT로 날씨 데이터 분석하기  
ChatGPT는 코드 기능을 설명하고 플롯 출력을 해석하여 날씨 데이터를 분석하는 데 도움을 줍니다. 'Fu' 기능은 온도 데이터를 평활화하고 플롯의 노이즈를 줄이는 데 필수적입니다. 이 플롯은 2018년 내내 부드러운 평균, 최저, 최고 기온을 표시하며, 9월 말에 발생한 큰 강우 이벤트에 대한 주목할 만한 주석도 함께 표시합니다.  
  
##### 다국어 상호 작용 및 AI 기술  
AI 기술은 라이브 데모를 통해 다국어 상호 작용과 감정 해석 기능을 선보입니다. 이 데모는 가까운 미래에 사용자들이 이 기술을 더 쉽게 이용할 수 있도록 하겠다는 목표를 강조합니다. 또한 이 프레젠테이션에서는 기술 발전에 기여한 팀과 그들의 공로를 인정합니다.   
  
 코얼리, 유튜브 속 핵심 내용을 10초 만에! - https://corely.ai/content/openai-spring-update-2022

### Comment 25206

- Author: xguru
- Created: 2024-05-14T08:16:58+09:00
- Points: 1

[Introducing GPT-4o](https://www.youtube.com/live/DQacCB9tDaw?si=3cRVLKV1UeZgacqH&t=580)  
  
소개 영상의 실시간 대화 데모 부분이 충격적이네요. 9분:45초 쯤부터(위 링크는 거기부터 해두었습니다)  
이제 답변 중간에 쉽게 인터럽트 가능하고, 거의 실시간 답변도 하며 억양도 풍부해졌습니다.
