12P by xguru 2달전 | favorite | 댓글 1개
  • GPT-4o mini는 인공지능을 훨씬 더 저렴하게 만들어 AI로 구축된 애플리케이션 범위를 크게 확장할 것으로 기대
  • MMLU에서 82%의 점수를 받았으며 현재 LMSYS 리더보드의 채팅 선호도에서 GPT-4를 능가함
  • 가격은 입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트로 이전 최첨단 모델보다 10배 저렴하고 GPT-3.5 Turbo보다 60% 이상 저렴함

GPT-4o mini의 주요 기능

  • 낮은 비용과 지연 시간으로 광범위한 작업을 수행할 수 있음
  • 여러 모델 호출을 연결하거나 병렬화하는 애플리케이션(예: 여러 API 호출)에 적합함
  • 모델에 많은 양의 컨텍스트를 전달하는 애플리케이션(예: 전체 코드 베이스 또는 대화 기록)에 적합함
  • 고객과 빠르고 실시간으로 텍스트 응답을 주고받는 애플리케이션(예: 고객 지원 챗봇)에 적합함
  • API에서 텍스트와 비전을 지원하며, 향후 텍스트, 이미지, 비디오 및 오디오 입출력을 지원할 예정임
  • 128K 토큰의 컨텍스트 윈도우를 가지고 있으며, 요청당 최대 16K 출력 토큰을 지원하고, 2023년 10월까지의 지식을 보유하고 있음
  • GPT-4o와 공유하는 개선된 토크나이저 덕분에 영어 이외의 텍스트 처리가 더욱 비용 효율적으로 가능해짐

GPT-4o mini의 우수한 성능

  • GPT-4o mini는 텍스트 인텔리전스와 멀티모달 추론 모두에서 GPT-3.5 Turbo 및 기타 소형 모델을 능가함
  • GPT-4o와 동일한 언어 범위를 지원함
  • 함수 호출 성능이 우수하여 개발자가 외부 시스템에서 데이터를 가져오거나 작업을 수행하는 애플리케이션을 구축할 수 있음
  • GPT-3.5 Turbo에 비해 장문 컨텍스트 성능이 향상됨
  • MMLU에서 82.0%, MGSM에서 87.0%, HumanEval에서 87.2%, MMMU에서 59.4%의 점수를 받아 다른 소형 모델보다 우수한 성능을 보임

안전성 조치

  • 사전 학습 시 모델이 학습하거나 출력하지 않기를 원하는 정보(예: 혐오 발언, 성인 콘텐츠, 개인 정보를 주로 수집하는 사이트, 스팸 등)를 필터링함
  • 사후 학습 시 인간 피드백을 통한 강화 학습(RLHF) 등의 기법을 사용하여 모델의 동작을 정책에 맞게 조정하여 모델 응답의 정확성과 신뢰성을 개선함
  • GPT-4o mini는 GPT-4o와 동일한 안전 완화 기능이 내장되어 있음
  • 70명 이상의 외부 전문가들이 GPT-4o를 테스트하여 잠재적 위험을 식별했으며, 이를 해결했고 GPT-4o 시스템 카드와 준비 상태 스코어카드에서 자세히 공유할 예정임
  • GPT-4o mini는 API의 첫 번째 모델로 명령 계층 방법을 적용하여 모델의 탈옥, 프롬프트 주입 및 시스템 프롬프트 추출 저항 능력을 개선함

가격 및 가용성

  • GPT-4o mini는 이제 Assistants API, Chat Completions API 및 Batch API에서 텍스트 및 비전 모델로 사용 가능함
  • 개발자는 입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트를 지불함
  • 향후 며칠 내에 GPT-4o mini에 대한 파인튜닝을 출시할 예정임
  • ChatGPT의 무료, 플러스 및 팀 사용자는 오늘부터 GPT-3.5 대신 GPT-4o mini에 액세스할 수 있음
  • 엔터프라이즈 사용자도 다음 주부터 액세스 가능함

앞으로의 계획

  • AI 인텔리전스의 놀라운 발전과 함께 상당한 비용 절감이 이루어지고 있음
  • GPT-4o mini의 토큰당 비용은 2022년에 도입된 text-davinci-003보다 99% 낮아짐
  • 모든 앱과 웹사이트에 모델이 원활하게 통합되는 미래를 구상하고 있음
  • GPT-4o mini는 개발자가 강력한 AI 애플리케이션을 더 효율적이고 저렴하게 구축하고 확장할 수 있는 길을 열어줌
  • AI의 미래는 더 접근하기 쉽고, 신뢰할 수 있으며, 우리의 일상적인 디지털 경험에 내재되어 가고 있음

gpt-4o pro max ultra도 나오겠네요.