5P by xguru 7일전 | favorite | 댓글과 토론
  • Mistral이 이미지와 텍스트를 모두 처리할 수 있는 첫 번째 모델인 Pixtral 12B를 공개함
    • 120억 개의 파라미터를 가진 약 24GB 크기의 모델
  • Mistral의 텍스트 모델인 Nemo 12B를 기반으로 구축됨
    • URL이나 base64로 인코딩된 이미지를 통해 임의 개수와 크기의 이미지에 대한 질문에 답변할 수 있음
    • Anthropic의 Claude 제품군이나 OpenAI의 GPT-4 등 다른 멀티모달 모델과 유사하게 이미지 캡셔닝, 사진 속 객체 수 세기 등의 작업을 수행할 수 있을 것으로 예상됨
  • GitHub 및 Hugging Face에서 토렌트 링크를 통해 다운로드 가능함
  • Apache 2.0 라이선스에 따라 제한 없이 다운로드, 파인튜닝, 사용이 가능함
  • 현재 웹 데모는 작동하지 않으나, Mistral의 챗봇 및 API 서비스 플랫폼인 Le Chat과 Le Plateforme에서 곧 테스트 가능할 예정임
  • 최근 Mistral은 General Catalyst가 주도한 6억 4,500만 달러 규모의 펀딩 라운드를 마감하며 기업 가치 60억 달러를 인정받음
    • 1년 남짓 된 Mistral은 Microsoft가 소수 지분을 보유하고 있으며, 유럽의 OpenAI로 여겨지고 있음
    • 무료 "오픈" 모델을 공개하고, 관리형 버전에 대해 요금을 부과하며, 기업 고객에게 컨설팅 서비스를 제공하는 전략을 취하고 있음