- Mistral Large 2는 128k 컨텍스트 윈도우 및 프랑스어, 독일어, 스페인어, 이탈리아어, 중국어, 일본어, 한국어를 포함한 여러 언어를 지원함
- 또한 Python, Java, C, C++, JavaScript, Bash를 포함한 80개 이상의 코딩 언어를 지원
- 단일 노드 추론을 위해 설계되었으며, 1230억 개의 파라미터로 구성되어 있어 단일 노드에서 높은 처리량을 제공할 수 있음
- 연구 및 비상업적 용도로 사용 및 수정이 가능한 Mistral Research License 하에 배포됨. 상업적 용도로 사용하려면 Mistral Commercial License를 취득해야 함
일반 성능
- Mistral Large 2는 성능/비용 평가 지표에서 새로운 기준을 세움
- 특히 MMLU에서 사전 학습된 버전은 84.0%의 정확도를 달성하며, 성능/비용 파레토 프론트에서 새로운 지점을 설정함
코드 및 추론
- Codestral 22B와 Codestral Mamba의 경험을 바탕으로 Mistral Large 2는 많은 양의 코드로 학습됨
- Mistral Large 2는 이전 Mistral Large보다 훨씬 뛰어나며, GPT-4o, Claude 3 Opus, Llama 3 405B와 같은 선도 모델과 동등한 성능을 보임
- 모델의 추론 능력을 향상시키기 위해 많은 노력을 기울였으며, 사실과 다른 정보를 생성하는 경향을 최소화하기 위해 모델을 미세 조정함
- 모델이 해결책을 찾지 못하거나 충분한 정보가 없을 때 이를 인정하도록 학습됨
지시 사항 준수 및 정렬
- Mistral Large 2는 지시 사항 준수 및 대화 능력이 크게 향상됨
- 많은 비즈니스 애플리케이션에서 간결함이 중요하기 때문에, 가능한 한 간결하고 핵심적인 응답을 생성하도록 많은 노력을 기울임
언어 다양성
- Mistral Large 2는 다국어 데이터를 많이 학습하여 영어, 프랑스어, 독일어, 스페인어, 이탈리아어, 포르투갈어, 네덜란드어, 러시아어, 중국어, 일본어, 한국어, 아랍어, 힌디어에서 뛰어난 성능을 보임
도구 사용 및 함수 호출
- Mistral Large 2는 향상된 함수 호출 및 검색 기능을 갖추고 있으며, 복잡한 비즈니스 애플리케이션의 동력 엔진으로서의 역할을 수행할 수 있도록 학습됨
클라우드 서비스 제공자를 통한 Mistral 모델 접근
- Google Cloud Platform과의 파트너십을 확장하여 Vertex AI에서 Mistral AI의 모델을 제공함
- Azure AI Studio, Amazon Bedrock, IBM watsonx.ai에서도 Mistral AI의 모델을 사용할 수 있음
GN⁺의 정리
- Mistral Large 2는 다양한 언어와 코딩 언어를 지원하며, 단일 노드에서 높은 처리량을 제공함.
- 코드 생성 및 추론 능력이 크게 향상되었으며, 사실과 다른 정보를 생성하는 경향을 최소화함.
- 다국어 데이터를 많이 학습하여 여러 언어에서 뛰어난 성능을 보임.
- Google Cloud Platform, Azure AI Studio, Amazon Bedrock, IBM watsonx.ai와의 파트너십을 통해 글로벌 사용자에게 제공됨.
- 비즈니스 애플리케이션에서 간결하고 핵심적인 응답을 생성하도록 설계됨.