최근에 나의 파이프라인 대부분을 gpt-4.1-mini에서 gpt-5-mini로 업그레이드했음, 그런데 성능이 너무 나빠서 조사 끝에 전부 mistral-medium-0525로 옮기기로 결정했음
가격은 똑같지만 결과물이 훨씬 더 좋고 신뢰도도 높으며 10배는 더 빠름
단점은 실패할 때 완전히 망가지는 경향이 있다는 것임
gpt-5-mini는 프롬프트의 포맷팅을 70% 정도 무시했으나, mistral-medium은 99% 잘 지키고, 1% 정도에서 이유를 알 수 없는 랜덤 문자(보통 백틱)를 삽입해 자체 포맷팅 문제를 일으키기도 함
그럼에도 불구하고 Mistral에 아주 만족하고 있음
LLM에서 생성된 JSON을 json ... 식으로 감싸는 것은 너무 흔한 패턴이라서, 나는 애플리케이션 레벨에서 이런 부분을 체크하고 고정함
10년 전에는 LSTM으로 합성 데이터 생성할 때도 비슷하게 포맷팅에 대해 sanity check를 하곤 했음
내 파이프라인에서도 비슷한 경험을 했음
비용 절감과 OpenAI 외 제품을 실험해보고 싶어서 요약에는 Mistral Small, 마지막 분석에는 Large를 사용 중인데, 굉장히 만족하고 있음
게다가 아주 관대한 무료 티어가 있어서 PoC와 데모 만들 때 큰 도움이 됨
gpt-5 mini에서 structured output을 사용했는지 궁금함
자주 실패하는 예시가 있다면 보여줄 수 있는지?
토큰의 제약이 원하는 포맷에서 왜 이렇게 벗어날 수 있었는지 궁금함
내 프로젝트에도 사용자가 다양한 옵션을 선택하는 단계가 있는데, 이 워크플로를 지원하는 테스트 세트에서 gpt-4.1-mini의 성공률이 gpt-5, gpt-5-mini 대비 약 7% 더 높게 나옴 (특별한 사고 요구 없이)
네 프롬프트가 어떻게 구성됐는지 궁금함, 내 경험과 완전히 반대임
lmarena로 랜덤 원샷 질문을 많이 하는데, 내가 블라인드 투표했을 때 mistral-medium이 항상 더 나쁜 선택임
qwen, llama, gemini, gpt 등과 비교해서 압도적으로 사실과 다른 정보를 내놓는 비율이 제일 높음
예시 프롬프트를 공유해줄 수 있으면 좋겠음, 무엇에 반응이 좋은지 궁금함
혹시 Mistral 관계자가 이 글을 본다면, 서드파티 MCP 구현을 커넥터 디렉토리에 넣는 방법이 있는지 궁금함
S3부터 FTP(S), SFTP, SMB, NFS, Gdrive, Dropbox, Azure Blob, Onedrive, Sharepoint 등 가능한 모든 파일 전송 프로토콜에 연결할 수 있는 MCP 커넥터를 만들었음
인증 위임, 권한 강제, RBAC 지원, Chroot로 LLM의 접근 제한, 여러 파일 포맷을 시각화/편집할 수 있는 도구까지 여러 계층을 넣었음
오픈소스이고, 디렉토리에 추가되면 멋질 것 같음 https://github.com/mickael-kerjean/filestash
Mistral이 최근 펀딩 라운드에서 140억 달러 가치로 평가받음
Anthropic이나 OAI와 비교하면 훨씬 낮은 밸류에이션이라 나에겐 굉장히 저렴하게 느껴짐
해당 벨류에이션을 더 잘 이해하려면 수익과 성장률 비교가 흥미로울 것 같음
그리고 Mistral은 유럽과 연관된 Gen AI 신흥 기업 중 거의 유일하게 중요한 플레이어로 남은 듯함
Aleph Alpha는 더 이상 들리지 않고 Schwarz Group이 이끌고 있어서 사실상 인재 인수만 남은 수준임
나는 ProtonMail의 프라이버시 중심 Lumo LLM Chat을 유료로 사용 중임, 좋은 웹 검색 툴도 있고
Lumo는 Mistral 모델을 기반으로 돌아감
자주 사용하는데 결과물이 대부분 충분히 만족스러움
다만 코딩엔 주 2~3회 정도는 gemini-cli와 OpenAI의 codex도 여전히 씀
미국에 살지만 만약 내가 유럽인이라면 지역과 국가의 AI 산업을 위해 Mistral을 전폭적으로 지원할 것임
그렇게 커 보이지 않음, Anthropic도 최근에 거의 비슷한 금액을 펀딩 받았음
Mistral이 정말 생존할 수 있을지 의문임
"20개 이상의 보안 커넥터 디렉토리"라는데, 여기서 '보안'의 의미가 뭔지 설명이 없음
아마 이 뜻일 수도 있겠음
관리자가 사용자별로 어떤 커넥터를 쓸 수 있는지, 인증 위임(on-behalf authentication)으로 접근 권한도 세밀하게 통제 가능하다는 의미일 것 같음
Stripe, Paypal 등에서 제공하는 MCP 기능은 뭔지 궁금함
환율 변환이나 수수료, API 문서 등도 포함되는지 알고 싶음
Hacker News 의견
가격은 똑같지만 결과물이 훨씬 더 좋고 신뢰도도 높으며 10배는 더 빠름
단점은 실패할 때 완전히 망가지는 경향이 있다는 것임
gpt-5-mini는 프롬프트의 포맷팅을 70% 정도 무시했으나, mistral-medium은 99% 잘 지키고, 1% 정도에서 이유를 알 수 없는 랜덤 문자(보통 백틱)를 삽입해 자체 포맷팅 문제를 일으키기도 함
그럼에도 불구하고 Mistral에 아주 만족하고 있음
json ...식으로 감싸는 것은 너무 흔한 패턴이라서, 나는 애플리케이션 레벨에서 이런 부분을 체크하고 고정함10년 전에는 LSTM으로 합성 데이터 생성할 때도 비슷하게 포맷팅에 대해 sanity check를 하곤 했음
비용 절감과 OpenAI 외 제품을 실험해보고 싶어서 요약에는 Mistral Small, 마지막 분석에는 Large를 사용 중인데, 굉장히 만족하고 있음
게다가 아주 관대한 무료 티어가 있어서 PoC와 데모 만들 때 큰 도움이 됨
자주 실패하는 예시가 있다면 보여줄 수 있는지?
토큰의 제약이 원하는 포맷에서 왜 이렇게 벗어날 수 있었는지 궁금함
lmarena로 랜덤 원샷 질문을 많이 하는데, 내가 블라인드 투표했을 때 mistral-medium이 항상 더 나쁜 선택임
qwen, llama, gemini, gpt 등과 비교해서 압도적으로 사실과 다른 정보를 내놓는 비율이 제일 높음
예시 프롬프트를 공유해줄 수 있으면 좋겠음, 무엇에 반응이 좋은지 궁금함
S3부터 FTP(S), SFTP, SMB, NFS, Gdrive, Dropbox, Azure Blob, Onedrive, Sharepoint 등 가능한 모든 파일 전송 프로토콜에 연결할 수 있는 MCP 커넥터를 만들었음
인증 위임, 권한 강제, RBAC 지원, Chroot로 LLM의 접근 제한, 여러 파일 포맷을 시각화/편집할 수 있는 도구까지 여러 계층을 넣었음
오픈소스이고, 디렉토리에 추가되면 멋질 것 같음
https://github.com/mickael-kerjean/filestash
Anthropic이나 OAI와 비교하면 훨씬 낮은 밸류에이션이라 나에겐 굉장히 저렴하게 느껴짐
해당 벨류에이션을 더 잘 이해하려면 수익과 성장률 비교가 흥미로울 것 같음
그리고 Mistral은 유럽과 연관된 Gen AI 신흥 기업 중 거의 유일하게 중요한 플레이어로 남은 듯함
Aleph Alpha는 더 이상 들리지 않고 Schwarz Group이 이끌고 있어서 사실상 인재 인수만 남은 수준임
최근 별도의 에이전트 프레임워크를 발표했음
https://www.heise.de/en/news/DeepL-presents-its-own-AI-agent-for-companies-10630391.html 전반적으로 유럽 내 AI는 가능성 있다고 생각함
Lumo는 Mistral 모델을 기반으로 돌아감
자주 사용하는데 결과물이 대부분 충분히 만족스러움
다만 코딩엔 주 2~3회 정도는 gemini-cli와 OpenAI의 codex도 여전히 씀
미국에 살지만 만약 내가 유럽인이라면 지역과 국가의 AI 산업을 위해 Mistral을 전폭적으로 지원할 것임
https://news.ycombinator.com/item?id=44665398
Mistral의 퍼블릭 API 엔드포인트는 CloudFlare를 경유함, 내가 확인한 중국계 모델들도 전부 마찬가지임
오렌지 컬러로 현대적 픽셀 아트 느낌을 주는 Mistral 디자인팀에 박수
공식 MCP 서비스가 무조건 더 나을 것 같음, 리소스 접근 권한을 Mistral에 줄 필요도 없기 때문임
https://www.bloomberg.com/news/articles/2025-09-03/mistral-set-for-14-billion-valuation-with-new-funding-round
Mistral이 정말 생존할 수 있을지 의문임
아마 이 뜻일 수도 있겠음
관리자가 사용자별로 어떤 커넥터를 쓸 수 있는지, 인증 위임(on-behalf authentication)으로 접근 권한도 세밀하게 통제 가능하다는 의미일 것 같음
환율 변환이나 수수료, API 문서 등도 포함되는지 알고 싶음