프랑스 Mistral AI가 내놓은 첫 플래그십 통합 모델로, 지시 따르기·추론·코딩을 하나의 모델에 합쳐 에이전트 작업과 코딩에 강하다.
Mistral Medium 3.5는 프랑스 AI 스타트업 Mistral AI가 만든 모델이다. 그동안 Mistral은 일상 대화를 잘하는 모델, 수학 추론에 특화된 모델(Magistral), 코딩에 특화된 모델(Devstral)을 따로따로 내놓았는데, 이 버전부터는 그 능력들을 하나로 합쳤다. 그래서 회사 스스로 첫 플래그십 통합(merged) 모델이라고 부른다. 파라미터를 부분적으로만 켜는 MoE 방식이 아니라 1,280억 개 가중치를 통째로 쓰는 dense 모델이고, 한 번에 25만 6천 토큰(책 여러 권 분량)을 읽을 수 있는 긴 컨텍스트와 이미지 입력까지 받는 멀티모달 기능을 갖췄다.
가장 큰 특징은 추론 모드를 켜고 끌 수 있다는 점이다. 빠른 답이 필요하면 곧장 답하고, 어려운 문제는 high 같은 추론 강도를 요청 단위로 올려서 더 오래 생각하게 만들 수 있다. 이전 세대를 여러 개로 나눠 쓰던 것을 하나로 합쳤기 때문에, Mistral의 자체 서비스 Le Chat에서도 Mistral Medium 3.1과 Magistral을 이 모델로 교체했다. 도구를 여러 번 연달아 호출하면서 긴 작업을 끝까지 끌고 가는 능력이 강해, 코딩 에이전트 같은 곳에서 특히 빛을 본다.
API로 부르는 게 가장 간단하다. 모델 이름 mistral-medium-3.5를 지정하고 추론 강도만 조절하면 된다. 가중치가 공개(Modified MIT 라이선스)되어 있어서 직접 받아 돌릴 수도 있는데, ollama run mistral-medium-3.5 한 줄이면 로컬에서 띄울 수 있고 vLLM이나 SGLang으로 서빙도 한다. Mistral은 이 모델의 에이전트 능력을 살려 자사 코딩 에이전트 Vibe의 기본 엔진을 기존 Devstral 2에서 이 모델로 바꿨고, Vibe 안에서 원격 에이전트가 코드 작업을 돌리는 데 쓴다.
1,280억 dense 모델이라 로컬에서 돌리려면 GPU가 넉넉히 필요하고, 돌아간다와 빠르게 돌아간다는 전혀 다른 얘기라 실사용엔 만만치 않다. API 가격도 비슷한 크기의 다른 오픈 웨이트 모델보다 비싼 편이고(입력 100만 토큰당 약 $1.5, 출력 $7.5), 답을 장황하게 내놓는 경향이 있어 출력 토큰이 많이 나올 수 있다.