Mistral Medium 3.5 : start-up française propose modèle 128B à moitié prix.
Mistral Medium 3.5 est un modèle de 128 milliards de paramètres avec une fenêtre de contexte de 256 000 jetons, publié fin avril 2026 sous licence MIT modifiée. L’API affiche des tarifs de 1,50 $ par million de jetons entrants et 7,50 $ en sortie, soit moitié prix de Claude Sonnet 4.6, qui plafonne à 3 $ et 15 $.
Mistral a lancé Medium 3.5, un modèle open source doté de 128 milliards de paramètres, proposé à 1,50 dollar pour chaque million de jetons entrants. Ce tarif est inférieur à celui de Claude Sonnet 4.6, bien qu’il soit aussi légèrement moins performant.
Mistral, connu pour son utilisation de LLM comme ChatGPT, a élargi son offre avec un modèle plus économique. Ce modèle, Medium 3.5, est un dense assemblage de 128 milliards de paramètres, avec une fenêtre de contexte de 256 000 jetons, mis en ligne fin avril 2026 sous licence MIT modifiée.
Medium 3.5 regroupe en un seul modèle ce qui était auparavant vendu en trois produits distincts : Medium pour la discussion, Magistral pour le raisonnement et Devstral pour le codage. Dans le cadre du test de référence SWE-Bench Verified, qui évalue la capacité d’une IA à corriger des bugs sur GitHub, il affiche un score de 77,6 %.
Au niveau tarifaire, l’API est proposée à 1,50 $ par million de jetons entrants et 7,50 $ en sortie. Pour comparaison, ces prix sont moitié moins élevés que ceux de Claude Sonnet 4.6, qui sont respectivement de 3 $ et 15 $. De plus, il peut être exécuté localement sur quatre GPU, ce qui présente un avantage pour les entreprises soucieuses de préserver la confidentialité de leurs données.
La véritable innovation réside non pas seulement dans le modèle lui-même, mais dans ses applications.
Mistral introduit Vibe, ses « agents distants ». Ces agents peuvent effectuer des tâches dans le cloud sans que l’utilisateur ait à superviser le processus en temps réel. Que ce soit pour refactoriser un module, générer des tests, mettre à jour des dépendances ou enquêter sur un bug de CI, l’agent soumet une pull request sur GitHub une fois la tâche achevée, permettant à l’utilisateur de se concentrer sur la révision des résultats plutôt que sur chaque ligne de code.
De plus, le Chat dispose d’un « mode travail » qui automatise des tâches non techniques telles que le tri des emails, la préparation de réunions ou la collaboration entre différents outils. Bien que Mistral arrive sur ce segment après Anthropic qui a développé Claude Code, il le fait avec une approche européenne.
Comparé à Claude Sonnet 4.6, qui obtient 79,6 % sur le test SWE-Bench Verified pour un coût de 3 $/15 $, Medium 3.5 perd deux points mais réduit les coûts de 50 %.
En termes de concurrence avec des modèles chinois ouverts comme Qwen 3.5 ou DeepSeek V4, la différence de prix est moins avantageuse, mais la question de la souveraineté devient cruciale pour de nombreux acheteurs publics et industriels en Europe.
Mistral n’a pas encore publié ses résultats concernant les tests MMLU, GPQA ou les benchmarks de raisonnement général, ce qui peut être interprété comme un signe de prudence. Bien que Mistral soit performant dans la programmation et l’utilisation d’agents, ses capacités dans d’autres domaines demeurent moins claires.
Mistral ne s’est pas imposé comme le meilleur modèle au monde, et il est peu probable qu’il le devienne à ce rythme. Toutefois, l’entreprise semble avoir compris que son créneau repose sur l’ouverture et la souveraineté, plutôt que sur une bataille de benchmarks contre des géants disposant de ressources largement supérieures. Reste à voir si l’Europe, qui promeut le discours sur la souveraineté numérique, sera prête à investir pour la concrétiser.

