Google déploie Gemini 3 Flash, au-dessus de GPT-5.2 sur certains aspects.
Google a déployé Gemini 3.0 Flash sur ses smartphones, remplaçant le modèle Gemini 2.5 Flash. Sur le benchmark Humanity’s Last Exam, Gemini 3 Flash a obtenu un score de 33,7 %, tandis que Gemini 3 Pro est à 37,5 % et GPT-5.2 à 34,5 %.

Mise à jour : Google annonce son nouveau modèle, Gemini 3 Flash.

Ce nouveau modèle remplace à partir d’aujourd’hui le vieillissant Gemini 2.5 Flash dans l’application Google et le mode IA. Il s’agit de la version que vous utiliserez 90 % du temps. Ce modèle « léger » rivalise avec les performances des modèles « Pro » et peut même mettre à l’épreuve le récent GPT-5.2 sur certains aspects.
Gemini 3 Flash affiche des résultats qui surprennent. Sur le benchmark Humanity’s Last Exam, il a obtenu un score de 33,7 %.
Pour donner un ordre d’idée, le puissant Gemini 3 Pro est à 37,5 % et le dernier GPT-5.2 d’OpenAI est à 34,5 %. En somme, cette version « économique » est proche des modèles les plus puissants du marché, ce qui est impressionnant.
Cependant, l’innovation réelle de Google réside dans la multimodalité (la capacité à percevoir, entendre et comprendre). Sur le test MMMU-Pro, Gemini 3 Flash obtient un score de 81,2 %, surpassant tout le monde.
Pour les développeurs, Google a opté pour un changement intéressant. Le prix augmente légèrement par rapport à la version 2.5 : il est désormais de 0,50 dollar par million de tokens en entrée. C’est plus cher, certes. Néanmoins, Google assure que le modèle est trois fois plus rapide et nécessite 30 % de tokens en moins pour réfléchir. Au final, la facture pourrait donc diminuer, mais cela reste à confirmer.
Article original :
Google commence officiellement à déployer Gemini 3.0 Flash dans son application mobile. Si vous êtes chanceux, vous avez déjà pu constater l’apparition de nouvelles options dans le sélecteur de modèle.
Google souhaite mettre fin à l’attente interminable devant une bulle de texte clignotante. Pour cela, la société de Mountain View ne se contente pas de lancer un nouveau modèle. Elle divise l’expérience en trois catégories distinctes : Fast (Rapide), Thinking (Raisonnement) et Pro.
Auparavant, l’utilisateur subissait le temps de latence du modèle choisi. Désormais, il peut décider si l’IA doit aller vite ou prendre le temps de réfléchir.
Gemini 3.0 Flash : un modèle, deux facettes
Le point le plus marquant de cette mise à jour est le double fonctionnement de Gemini 3.0 Flash.

Pour la première fois, Google propose deux modes pour un même moteur. Le mode Fast (Rapide) est une version simplifiée, presque sans processus de raisonnement interne. C’est l’outil idéal pour une réponse instantanée à une question simple ou pour une traduction rapide.

À l’inverse, le mode Thinking (Raisonnement) active les capacités de raisonnement de Flash. Ce que Google définit comme un processus « stable et consistant ». Concrètement, l’IA simule une forme de réflexion interne avant de fournir son résultat. Cela prend plus de temps, mais cela réduit considérablement les hallucinations et les erreurs logiques souvent rencontrées avec les modèles légers.
Enfin, on trouve le modèle haut de gamme : Gemini 3.0 Pro. Ici, il ne s’agit plus seulement de rapidité, mais de puissance brute pour des flux de travail multi-agents ou des raisonnements mathématiques complexes. La hiérarchie est désormais claire chez Google, même si elle nécessite un temps d’adaptation.
L’annonce est généralement attendue autour de 19h (heure de Paris), mais cette fois, le déploiement a été plus rapide que l’annonce.

