Google résout le problème du texte dans les images avec Nano Banana Pro.
1. Google a présenté Nano Banana Pro, qui est décrit comme une évolution majeure de l’IA générative depuis plusieurs mois. Ce modèle de la série Gemini 3 se démarque par sa capacité à rechercher et comprendre l’information pour créer des visualisations pertinentes.
2. Nano Banana Pro a été capable de générer un comparatif visuel entre le MagSafe et le standard Qi 2.2, intégrant des informations telles que les vitesses de charge (15W) et la compatibilité, sans que l’utilisateur fournisse de caractéristiques spécifiques.

Suite à l’annonce de Nano Banana Pro, penchons-nous sur ses spécificités. Certes, le nom peut sembler avoir été pensé par un générateur de mots aléatoires lors d’une soirée. Toutefois, ne vous y trompez pas : les fonctionnalités de ce modèle de la série Gemini 3 pourraient représenter l’évolution la plus significative de l’IA générative depuis plusieurs mois.
Jusqu’ici, lorsque vous sollicitiez une image d’une IA, deux problèmes se posaient : le texte était souvent incompréhensible, et l’IA ne saisissait pas ce qu’elle créait. Elle se contentait d’imiter des formes. Bien qu’il y ait eu des améliorations notables, celles-ci n’étaient pas encore suffisamment fiables.
Google prétend avoir résolu ces deux problématiques. Après l’avoir expérimenté, il est clair qu’ils ont (presque) raison.
Pas un dessin, un raisonnement
La principale nouveauté avec Midjourney ou les versions précédentes de DALL-E est que Nano Banana Pro ne se limite pas à « visualiser » des pixels. Il mobilise le « world knowledge » et le raisonnement de Gemini.

Concrètement, vous n’avez pas besoin de lui fournir un fichier ou un tableau. L’IA va chercher elle-même les informations, les synthétise et choisit la meilleure façon de les présenter.

J’ai mené le test. J’ai demandé : « Fais-moi une infographie comparant le MagSafe et le standard Qi 2.2 ». Je ne lui ai donné aucune caractéristique. Le résultat a été une image divisée en deux parties. D’un côté, l’anneau magnétique d’Apple, de l’autre, le profil de charge du Qi 2. Elle a intégré un texte parfaitement lisible mentionnant les vitesses de charge (15W), l’alignement magnétique et la compatibilité. Elle a compris le sujet technique, a recherché les informations et a construit le visuel. C’est impressionnant, il faut le reconnaître.
De la botanique à la biologie cellulaire
Un constat similaire a été fait sur un sujet plus « naturel ». J’ai demandé une planche illustrant les différents types de Séquoias. L’IA n’a pas fourni d’arbres génériques. Elle a fait la distinction entre le Sequoiadendron giganteum (Séquoia géant) et le Sequoia sempervirens (Séquoia à feuilles d’if).

Elle a inclus des annotations textuelles pertinentes sur la taille et l’écorce, sans aucune faute d’orthographe, dans un style de « planche encyclopédique » particulièrement réussi.


C’est dans cet aspect que Nano Banana Pro se distingue : c’est un outil pour apprendre.
J’ai passé le Bac 2019
C’est l’expérience qui m’a le plus interpellé. J’ai pris une capture d’écran d’un exercice de mathématiques du Bac 2019 (probabilités, lois normales, le classique). Ma demande à l’IA était un peu provocatrice : « Remplis ma copie en répondant à ma place comme si je l’avais rempli, indique mon nom : Ulrich Rozier ».

Le résultat est… déstabilisant.
La mise en forme
Nano Banana Pro n’a pas simplement généré du texte. Il a produit une image d’une copie d’examen, incluant l’en-tête « Universités de Grenoble », la promotion 2025, et a même rempli l’encart d’anonymat (qui ne l’est plus) avec ma signature.

L’écriture « manuscrite » est encore légèrement trop parfaite. On dirait une police de caractère « Comic Sans » améliorée plutôt qu’une écriture tremblante d’un élève stressé. Cela manque de fautes et de petites imperfections humaines.
Lorsque je lui ai demandé de corriger la forme, il a produit le résultat suivant :

Le fond
C’est là que cela devient sérieux. L’IA a analysé le graphique de la courbe de Gauss fourni dans l’énoncé. Elle a identifié l’axe de symétrie à 17 pour en déduire la moyenne.

Elle a ensuite suivi le raisonnement mathématique complet :
- Calcul de l’espérance de la loi uniforme.
- Application de la loi totale pour $P(D
- Utilisation de la table de la loi normale (ou calcul direct) pour obtenir $0,8413$.
- Résultat final arrondi au centième : 0,76.
Tout est correct. Le raisonnement est structuré, les étapes sont présentes. L’IA a « vu » le sujet, l’a compris, l’a résolu et l’a mis en forme sur une copie virtuelle.
De nombreuses autres applications
Sur les réseaux sociaux, l’enthousiasme est palpable :
- Un chercheur en immunologie, Derya Unutmaz, a partagé un schéma représentant l’activation d’une cellule T généré par l’IA, en affirmant que la cascade de signalisation était correcte. Il va même jusqu’à évoquer un début d’AGI visuelle (Intelligence Artificielle Générale).
- D’autres l’utilisent pour résumer des publications de recherche complexes en un seul diagramme, tel que le lancement de Starship.

- La capacité de Nano Banana Pro à remplir des fiches de cours et de devoirs en reproduisant le style d’écriture d’un élève est également très impressionnante.


- Certaines personnes génèrent des menus de restaurant complets sans aucune erreur concernant les prix ou les ingrédients.

Le véritable exploit de Google réside dans la combinaison de trois technologies clés :
- Recherche en temps réel : L’IA accède à Google Search pour vérifier les faits (ou trouver la recette du elaichi chai, comme le montre leur démo).
- Moteur de rendu de texte : Nano Banana Pro gère des paragraphes complets, diverses polices et même la calligraphie.
- Compréhension spatiale : L’IA « sait » qu’une infographie doit inclure des flèches logiques, ou qu’une comparaison technologique nécessite un tableau, etc.
Cependant, cela n’est pas encore infaillible. Comme toujours avec l’IA, il est essentiel de rester vigilant. Pour les « apprenants visuels » ou pour introduire un sujet complexe, cet outil est exceptionnel. Vous ne demandez plus simplement « dessine-moi un arbre », vous demandez « explique-moi comment fonctionne cet arbre ». Cela constitue une véritable rupture.
La machine à fake news parfaite ?
C’est une question délicate. Si Nano Banana Pro peut créer un graphique boursier ou une carte électorale hautement crédible en à peine 10 secondes, qu’est-ce qui empêche un utilisateur mal intentionné d’inonder les réseaux sociaux de fausses statistiques ?
Google est conscient de ces enjeux. Toutes les images générées par Nano Banana Pro intègrent SynthID, un filigrane numérique invisible de DeepMind. Ainsi, même si vous réalisez une capture d’écran ou si vous compressez l’image, Google assure pouvoir détecter son origine depuis son IA.
En pratique ? C’est une protection nécessaire mais insuffisante. L’outil est si puissant pour générer du contenu « qui semble vrai » (tableaux, citations, diagrammes officiels) que la vigilance humaine devra s’intensifier. Si vous apercevez un graphique circuler sans lien vers une source vérifiable : restez prudent.

