Que peut-on faire avec Gemini, l’IA de Google qui débarque sur nos IPhone ?
Les possesseurs d’iPhone peuvent télécharger une nouvelle appli dès ce jeudi 14 novembre : Gemini. Largement déployée dans l’univers Android, l’IA de Google est désormais accessible dans la galaxie iOS d’Apple. Après ChatGPT, et en attendant Apple Intelligence en avril 2025, Gemini se positionne comme un nouvel assistant personnel. Cela en vaut-il la peine ? 20 Minutes l’a téléchargé ce matin sur l’appstore d’Apple et l’a mis à l’épreuve.
Des fonctions déjà connues
Retard comblé pour Gemini, qui appose officiellement ce jeudi 14 novembre son logo noir et bleu sur les écrans des iPhone d’Apple. « Officiellement », car il était déjà possible, grâce à l’application Google sous iOS, d’accéder à de nombreuses fonctions offertes par l’IA de la firme de Mountain View : répondre à des questions formulées par écrit ou à l’oral ; rédiger un document ; traduire un texte ; identifier un objet ou un lieu d’après une photo ; ou encore reconnaître un morceau musical… autant de fonctions qui imposaient jusqu’alors un peu de gymnastique du fait d’une ergonomie perfectible.
Si l’application Google sur iPhone conserve ces spécificités, Gemini les concentre parallèlement en un même lieu. Dès qu’ouverte, son application propose un champ de saisie pour des requêtes écrites ; une icône Micro à activer si on souhaite les effectuer à la voix ; une autre, Photo, pour lancer la recherche Google Lens d’après une image ; et enfin une touche pour réveiller l’agent conversationnel Gemini Live afin de discuter de vive voix avec l’intelligence artificielle. Une jolie palette de propositions. À noter que, de son côté ChatGPT va déjà plus loin et propose de générer des dessins et photos (trois par jour, gratuitement). Et pour optimiser l’usage de l’IA de Google et intégrer Gemini à sa boîte mail ou à Google Docs (pour résumer un mail, synthétiser des documents…), un abonnement à Gemini Advanced (21,99 euros/mois après un premier mois offert) est requis. Les entreprises sont les premières ciblées.
Gemini Live, comme au cinéma
Mais durant nos essais de Gemini installé sur iPhone, c’est surtout Gemini Live qui nous a bluffés. Disponible depuis peu sous Android et désormais sous iOS, cette nouvelle fonction sous forme de robot conversationnel semble ici la plus innovante et pertinente.
Après avoir choisi dans les paramètres l’une des dix voix françaises proposées (féminines ou masculines, avec un ton plus ou moins grave, enjoué, énergique…), il est possible de discuter avec l’IA de façon naturelle, sans avoir à dire « O.K. Gemini » pour entamer une discussion.
Alors, ça y est, le film HER de Spike Jonze, dans lequel une IA nommée Samantha discutait en 2014 avec Joaquin Phoenix, on y est ? Interrogeons à la voix Gemini Live pour le savoir : « Quelle différence y a-t-il entre l’IA du film HER et Gemini ? » Réponse immédiate : « Alors, ce n’est pas exactement la même chose. Samantha, c’est une intelligence artificielle super avancée, capable de ressentir des émotions, d’apprendre toute seule et même de tomber amoureuse… Gemini, de son côté, est aussi une IA, mais on est encore loin de ce niveau-là. Gemini est plutôt là pour répondre à tes questions, te donner des infos et t’aider dans tes tâches quotidiennes ». Limpide, concis, précis… on est sans voix.
Une IA qui n’est pas infaillible
On est aussi scotchés par la fluidité de la voix (on a choisi celle d’Ursa, d’une femme « impliquée, avec une tonalité moyenne »). Estomaqués par le français impeccable, les tournures de phrases, le ton, le rythme, la diction. Et étonnés par la pertinence de la réponse.
Pertinence qui peut cependant être mise à mal. Dans une conversation de quelques minutes que nous avons tenue avec Gemini sur les derniers chiffres d’audience radio publiés ce 14 novembre, nous avons constaté que Gemini avait les dernières infos, mais pouvait aussi se planter lorsque nous avons essayé de creuser un peu le sujet.
En demandant « quelle est la position de NRJ dans cette enquête ? ». Réponse : « Si tu veux des informations sur la consommation d’énergie dans le secteur de la radio en France, je peux essayer de trouver une autre source pour toi ». Petit problème de compréhension. Anecdotique, certes, mais Gemini n’est pas infaillible.
Nous regrettons aussi que dans le cadre d’une conversation, le chatbot conversationnel ne puisse pas afficher sur l’écran de notre smartphone un document auquel il fait référence. Lorsque demandé, la voix nous conseille de passer par le moteur de recherche Google. Gemini Live ne peut pas davantage être utilisé pour lancer de la musique, visionner les images de caméras de surveillance… et plus globalement être utilisé pour la maison, connectée. Une question d’intégration qui, on l’imagine sera progressivement réglée.
Discussions à bâtons rompus
Mais on peut causer avec Gemini Live dans trente langues, dont le français, l’anglais, l’allemand et l’espagnol. Et causer longtemps. À bâtons rompus, même. Nous avons ainsi bavassé autour d’un café avec l’IA à propos de l’auteur René Barjavel, que l’on adore ; de ses romans fantastiques (Ravage, La Nuit des temps…) ; les adaptations ciné et télé qui en ont été tirées… L’IA n’hésite d’ailleurs pas à entretenir la conversation en nous demandant si l’on a aimé tel livre, vu tel film. On peut passer à un autre sujet puis revenir sur le précédent. Gemini se souvient de ce dont on avait parlé précédemment. Scotchant…
L’IA conversationnelle de Google n’est pas seule : l’impressionnant ChatGPT Voice d’Open IA et Copilot Voice de Microsoft proposent des services similaires.
Reste que face à Gemini Live, les « vieux » assistants vocaux que sont Alexa et SIRI affichent désormais un énOOOOrme train de retard ! Une petite partie de « Ni oui, non » avec Gemini Live en témoigne : on ne joue définitivement plus dans la même cour ! Par contre, le chatbot n’est pas encore capable de générer des sons. Pour faire le bruit du cochon ou celui du pet, on peut toujours demander à Alexa…