High-tech

OpenAI corrige enfin le défaut du mode vocal de ChatGPT

OpenAI déploie une nouvelle interface qui intègre le mode vocal directement dans le fil de discussion depuis mardi. Cette mise à jour permet aux utilisateurs de demander à ChatGPT d’analyser une carte ou une photo sans quitter l’interface vocale.

Vous avez déjà tenté de demander à ChatGPT de commenter une image en mode vocal ? C’était impossible sans naviguer entre les écrans. Ce problème est désormais résolu. OpenAI déploie une mise à jour qui intègre enfin le chat textuel et l’expérience vocale.

Jusqu’à présent, utiliser le mode vocal de ChatGPT était comparable à passer un appel en étant aveugle. Vous appuyiez sur un bouton, une interface noire avec un cercle bleu s’affichait, et vous étiez isolé du reste du monde.

Il était impossible de revoir la phrase précédente. Il était également impossible de visualiser l’image que vous veniez d’envoyer.

OpenAI met un terme à cette séparation artificielle. Depuis mardi, l’éditeur déploie une nouvelle interface qui intègre le mode vocal directement dans le fil de discussion. Vous parlez, et la réponse apparaît en temps réel sous vos yeux.

La fin de la conversation à l’aveugle

L’inconvénient de l’ancienne version résidait dans l’isolement. Si un mot ou une nuance échappait à votre écoute dans la réponse de l’IA, il fallait quitter le mode vocal, revenir au texte, faire défiler… En somme, c’était assez pénible.

Avec cette mise à jour, l’expérience devient réellement multimodale. Voici les changements :

  • Transcription en direct : les réponses apparaissent tandis que l’IA parle.
  • Support visuel : vous pouvez demander à ChatGPT d’analyser une carte ou une photo sans quitter l’interface vocale.
  • Contexte immédiat : vous gardez un œil sur l’historique de la conversation.

Ce service est disponible dès maintenant sur le Web et les applications mobiles (iOS et Android). OpenAI transforme la voix en une simple méthode d’entrée (input), plutôt qu’en un « mode » déconnecté du reste. Cela paraît plus logique, surtout face à un Gemini Live qui peine encore à s’affirmer en matière d’ergonomie.

L’interface nécessite encore une action manuelle pour désactiver le microphone : il faut appuyer sur « Terminer » (End) pour revenir au mode clavier normal. Une transition plus fluide, sans bouton, semblable à une véritable conversation humaine qui se termine naturellement, aurait été souhaitable.

Vous aimiez l’interface simplifiée de l’ancienne version ? Vous pensiez que le texte qui défile perturbait votre écoute ? Pas de souci.

OpenAI a prévu une solution. Dans les Réglages > Mode Vocal, une nouvelle option permet de réactiver le « Mode séparé ».