High-tech

Tout juste lancée en France, on a testé la traduction simultanée sur Google Meet

Promesse tenue ! L’annonce avait été faite lors de la conférence Google I/O en mai dernier. Trois mois seulement après cette keynote pour les développeurs qui avait fait grand bruit, la fonction Traduction simultanée de la voix par la firme de Mountain View est déjà disponible en France. 20 Minutes a pu l’essayer.

Finie la barrière de la langue

Un meeting avec un collègue qui ne parle pas un mot de français ? Une interview avec un interlocuteur anglo-saxon, alors que vous maîtrisez mal la langue de Shakespeare ? Finie la barrière de la langue. Depuis ce 28 août, il est possible aux utilisateurs français de Google Meet d’activer lors de leurs rendez-vous en visio la fonction Traduction simultanée.

Annoncée lors de la conférence Google I/O pour les développeurs le 20 mai dernier, cette nouvelle fonctionnalité est, il faut bien l’avouer, assez bluffante. Après trois secondes de manips dans la barre d’outils de Google Meet (en haut, à droite de l’écran de son ordinateur), et après avoir choisi la langue dans laquelle on souhaite entendre son correspondant, il n’y a plus rien d’autre à faire qu’à parler… et écouter !

Et comme promis par Google, ce n’est pas la voix électronique d’un robot traducteur que l’on va entendre, mais bel et bien celle, reproduite à l’identique, de notre correspondant s’exprimant… dans une langue qu’il ne maîtrise pas.

Rien à voir avec de la synthèse vocale

Concrètement, l’expérience rappelle celle des interviews télévisées ou radio traduites par un interprète. Après un petit temps de latence ou l’on entend notre correspondant s’exprimer dans sa langue maternelle (3 ou 4 secondes, pas plus), la traduction simultanée prend le relais : le volume sonore de la voix originale baisse significativement, tandis que la voix traduite et clonée par l’intelligence artificielle vient s’y superposer. Concret, fluide, efficace et hyperréaliste. Et définitivement rien à voir avec de la synthèse vocale !

Là ou Google fait fort, c’est que non seulement, la voix traduite est l’exacte jumelle de la voix originale, mais que sont par ailleurs reproduites à l’identique les intonations, les hésitations, les émotions… Et l’on a très vite fait d’oublier que la personne en face ne s’exprime pas dans la langue que l’on entend.

Notre dossier «Intelligence artificielle »

Cette fonctionnalité, qui risque de bouleverser la profession de traducteur et d’interprète, est basée sur le modèle AudioLM développé par Google. Celui-ci modélise notamment les propriétés acoustiques telles que les caractéristiques du locuteur dans sa parole, ou le timbre de sa voix, avant de reproduire une forme d’onde acoustique au plus près de celle de la voix d’origine.

Selon Google, qui a demandé à des évaluateurs humains de déterminer si les voix produites étaient des enregistrements originaux ou des reproductions synthétiques, le taux de réussite serait actuellement de 51,2 %. Autrement dit, plus d’une oreille humaine sur deux n’est pas parvenue à faire la différence entre les voix humaines et les voix clonées…

À partir de 21,99 euros par mois

Accessible en version bêta en France, la Traduction simultanée n’est encore proposée dans nos contrées que dans quelques langues : le français, l’anglais, l’espagnol et l’italien. Selon Google, l’allemand et le portugais devraient suivre. Pour l’heure, elle n’est disponible que sur ordinateur, les ressources cloud requises pour son fonctionnement depuis un smartphone pouvant ne pas encore être suffisamment accessibles en mobilité. Et cette traduction est payante.

Pour y accéder, il est nécessaire de souscrire un abonnement à Google AI Pro (gratuit le premier mois, puis 21,99 euros par mois), ou à Google AI Ultra (139,99 euros pendant trois mois, puis 274,99 euros par mois) qui offrent aussi, évidemment, de très nombreuses fonctions IA. L’usage de Traduction simultanée peut être effectué simultanément à plusieurs intervenants, sans que le temps de la conversation soit limité.