Un collier IA pour « traduire » votre chien à 94,6 %
Une startup chinoise vend un collier connecté censé transformer les aboiements et les miaulements en phrases françaises avec une précision annoncée de 94,6 %. Le collier PettiChat se négocie en Chine à 799 yuans, environ 100 euros, et a déjà enregistré 10 000 précommandes.
Une startup chinoise propose un collier connecté qui prétend traduire les aboiements et les miaulements en phrases françaises, affichant une précision de 94,6 % sans aucune étude pour étayer cette affirmation.
Le PettiChat, pesant 27 grammes, se fixe sur n’importe quel collier. Le dispositif capte le son, le transmet à une application créée par la société, et délivre, 1,2 seconde plus tard, une phrase censée représenter les pensées de votre animal. Sur le papier, il pourrait enfin permettre de comprendre les animaux comme le ferait un Doctor Dolittle. Cependant, en vidéo, cela apparaît davantage comme un doublage bien synchronisé.
La jeune entreprise derrière ce produit est située à Hangzhou, avec un siège administratif à Hong Kong. Elle a levé un million de dollars en phase de démarrage auprès d’investisseurs liés à l’université du Zhejiang, et propose son collier à un tarif promotionnel de 119 dollars (un peu plus de 100 euros), le prix de l’édition limitée étant de 189,99 dollars.
En Chine, le collier est commercialisé à 799 yuans, soit environ 100 euros, et selon Dexerto, il a déjà enregistré 10 000 précommandes, avec une intelligence artificielle s’appuyant sur Qwen, le grand modèle de langage d’Alibaba Cloud.
La marque revendique une exactitude contextuelle de 94,6 %, obtenue par l’entraînement sur plus d’un million d’échantillons audio collectés auprès de plus de mille chiens et chats.
C’est sur cette promesse que des doutes commencent à émerger. En effet, il n’existe aucune étude indépendante, aucune méthodologie publiée et aucun comité de relecture n’a validé ce chiffre.
Une recherche menée par l’université du Michigan, publiée en 2024, a démontré qu’un modèle dérivé de Wav2Vec2, initialement conçu pour la voix humaine, atteint environ 70 % de précision pour classifier des aboiements en grandes catégories, mais ne permet pas de produire des phrases articulées.
Il semble donc que de telles présentations soient mises en scène, avec des voix synthétiques trop bien ajustées aux aboiements, laissant penser qu’elles ont été ajoutées en post-production.
Pour reformuler : il est plausible de décoder l’humeur générale d’un animal (anxieux, joueur, en alerte) en se basant sur des fréquences et des timbres, et plusieurs équipes universitaires font déjà des avancées dans ce domaine sans exagérer. En revanche, faire dire à un chien « j’ai vu un livreur, j’aimerais bien lui aboyer dessus » relève de la science-fiction. Les chiens ne possèdent ni phonèmes discrets ni grammaire : leurs vocalisations varient selon le contexte, la race et les expériences individuelles.
Un modèle de langage peut générer une phrase plausible à partir d’un son, mais « plausible » ne signifie pas « exact ».
Et en toute honnêteté, si ce dispositif fonctionnait réellement, nous découvririons probablement que nos animaux nous jugent en silence depuis 15 000 ans.

