High-tech

Intelligence artificielle : Comment reconnaître un texte qui a été écrit par ChatGPT ?

C’est une question que se posent de nombreuses personnes à travers le monde : comment reconnaître un texte qui a été écrit par ChatGPT ? S’il existe des outils plus ou moins fiables pour identifier le recours aux IA génératives, comme ZeroGPT, un œil avisé peut aussi faire la différence. Le célèbre outil d’OpenAI utilise en effet un style distinctif et quelques expressions fétiches. Autant d’indices qui permettent de déceler les textes qu’il a écrits, indique le Blog du Modérateur.

Des textes au style pompeux

ChatGPT se distingue tout d’abord par des textes souvent un peu pompeux et formels, comme le montre la newsletter TechnoPreneurship. Cette publication a recensé les 50 expressions les plus utilisées par cette intelligence artificielle en anglais. Parmi elles, on retrouve des formulations un peu lourdes à base de « comme nous l’avons vu » (« As we have seen »), « il est important de noter » (« It’s important to note ») ou encore « plonger dans les détails » (« Dive into the details »). Le tout asaisonné de connecteurs logiques en grande quantité tels que « donc » (« therefore »), « cependant » (« however ») et « en outre » (« furthermore »).

Le style de ChatGPT peut aussi se deviner à certains mots régulièrement employés. Parmi ceux cités par TechnoPreneurship, on a « plonger » (« delve »), « vital », « embarquer » ou « exceller ». Dans un article publié sur le site participatif Medium, le spécialiste de l’IA Jordan Gibbs a obtenu d’autres résultats en comparant la fréquence d’apparition de certains mots dans les réponses de ChatGPT avec la fréquence de ces mots dans les données Internet. « Réinventé » (« reimagined ») serait utilisé 1.033 fois plus souvent par l’IA, « bioluminescent » 650 fois plus souvent et « verdoyant » 600 fois plus souvent.

Une méthode contournable

Pourtant, les IA comme ChatGPT ont spécifiquement été entraînées sur une importante base de textes issus pour la plupart du web. Comment expliquer ces écarts parfois importants ? Par les changements opérés dans l’étape de renforcement par feedback humain, répondent nos confrères.

Cette étape consiste à faire intervenir des humains – le plus souvent des travailleurs précaires du Nigeria, du Kenya ou de Madagascar selon The Guardian – pour tester le modèle et évaluer la qualité de ses réponses. C’est ce qui explique pourquoi « delve » de l’expression « delve into » (« plonger dans »), particulièrement usité dans les pays anglophones africains, se retrouve dans les mots les plus utilisés.

Reste que cette méthode de détection devrait s’avérer de moins en moins efficace à mesure que les usagers apprennent à maîtriser ChatGPT. Dans sa requête (ou « prompt »), il est en effet possible de demander à l’outil d’adopter un certain style et de lui faire éviter certaines expressions.