High-tech

250.000 articles faux sur le cancer : explications détaillées.

Plus de 250.000 publications scientifiques dans le domaine du cancer pourraient avoir été fabriquées de toutes pièces entre 1999 et 2024, selon une étude publiée dans le British Medical Journal par Baptiste Scancar, ingénieur de recherche à l’Institut Agro Rennes-Angers. L’écrasante majorité des 250.000 fausses publications repérées est toujours en ligne, avec seulement 2.000 qui ont été rétractées.


Quand la science examine la science, les découvertes peuvent parfois être surprenantes. Dans le domaine des études sur le cancer, le constat est particulièrement alarmant : plus de 250 000 publications scientifiques, soit presque 10 % des études, pourraient avoir été fabriquées de toutes pièces entre 1999 et 2024. C’est ce qu’indique Baptiste Scancar, ingénieur de recherche à l’Institut Agro Rennes-Angers, spécialisé en intégrité et en fraude scientifiques, dans une étude publiée dans le British Medical Journal. Il décrit en particulier le phénomène à l’origine de ces fausses publications en masse : les « paper mills », ou « fabriques à articles » en français.

Ces paper mills sont des organisations spécialisées dans la production en série d’articles. Bien qu’il reste encore de nombreuses zones d’ombre sur la nature exacte de ces fabriques, les scientifiques estiment qu’il s’agit d’entreprises organisées, de groupes de chercheurs collaborant à la fabrication et à la publication rapide d’articles, ou d’individus seuls, utilisant des modèles similaires pour créer leurs textes.

Ces articles sont entièrement faux. « Il n’y a aucun élément avéré dedans, explique Baptiste Scancar. Les résultats, le texte et même les images sont fabriqués de toutes pièces. » Concernant la méthodologie, les chercheurs pensent que ces fabriques produisent, à la base, des faux articles en utilisant des modèles, des gabarits préremplis avec un genre de texte à trous à compléter et réorganiser selon les besoins du chercheur.

Ces modèles expliquent pourquoi Baptiste Scancar et son équipe ont pu identifier potentiellement 250 000 articles faux : en se basant sur les articles identifiés manuellement comme frauduleux par des experts, les spécialistes ont entraîné une intelligence artificielle à reconnaître ces publications fabriquées, notamment grâce à des structures et tournures de phrases similaires d’une fausse publication à l’autre.

Cependant, des outils comme ChatGPT pourraient complicer la détection, et pas dans le sens des traqueurs de faussaires. « Si vous commencez à utiliser une IA pour effectuer de nombreuses reformulations et paraphrases, changer la structure et ajouter plus de variabilité dans les textes, vous compliquez la tâche de détection », souligne Baptiste Scancar, évoquant « un enjeu pour le domaine » à l’avenir.

Mais comment ces articles peuvent-ils paraître dans des revues sérieuses, parfois prestigieuses, alors que les conditions de publication sont censées être strictes et que les études sont évaluées par des pairs – le peer review ? Les raisons sont multiples : dans le domaine de la recherche biologique et moléculaire, notamment sur le cancer, « peu de personnes peuvent effectuer cette évaluation car il s’agit souvent de sujets assez compliqués et spécifiques, remarque Baptiste Scancar. Donc, si vous êtes assez cohérent en tant que faussaire, vous pouvez facilement faire croire à quelque chose qui n’existe pas, avec peu de chances que quelqu’un le découvre. »

Une autre explication, tout aussi préoccupante, est que « certains éditeurs d’articles peuvent être achetés », mentionne le spécialiste de la fraude scientifique. L’Institut Pasteur indique sur son blog, citant une étude de la revue Science, que certaines fabriques à articles corrompent des éditeurs en payant des rédacteurs en chef pour publier leurs articles ou « pour placer leurs propres éditeurs ou reviewers dans les comités éditoriaux des journaux ». D’autres faux articles peuvent également être publiés dans des revues qui pratiquent peu ou pas de révision par les pairs.

Si des chercheurs ont recours à ces fausses publications, c’est avant tout car le système scientifique valorise la publication. « Selon le prestige du journal, le nombre de citations, et la fréquence à laquelle son travail va être réutilisé, la publication d’un chercheur lui permet d’avancer dans sa carrière, éventuellement d’obtenir des promotions, d’être recruté par d’autres universités ou dans le secteur privé », explique Baptiste Scancar.

La publication dans un journal est donc d’une importance cruciale et peut conditionner l’emploi et la carrière d’un scientifique ; certains, face à ce système, se tournent vers les fabriques à articles. Si la France est relativement peu touchée par ce phénomène, l’utilisation des paper mills est fréquente, en particulier en Chine, où les politiques de publication d’articles sont particulièrement rigoureuses.

Cette pratique remet en question la crédibilité de toute la science produite dans ce domaine, car elle jette aussi le doute sur les véritables publications sérieuses. Un vrai problème « d’un point de vue sociétal, car nous avons besoin que la science soit reconnue comme crédible », estime Baptiste Scancar. De plus, cela impacte la recherche et ses acteurs : étant donné la quantité d’articles frauduleux, « il est probable que des chercheurs s’appuient sur ces travaux pour lancer leurs propres projets, solliciter des financements, recruter des doctorants, et qu’ils se rendent compte des années plus tard que tout ce sur quoi ils avaient basé leurs travaux est en réalité sans fondement, entraînant un gaspillage colossal d’argent. »

Les faux articles ralentissent ainsi les avancées médicales. Ils peuvent également mettre en danger la vie de patients, en particulier si certaines entreprises privées ou chercheurs envisagent des essais cliniques basés sur cette recherche entièrement fictive.

Malgré ces dangers, l’écrasante majorité des 250 000 publications frauduleuses sur le cancer repérées par Baptiste Scancar est toujours accessible en ligne : seules 2 000 ont été rétractées, un processus qui a d’ailleurs peu d’impact, car ces articles peuvent continuer d’être cités, parfois même par les fabriques elles-mêmes. Un cycle sans fin qui inquiète le milieu scientifique, où l’on prévoit une aggravation de ce phénomène dans les années à venir.