Reddit poursuit une entreprise d’IA pour des raisons précises.
Reddit intente une action en justice contre Perplexity ainsi que trois autres entreprises pour scraping de données. Selon Reddit, Oxylabs UAB, AWMProxy et SerpApi auraient collaboré avec Perplexity pour créer du scraping « à échelle industrielle ».

Reddit exprime un nouveau mécontentement à l’égard des intelligences artificielles. Après avoir manifesté son indignation face aux pratiques de récupération de données de Microsoft, l’entreprise cible désormais Perplexity. D’après Neowin, la plateforme communautaire a introduit une plainte contre Perplexity ainsi que trois autres sociétés pour scraping de données.
Pour aller plus loin
Intelligence artificielle : cette start-up aspire tellement de données que les sites doivent réagir
Une pratique « à échelle industrielle »
Pour Reddit, Oxylabs UAB, AWMProxy et SerpApi auraient collaboré avec Perplexity pour produire un scraping « à échelle industrielle ». Dans sa plainte, la plateforme affirme avoir tendu un piège dans lequel ces entreprises seraient tombées. Elles contournent délibérément le fichier Robots.txt qui indique les pages autorisées ou non à être annexées. Une méthodologie qu’elle juge digne d’un « hacker nord-coréen », selon Reddit. De plus, la plateforme souligne que le modèle de langage (LLM) n’a « rien de révolutionnaire ».
En d’autres termes, le modèle économique de Perplexity consiste à récupérer le contenu Reddit des résultats de recherche Google, à l’intégrer dans un LLM tiers et à le présenter comme un nouveau produit.
Extrait de la plainte de Reddit contre Perplexity
Une pratique familière
Cette méthode semble profondément enracinée dans l’identité de Perplexity. En août dernier, Cloudflare avait déjà mis en lumière la capacité de la plateforme à voler des données. Perplexity avait alors qualifié cette étude de « baratin commercial ». Neowin rappelle également qu’en 2024, Perplexity s’était engagée auprès de Reddit à respecter le fichier Robots.txt suite à une mise en demeure.
Le passage au tribunal pourrait éventuellement freiner une pratique courante chez les modèles de langage. Pour Reddit, l’objectif de cette plainte est de mettre un terme à ces agissements et de récupérer tous les « gains mal acquis » ainsi obtenus.
Pour aller plus loin
OpenAI (ChatGPT) admet qu’il faut voler du contenu pour créer une IA

