DeepSeek, la menace chinoise sur les géants américains de l’IA
La jeune start-up chinoise d’intelligence artificielle DeepSeek a lancé, la semaine dernière, un nouveau chatbot capable de concurrencer les plus grands noms américains du secteur pour un coût au moins dix fois inférieur. DeepSeek, la start-up chinoise à l’origine du modèle de langage R1, a conçu le chatbot le plus populaire du moment, n’en déplaise aux alternatives américaines d’OpenAI, Google ou Meta
C’est le grain de sable chinois dans la mécanique bien huilée des géants américains de l’intelligence artificielle. Le modèle R1 de DeepSeek, petit poucet des chatbots chinois, est venu détrôner ChatGPT (OpenAI), Gemini (Google) et consorts en devenant l’application gratuite numéro 1 sur l’App Store d’Apple. « DeepSeek a même réussi une première pour une application chinoise : arriver, lundi 27 janvier, en top du classement à la fois sur les versions américaine et chinoise de la boutique d’applications de l’iPhone », souligne le site d’information sur la tech chinoise Pandaily.
Une prouesse qui a pris la Silicon Valley par surprise. Ce nouvel agent conversationnel a été lancé il y a une semaine… par une très jeune société. « DeepSeek a été créé il y a à peine deux ans. C’est une start-up au sujet de laquelle on ne sait que très peu de choses », souligne Guangyu Qiao-Franco, spécialiste des technologies émergentes en Chine à l’université Radboud de Nimègue (Pays-Bas).
Des talents locaux derrière R1
Cette start-up a été fondée par Liang Wenfeng, le gérant du fonds spéculatif High-Flyer qui a puisé dans ses gains boursiers afin de financer sa grande œuvre « chatbotienne ». Pour y parvenir, celui-ci a su miser sur le gratin des experts de l’intelligence artificielle : « Avec ByteDance [maison mère de TikTok, NDLR], DeepSeek est connu pour proposer les salaires les plus attractifs en Chine pour les ingénieurs du secteur de l’IA », souligne le Financial Times dans un article consacré à l’arrivée fracassante de R1 sur le marché des chatbots.
Liang Wenfeng s’est aussi appuyé sur des talents locaux pour développer son modèle de langage. « Contrairement à tant d’autres sociétés chinoises de ce secteur qui tentent de débaucher des experts à l’étranger, DeepSeek se concentre sur des jeunes ingénieurs qui viennent de sortir des universités chinoises », précise Guangyu Qiao-Franco.
Conclusion de cet effort « made in China » : R1 « arrive juste derrière Gemini 2.0 Flash Thinking (Google), le modèle o1 d’OpenAI et Claude d’Anthropic dans le test que nous avons mis au point », note Mario Krenn, directeur de recherche à l’Artificial Scientist Lab de l’Institut Max Planck en Allemagne.
Autrement dit, le nouveau venu chinois n’égale pas encore les « formule 1 » nord-américaines, mais il les talonne. R1 est en effet comparé à des chatbots dernier cri, pensés pour les professionnels et plus perfectionnés que les GPT et autres modèles de langage disponibles gratuitement ou à peu de frais.
Les Gemini 2.0 Flash Thinking ou ChatGPT o1 sont des modèles décrits comme capables de « raisonner ». « Ce sont des versions qui, la plupart du temps, produisent des réponses plus précises que les modèles disponibles pour le grand public », explique Mark Stevenson, spécialiste en informatique et modèles de langage à l’université de Sheffield. « Généralement, au lieu de fournir simplement une réponse, ces modèles ‘avancés’ sont aussi censés détailler la manière dont ils parviennent à leurs résultats », précise Anthony Cohn, professeur de raisonnement automatisé et d’intelligence artificielle à l’université de Leeds et à l’Institut Alan Turing.
DeepSeek n’est donc pas le Temu ou Shein de l’intelligence artificielle, c’est-à-dire la version à bas coût et de moins bonne qualité d’un service ou produit similaire fabriqué dans un pays occidental.
Guerre des prix
Cependant, le modèle de langage chinois partage une caractéristique avec ces sociétés « low-cost » chinoises : des tarifs très compétitifs. « Je peux payer jusqu’à 300 euros [la session, NDLR] pour faire tourner certaines versions professionnelles des modèles nord-américains afin de faire des comparaisons, alors que faire de même avec DeepSeek ne m’a coûté que 10 euros », a constaté Mario Krenn.
DeepSeek a précisé qu’entraîner – c’est-à-dire laisser l’IA « apprendre » en avalant des bases des données – un de ses derniers modèles de langage n’avait coûté que 5,6 millions de dollars contre plusieurs centaines de milliards de dollars pour les modèles en vogue dans la Silicon Valley, précise le Wall Street Journal.
Comment est-ce possible ? C’est la question à plusieurs milliards. Plusieurs hypothèses ont été émises. « Il semblerait que DeepSeek a trouvé un moyen d’obtenir des bons résultats sans renforcement et validation humaines », souligne Mark Stevenson. Tous les grands modèles d’IA affinent leurs résultats en faisant intervenir des humains afin d’éviter, par exemple, des dérapages racistes. DeepSeek aurait trouvé une formule sans l’intervention coûteuse d’humains, suggère le Financial Times. Mais la jeune pousse chinoise n’a rien confirmé.
Une autre possibilité serait que « DeepSeek obtienne des résultats étonnamment bons en utilisant une profondeur et une précision de calcul moins importantes que ses concurrents américains ou européens », note Anthony Cohn.
Le nouveau venu chinois vient également narguer les alternatives occidentales en proposant un chatbot « open source » (« source ouverte »), c’est-à-dire dont le code source peut être adapté et certains aspects modifiés librement. Un sacré pied de nez à OpenAI ou Google dont la recette de l’IA est jalousement gardé à l’abri des regards extérieurs. Pour Yann Le Cun, le scientifique en chef de l’IA chez Meta (maison mère de Facebook), le succès de DeepSeek-R1 « prouve la supériorité des modèles en open source sur les modèles propriétaires ».
Un « impact colossal » sur OpenAI et les autres ?
Moins cher, en open source et en top des téléchargements sur l’App Store ? La sanction pour la Big Tech ne s’est pas fait attendre : les actions de Microsoft, Google, Meta ont baissé en Bourse ces derniers jours. Nvidia, le champion américain des puces électroniques optimisées pour l’IA, a même perdu plus de 12 % lundi en début de journée.
L’IA de DeepSeek « peut avoir un impact colossal sur l’écosystème nord-américain des modèles de langage », affirme Alexandre Baradez, analyste financier pour le courtier en Bourse IG France.
OpenAI et les autres dépensent des milliards et facturent assez cher leurs solutions, ce qui « était parfaitement accepté par les investisseurs tant qu’ils avaient l’impression qu’il n’y avait pas d’alternative à bas coût valable », assure Alexandre Baradez. Mais maintenant que DeepSeek agite R1 sous le nez des ces financiers, « ils peuvent se demander s’ils ne sont pas en train de payer trop cher les actions des groupes nord-américains », affirme l’analyste.
Pour lui, il faut s’attendre à une « correction à la baisse en Bourse pour toutes ces valeurs américaines pendant encore quelques jours ». Alexandre Baradez craint même que DeepSeek puisse devenir éminemment politique : « On a vu avec la Colombie et le Groenland que Donald Trump pouvait rapidement durcir le ton et proférer des menaces. Qu’est-ce que cela va être si les géants de la tech viennent lui demander de les protéger de la menace chinoise ? »
En Chine, le phénomène DeepSeek a déjà été récupéré par le pouvoir politique. Liang Wenfeng est devenu une sorte de « héros national », souligne le Financial Times. Le fondateur de DeepSeek a ainsi été le seul PDG d’une entreprise d’IA à être convié à une réunion, le 20 janvier, entre le Premier ministre Li Qiang et des chefs d’entreprise.
Un motif de fierté pour Pékin
« Jusqu’à l’émergence de ChatGPT, la Chine croyait qu’elle jouait dans la même ligue que les États-Unis en matière d’intelligence artificielle. L’arrivée de larges modèles de langage a entamé leur assurance, car les Chinois n’avaient pas réellement de concurrent à la hauteur de ChatGPT. Mais avec DeepSeek, les autorités peuvent de nouveau espérer », résume Guangyu Qiao-Franco.
Et le Big Brother chinois n’est jamais très loin. Ainsi, censure chinoise oblige, Deepseek-R1 n’aime pas qu’on lui pose des questions sur la répression sanglante du mouvement étudiant sur la place Tiananmen en 1989, ont noté des internautes. Il refuse également de répondre à des questions sur la vie privée de Xi Jinping. Un frein au succès de DeepSeek à l’international ? « C’est sûr qu’on va y penser en l’utilisant… Mais est-ce qu’on sait ce qu’OpenAI ou les autres censurent dans leurs bases de données ? », s’interrogent les experts joints par France 24.
C’est d’autant plus marquant que « DeepSeek a réussi à créer son outil alors même que les États-Unis interdisent l’exportation vers la Chine de certains composants essentiels, comme certaines puces électroniques », note Anthony Cohn. « C’est un signe qui indique que la Chine peut trouver des solutions créatives pour contourner ces restrictions. Cela va redonner confiance au secteur chinois de l’IA, même si ces restrictions américaines sont un frein réel », conclut Guangyu Qiao-Franco.
*************
************