L’IA chinoise à bas coût s’impose malgré les tensions géopolitiques
La part des modèles chinois dans les travaux effectués par IA est passée de 1,2% fin 2024 à plus de 30% début août au niveau mondial, selon un rapport publié début décembre par la plateforme OpenRouter et la société de capital-investissement Andreessen Horowitz. Selon une étude publiée en début de semaine, des chercheurs de l’université de Stanford suggèrent « que la nature même des modèles ouverts permet un examen plus approfondi » de leur structure.
Programmeurs et entrepreneurs s’intéressent de plus en plus aux nombreux modèles chinois d’intelligence artificielle (IA) disponibles en libre accès, les préférant à des concurrents américains plus coûteux, malgré le contexte tendu entre les États-Unis et la Chine. La part des modèles chinois dans les travaux réalisés par IA a augmenté, passant de 1,2 % fin 2024 à plus de 30 % début août au niveau mondial, selon un rapport publié début décembre par la plateforme OpenRouter et la société de capital-investissement Andreessen Horowitz.
L’arrivée, mi-janvier, du R1 de la société chinoise DeepSeek, dont les performances rivalisent avec les meilleurs modèles américains, a suscité une prise de conscience brusque quant à la maturité de la Chine dans le domaine de l’intelligence artificielle générative. DeepSeek-R1 était, comme bon nombre des logiciels chinois d’IA, un LLM (large language model), téléchargeable gratuitement et partiellement modifiable (open weight), en opposition au GPT d’OpenAI – sur lequel repose ChatGPT – ou Gemini de Google. « La principale raison pour laquelle le monde choisit de plus en plus les modèles chinois est qu’ils sont bon marché, parfois gratuits, et fonctionnent bien », déclare Wang Wen, de l’université Renmin à Pékin.
Un entrepreneur américain, s’exprimant sous couvert d’anonymat, affirme qu’il parvient à faire économiser 400 000 dollars par an à son entreprise grâce aux modèles Qwen développés par le géant chinois du commerce en ligne, Alibaba. « Si vous avez besoin de la technologie la plus avancée, vous revenez aux OpenAI, Anthropic ou Google. Mais pour la plupart des applications, ce n’est pas nécessaire », explique ce dirigeant, qui travaille sur deux produits, l’un dans le domaine musical, l’autre dans le secteur vidéo. Qwen a été adopté par Perplexity – concurrent de Google sur la recherche – Nvidia, ou encore l’université californienne de Stanford.
En plus de DeepSeek et Qwen, Z.ai (GLM) et MiniMax ont également les faveurs des développeurs du monde entier. La nouvelle version de Kimi K2 de la start-up Moonshot, lancée en novembre, a même démontré une avancée dans le domaine des agents IA, qui était jusqu’alors considéré comme un point faible des modèles chinois.
Dans sa feuille de route publiée début juillet, le gouvernement de Donald Trump se disait favorable à une IA américaine « open weight » et même « open source » (tout le programme en accès libre), mais les grandes entreprises du secteur n’ont pas suivi cette tendance. Meta, principal acteur américain dans ce domaine jusqu’alors, a mis de côté ses modèles Llama pour se concentrer sur une IA fermée. Début août, OpenAI a mis en ligne deux modèles « open weight » GPT-oss, mais n’en avait pas publié depuis six ans.
Parmi les entreprises occidentales significatives, seul le français Mistral reste sur la voie de l’open source, mais se positionne loin derrière DeepSeek et Qwen selon l’étude d’OpenRouter sur les modèles libres les plus populaires. « Ils sortent des produits moins régulièrement et avec moins de formats différents », souligne l’entrepreneur, pour qui « ce n’est pas aussi intéressant » que les concurrents chinois, soutenus par Pékin, même si le modèle économique de l’open source demeure incertain.
Mark Barton, patron du cabinet de conseil Omniux, envisage d’utiliser Qwen, mais admet que certains clients pourraient ne pas se sentir à l’aise avec l’idée de travailler avec un modèle chinois, même s’il est utilisé pour des tâches très spécifiques. « Compte tenu de la position du gouvernement Trump sur les entreprises technologiques chinoises, (…) nous ne voudrions pas mettre tous nos œufs dans le même panier », avance-t-il. « Parce que si des sanctions sont imposées à l’entreprise, vous ne voulez pas vous retrouver piégé. »
Cependant, Paul Triolo, associé au sein du cabinet de conseil DGA-Albright Stonebridge Group, estime que la sécurité des données n’est pas un « problème essentiel, (…) dans la mesure où les entreprises peuvent exécuter le modèle sur leurs propres équipements, sans aucune connexion avec la Chine. » Par ailleurs, dans une étude publiée en début de semaine, des chercheurs de l’université de Stanford suggèrent que « la nature même des modèles ouverts permet un examen plus approfondi » de leur structure. « La transparence et le partage qu’impliquent l’open source sont les meilleurs moyens de bâtir la confiance », renchérit Gao Fei, responsable technologique de la plateforme IA BOK Health.
Pour les chercheurs de Stanford, « la large adoption des modèles chinois pourrait redéfinir l’accès à la technologie et les interdépendances », tout en « impactant la gouvernance de l’IA, la sécurité et la concurrence ».

