High-tech

Qui est DeepSeek, le géant chinois qui ne lance pas un nouveau modèle d’IA ?

DeepSeek a annoncé ce vendredi le lancement de son nouveau modèle d’intelligence artificielle, DeepSeek-V4, disponible en deux versions, DeepSeek-V4-Pro et DeepSeek-V4-Flashest. La société a révélé que DeepSeek-V4 dispose d’un contexte ultra-long d’un million de caractères, permettant de mémoriser et comprendre des centaines de pages de texte.


DeepSeek a annoncé ce vendredi le lancement d’un nouveau modèle d’intelligence artificielle (IA) pour son agent conversationnel. Ce modèle, disponible en deux versions, DeepSeek-V4-Pro et DeepSeek-V4-Flashest, est présenté comme économique et parmi les plus performants au monde.

« DeepSeek-V4 dispose d’un contexte ultra-long d’un million de caractères », a indiqué l’entreprise, ce qui implique que ce modèle peut mémoriser et comprendre un million de caractères simultanément. Par exemple, en lui fournissant des centaines de pages de texte, soit l’équivalent de plusieurs romans, il serait capable de répondre à des questions précises concernant l’ensemble, sans rien oublier.

Cette fonctionnalité nécessite habituellement d’importantes ressources de calcul, mais DeepSeek affirme avoir rendu le processus plus rapide et moins coûteux. Les capacités de long contexte de ce nouveau modèle sont ainsi « parmi les meilleures au monde », a déclaré l’entreprise, ce vendredi. « Bienvenue dans l’ère du contexte d’un million de caractères à moindre coût », a même souligné la société sur X.

DeepSeek a été fondé en 2023 par Liang Wenfeng et est basé à Hangzhou, dans l’est de la Chine, une ville réputée pour son fort nombre d’entreprises technologiques. L’entreprise est née en tant que projet parallèle d’un fonds spéculatif ayant accès à un parc de puissants processeurs d’IA fabriqués par Nvidia, le géant américain des puces.

DeepSeek a acquis une renommée mondiale en janvier 2025, avec le lancement de son grand modèle de langage R1, doté de capacités de raisonnement approfondi. Cette annonce a provoqué une chute des actions de grandes sociétés technologiques aux États-Unis et au Japon. Les experts du secteur ont été surpris par les performances du modèle R1, qui rivalise avec celles de ChatGPT (OpenAI) et d’autres chatbots américains de premier plan.

DeepSeek a également impressionné en affirmant n’avoir dépensé que 5,6 millions de dollars pour développer son modèle, un montant dérisoire comparé aux milliards investis par les géants américains. Le capital-risqueur Marc Andreessen a qualifié cet événement de « moment Spoutnik », en référence au lancement par l’URSS, en 1957, du premier satellite artificiel, qui avait étonné le monde occidental et déclenché la course à l’espace.

Comme d’autres chatbots chinois, les outils d’IA de DeepSeek évitent les sujets généralement censurés en Chine, tels que la répression des manifestations de la place Tiananmen en 1989. Ce facteur, associé aux préoccupations concernant la confidentialité des données, a entraîné l’interdiction ou la restriction du modèle DeepSeek sur les appareils fournis par les administrations publiques de plusieurs pays, notamment les États-Unis, l’Australie et la Corée du Sud.

Son coût réduit et sa facilité de déploiement en ont cependant fait un choix privilégié dans les pays en développement, selon les experts. L’entreprise chinoise représente 4 % du marché mondial des robots conversationnels, selon Similarweb, spécialisée dans l’analyse du trafic Web. ChatGPT domine ce marché avec 68 %.

Les systèmes de DeepSeek sont en code source ouvert (open source). Cela signifie que le code de l’application est accessible à tous, permettant de comprendre son fonctionnement et aux programmeurs de le modifier en fonction de leurs besoins, contrairement aux modèles « fermés » commercialisés par l’américain OpenAI et d’autres concurrents occidentaux.

La Chine ambitionne de devenir le leader de l’intelligence artificielle d’ici 2030, avec des investissements prévus de plusieurs dizaines de milliards d’euros dans les prochaines années. Le gouvernement chinois a vanté l’avance du pays dans le domaine des technologies d’IA open source, la présentant comme un accélérateur global d’innovation.

Le succès de DeepSeek a dynamisé le paysage chinois de l’IA. Les actions de deux start-ups chinoises de premier plan dans ce secteur – Zhipu AI et MiniMax – ont fortement augmenté lors de leur introduction en bourse à Hong Kong cette année. Un scénario similaire s’est produit pour des fabricants de puces chinois comme MetaX.

Shi Yaqiong et son équipe de Jinqiu Capital, basée à Pékin, ont déclaré à l’AFP avoir constaté un « clair sursaut » d’enthousiasme autour de l’IA en Chine et une intensification de la concurrence entre investisseurs depuis le « choc DeepSeek ».

Le média spécialisé dans la technologie The Information, citant six personnes au fait du dossier, a rapporté en décembre que DeepSeek avait développé le modèle V4 en utilisant des milliers de puces démontées dans des pays tiers, puis introduites clandestinement en Chine, afin de contourner les restrictions technologiques américaines. Nvidia, mentionnée par The Information, a déclaré qu’elle n’avait aucune preuve de tels agissements et qu’« une telle contrebande (semblait) invraisemblable ».