La Chine en retard sur les LLM : peut-elle encore gagner la course à l’IA ?

La Chine produit des modèles d’IA à grande vitesse. Pourtant, selon Liu Wei, ancien responsable de l’IA chez Tencent, le pays passe à côté de l’essentiel. Sans innovations de rupture, les entreprises chinoises risquent de rester éternellement suiveuses dans la course aux grands modèles de langage – avec toutes les fragilités que cela implique.

En bref

Liu Wei, ex-directeur de l’équipe Hunyuan chez Tencent, tire la sonnette d’alarme sur le retard chinois en matière d’innovation IA fondamentale.
Les entreprises chinoises copient DeepSeek ou les acteurs américains, sans créer de véritable rupture technologique.
Les benchmarks publics masquent un écart réel d’utilité pratique entre les LLM chinois et américains.

Un départ qui interroge sur l’état de l’IA chinoise

Liu Wei a passé plus de huit ans chez Tencent. Il y dirigeait l’équipe Hunyuan, l’unité dédiée aux modèles fondamentaux d’IA générative du géant de Shenzhen. Son départ fin 2024, à peine un an après le lancement de Hunyuan, a immédiatement suscité des questions.

Pourquoi quitter l’une des entreprises technologiques les mieux financées de Chine si tôt dans le boom de l’IA ? La réponse de Liu est directe : il cherche à travailler sur de vraies ruptures, pas à suivre une voie déjà tracée par d’autres.

Chiffres clés

Plus de 8 ans passés par Liu Wei chez Tencent avant son départ fin 2024.
Hunyuan, le modèle fondamental de Tencent, lancé seulement 1 an avant sa démission.
DeepSeek V4, dernier modèle en date du leader chinois, n’a pas atteint le niveau d’impact de ses versions précédentes.
Anthropic a lancé son modèle Mythos en avril, repoussant à nouveau la frontière technique côté américain.

Contexte

Les grands modèles de langage (LLM) sont des systèmes d’IA entraînés sur d’immenses volumes de données pour comprendre et générer du texte – ChatGPT d’OpenAI en est l’exemple le plus connu.
DeepSeek, entreprise chinoise, a créé la surprise début 2024 avec un modèle très performant et bien moins coûteux à entraîner que ses concurrents américains.
Les benchmarks sont des tests standardisés pour mesurer les performances des IA – mais ils ne reflètent pas toujours leur utilité réelle dans des cas concrets.

Skyline de Shenzhen, siège de Tencent et des géants technologiques chinois — Shenzhen, capitale technologique de la Chine, abrite Tencent et de nombreux acteurs de l’IA. *(image générée avec IA Gemini)*

Le concept de « fanshi » : là où la Chine décroche vraiment

Liu Wei revient sans cesse sur un mot : « fanshi ». Ce terme chinois signifie « paradigme ». En recherche IA, il désigne une percée technique qui redéfinit toute une ère d’innovations. ChatGPT d’OpenAI ou Claude Code d’Anthropic en sont les exemples les plus récents.

Or, selon Liu, la Chine n’a pas produit de fanshi. Les entreprises chinoises, dit-il, copient soit DeepSeek, soit les acteurs américains. Cette imitation concerne le cœur même de la technologie : le développement des LLM. C’est précisément ce retard-là qui l’inquiète – pas la quantité de modèles produits, mais leur nature.

Des benchmarks flatteurs qui cachent un écart persistant

Depuis l’émergence de DeepSeek début 2024, une question revient régulièrement : les LLM chinois ont-ils rattrapé leurs rivaux américains ? Les scores sur les benchmarks publics semblent parfois le suggérer. Liu relativise fortement cette lecture.

Les performances sur des tests standardisés ne reflètent pas l’utilité réelle d’un modèle dans des situations concrètes. L’écart entre les leaders américains et leurs homologues chinois reste significatif sur le terrain, même s’il est moins visible sur le papier. C’est une distinction importante : un modèle peut scorer haut sur un benchmark et rester limité pour des usages professionnels avancés.

Pendant ce temps, les États-Unis repoussent encore la frontière

En avril 2025, Anthropic a lancé Mythos. Ce nouveau modèle a été salué comme une nouvelle avancée technique majeure. Les acteurs américains continuent d’innover à un rythme soutenu, en définissant eux-mêmes les règles du jeu.

De l’autre côté, DeepSeek, pourtant considéré comme le fer de lance de l’IA chinoise, n’a pas réussi à reproduire l’impact de ses premiers modèles avec sa version V4. Le momentum semble marquer le pas. Ce décrochage relatif renforce l’hypothèse que le retard chinois n’est pas comblé – il est simplement moins visible.

Le risque stratégique d’être un suiveur technologique

Pour Liu, le vrai danger ne se situe pas dans les benchmarks. Il est structurel. Un pays technologiquement suiveur court un risque permanent : celui de se voir couper l’herbe sous le pied si le leader change de paradigme. C’est exactement ce que le terme fanshi illustre.

Quand une rupture technologique redéfinit les règles, le suiveur doit tout recommencer. Il perd l’avantage accumulé. Dans un secteur qui évolue aussi vite que l’IA, ce risque est concret et immédiat. Ce n’est pas une menace abstraite.

Écran affichant des benchmarks comparatifs de modèles d'IA chinois et américains — Les benchmarks publics masquent souvent l’écart réel entre les LLM chinois et américains. *(image générée avec IA Gemini)*

La Chine peut encore gagner – mais sur d’autres terrains

Liu ne tire pas de conclusions définitives sur l’avenir. Il estime que la Chine peut encore remporter la course à l’IA – mais pas en cherchant à imiter mieux et plus vite. Le pays devra trouver ses propres fanshi, ses propres ruptures. C’est là que se joue la vraie compétition.

Cette conviction semble avoir guidé son départ de Tencent. Travailler dans une grande entreprise qui optimise des modèles existants n’est pas la même chose que chercher le prochain saut technologique. Liu a choisi la seconde voie.

Ce qu’il faut retenir

La Chine produit beaucoup de modèles d’IA, mais sans véritable rupture technologique originale.
Les scores des benchmarks publics masquent un écart réel d’utilité pratique avec les LLM américains.
DeepSeek V4 n’a pas reproduit l’impact de ses prédécesseurs, signe d’un essoufflement possible.
Être un suiveur technologique expose à un risque stratégique majeur si le paradigme change.
Liu Wei parie sur la nécessité pour la Chine de produire ses propres percées fondamentales.

L’avertissement d’un initié à prendre au sérieux

Le discours de Liu Wei n’est pas celui d’un observateur extérieur. Il vient de l’intérieur de l’industrie, après des années à construire l’un des principaux modèles d’IA de Chine. Son diagnostic est sévère mais précis : la quantité ne remplace pas la rupture. Et dans la course à l’IA, ce sont les ruptures qui font les gagnants.

Et vous, pensez-vous que la Chine peut encore produire sa propre révolution IA, ou restera-t-elle durablement dans l’ombre des États-Unis ? Donnez votre avis en commentaire.

Sources : South China Morning Post

(Les illustrations de cet article ont été générées avec Gemini)

Qu'est-ce qu'un LLM et pourquoi est-il au cœur de la course à l'IA ?

Un grand modèle de langage (LLM) est un système d’IA entraîné sur d’immenses volumes de texte pour comprendre et générer du langage humain. ChatGPT d’OpenAI en est l’exemple le plus connu. Ces modèles sont au centre de la compétition mondiale car ils constituent la brique fondamentale de la plupart des applications d’IA générative actuelles.

Pourquoi le départ de Liu Wei de Tencent est-il significatif ?

Liu Wei dirigeait l’équipe Hunyuan, l’unité de modèles fondamentaux de Tencent, l’un des géants technologiques les mieux financés de Chine. Son départ moins d’un an après le lancement du modèle soulève des questions sur la direction stratégique de l’IA chinoise et sur la capacité des grandes entreprises à attirer les talents qui cherchent à innover plutôt qu’à optimiser.

Qu'est-ce que le concept de 'fanshi' et pourquoi est-il important ?

« Fanshi » signifie « paradigme » en chinois. Dans le domaine de l’IA, ce terme désigne une percée technologique qui redéfinit toute une ère d’innovations. ChatGPT ou Claude Code d’Anthropic en sont des exemples récents. Selon Liu Wei, la Chine n’a pas encore produit ce type de rupture fondamentale – elle adapte et copie plutôt qu’elle n’invente.

Les modèles d'IA chinois ont-ils vraiment rattrapé les modèles américains ?

Les scores sur les benchmarks publics semblent parfois le suggérer. Mais selon Liu Wei, ces tests standardisés ne reflètent pas l’utilité réelle des modèles dans des situations concrètes. L’écart reste significatif sur le terrain. Par ailleurs, DeepSeek V4 n’a pas reproduit l’impact de ses prédécesseurs, tandis qu’Anthropic a lancé un nouveau modèle de pointe en avril 2025.

Intelligence artificielle

La Chine en retard sur les LLM : peut-elle encore gagner la course à l’IA ?

Un départ qui interroge sur l’état de l’IA chinoise

Le concept de « fanshi » : là où la Chine décroche vraiment

Des benchmarks flatteurs qui cachent un écart persistant

Pendant ce temps, les États-Unis repoussent encore la frontière

Le risque stratégique d’être un suiveur technologique

La Chine peut encore gagner – mais sur d’autres terrains

L’avertissement d’un initié à prendre au sérieux

Pierre Woo

WAIC 2025 : la Chine affiche ses ambitions en IA devant un parterre record

Z.ai construit un datacenter d’1 gigawatt avec des puces chinoises et son action bondit de 37 %

Chine : première grande économie à réguler les relations amoureuses avec l’IA

WAIC 2025 : la Chine déploie ses agents IA pour conquérir les entreprises mondiales

SenseTime mise sur la « task economy » : quand l’IA facture les tâches, pas les tokens

Kimi K3 : la Chine rattrape l’IA américaine, mais se heurte à ses propres limites

Laisser un commentaire

Articles récents

WAIC 2025 : la Chine affiche ses ambitions en IA devant un parterre record

Volkswagen mise sur la conduite autonome en Chine pour rattraper BYD et Xpeng

Z.ai construit un datacenter d’1 gigawatt avec des puces chinoises et son action bondit de 37 %

Articles les plus commentés

Des faux diplômes français vendus sur un site chinois

Faux diplome pas cher en Chine

Comment aller à Hong-Kong sans trop dépenser

Chinecroissance

A propos