La Chine en retard sur les LLM : peut-elle encore gagner la course à l’IA ?

La Chine en retard sur les LLM : peut-elle encore gagner la course à l’IA ?

La Chine produit des modèles d’IA à grande vitesse. Pourtant, selon Liu Wei, ancien responsable de l’IA chez Tencent, le pays passe à côté de l’essentiel. Sans innovations de rupture, les entreprises chinoises risquent de rester éternellement suiveuses dans la course aux grands modèles de langage – avec toutes les fragilités que cela implique.

En bref

  • Liu Wei, ex-directeur de l’équipe Hunyuan chez Tencent, tire la sonnette d’alarme sur le retard chinois en matière d’innovation IA fondamentale.
  • Les entreprises chinoises copient DeepSeek ou les acteurs américains, sans créer de véritable rupture technologique.
  • Les benchmarks publics masquent un écart réel d’utilité pratique entre les LLM chinois et américains.

Un départ qui interroge sur l’état de l’IA chinoise

Liu Wei a passé plus de huit ans chez Tencent. Il y dirigeait l’équipe Hunyuan, l’unité dédiée aux modèles fondamentaux d’IA générative du géant de Shenzhen. Son départ fin 2024, à peine un an après le lancement de Hunyuan, a immédiatement suscité des questions.

Pourquoi quitter l’une des entreprises technologiques les mieux financées de Chine si tôt dans le boom de l’IA ? La réponse de Liu est directe : il cherche à travailler sur de vraies ruptures, pas à suivre une voie déjà tracée par d’autres.

Chiffres clés

  • Plus de 8 ans passés par Liu Wei chez Tencent avant son départ fin 2024.
  • Hunyuan, le modèle fondamental de Tencent, lancé seulement 1 an avant sa démission.
  • DeepSeek V4, dernier modèle en date du leader chinois, n’a pas atteint le niveau d’impact de ses versions précédentes.
  • Anthropic a lancé son modèle Mythos en avril, repoussant à nouveau la frontière technique côté américain.
Contexte

  • Les grands modèles de langage (LLM) sont des systèmes d’IA entraînés sur d’immenses volumes de données pour comprendre et générer du texte – ChatGPT d’OpenAI en est l’exemple le plus connu.
  • DeepSeek, entreprise chinoise, a créé la surprise début 2024 avec un modèle très performant et bien moins coûteux à entraîner que ses concurrents américains.
  • Les benchmarks sont des tests standardisés pour mesurer les performances des IA – mais ils ne reflètent pas toujours leur utilité réelle dans des cas concrets.
Skyline de Shenzhen, siège de Tencent et des géants technologiques chinois
Shenzhen, capitale technologique de la Chine, abrite Tencent et de nombreux acteurs de l’IA. (image générée avec IA Gemini)

Le concept de « fanshi » : là où la Chine décroche vraiment

Liu Wei revient sans cesse sur un mot : « fanshi ». Ce terme chinois signifie « paradigme ». En recherche IA, il désigne une percée technique qui redéfinit toute une ère d’innovations. ChatGPT d’OpenAI ou Claude Code d’Anthropic en sont les exemples les plus récents.

Or, selon Liu, la Chine n’a pas produit de fanshi. Les entreprises chinoises, dit-il, copient soit DeepSeek, soit les acteurs américains. Cette imitation concerne le cœur même de la technologie : le développement des LLM. C’est précisément ce retard-là qui l’inquiète – pas la quantité de modèles produits, mais leur nature.

Des benchmarks flatteurs qui cachent un écart persistant

Depuis l’émergence de DeepSeek début 2024, une question revient régulièrement : les LLM chinois ont-ils rattrapé leurs rivaux américains ? Les scores sur les benchmarks publics semblent parfois le suggérer. Liu relativise fortement cette lecture.

Les performances sur des tests standardisés ne reflètent pas l’utilité réelle d’un modèle dans des situations concrètes. L’écart entre les leaders américains et leurs homologues chinois reste significatif sur le terrain, même s’il est moins visible sur le papier. C’est une distinction importante : un modèle peut scorer haut sur un benchmark et rester limité pour des usages professionnels avancés.

Pendant ce temps, les États-Unis repoussent encore la frontière

En avril 2025, Anthropic a lancé Mythos. Ce nouveau modèle a été salué comme une nouvelle avancée technique majeure. Les acteurs américains continuent d’innover à un rythme soutenu, en définissant eux-mêmes les règles du jeu.

De l’autre côté, DeepSeek, pourtant considéré comme le fer de lance de l’IA chinoise, n’a pas réussi à reproduire l’impact de ses premiers modèles avec sa version V4. Le momentum semble marquer le pas. Ce décrochage relatif renforce l’hypothèse que le retard chinois n’est pas comblé – il est simplement moins visible.

Le risque stratégique d’être un suiveur technologique

Pour Liu, le vrai danger ne se situe pas dans les benchmarks. Il est structurel. Un pays technologiquement suiveur court un risque permanent : celui de se voir couper l’herbe sous le pied si le leader change de paradigme. C’est exactement ce que le terme fanshi illustre.

Quand une rupture technologique redéfinit les règles, le suiveur doit tout recommencer. Il perd l’avantage accumulé. Dans un secteur qui évolue aussi vite que l’IA, ce risque est concret et immédiat. Ce n’est pas une menace abstraite.

Écran affichant des benchmarks comparatifs de modèles d'IA chinois et américains
Les benchmarks publics masquent souvent l’écart réel entre les LLM chinois et américains. (image générée avec IA Gemini)

La Chine peut encore gagner – mais sur d’autres terrains

Liu ne tire pas de conclusions définitives sur l’avenir. Il estime que la Chine peut encore remporter la course à l’IA – mais pas en cherchant à imiter mieux et plus vite. Le pays devra trouver ses propres fanshi, ses propres ruptures. C’est là que se joue la vraie compétition.

Cette conviction semble avoir guidé son départ de Tencent. Travailler dans une grande entreprise qui optimise des modèles existants n’est pas la même chose que chercher le prochain saut technologique. Liu a choisi la seconde voie.

Ce qu’il faut retenir

  • La Chine produit beaucoup de modèles d’IA, mais sans véritable rupture technologique originale.
  • Les scores des benchmarks publics masquent un écart réel d’utilité pratique avec les LLM américains.
  • DeepSeek V4 n’a pas reproduit l’impact de ses prédécesseurs, signe d’un essoufflement possible.
  • Être un suiveur technologique expose à un risque stratégique majeur si le paradigme change.
  • Liu Wei parie sur la nécessité pour la Chine de produire ses propres percées fondamentales.

L’avertissement d’un initié à prendre au sérieux

Le discours de Liu Wei n’est pas celui d’un observateur extérieur. Il vient de l’intérieur de l’industrie, après des années à construire l’un des principaux modèles d’IA de Chine. Son diagnostic est sévère mais précis : la quantité ne remplace pas la rupture. Et dans la course à l’IA, ce sont les ruptures qui font les gagnants.

Et vous, pensez-vous que la Chine peut encore produire sa propre révolution IA, ou restera-t-elle durablement dans l’ombre des États-Unis ? Donnez votre avis en commentaire.

Sources : South China Morning Post

(Les illustrations de cet article ont été générées avec Gemini)
Qu'est-ce qu'un LLM et pourquoi est-il au cœur de la course à l'IA ?
Un grand modèle de langage (LLM) est un système d’IA entraîné sur d’immenses volumes de texte pour comprendre et générer du langage humain. ChatGPT d’OpenAI en est l’exemple le plus connu. Ces modèles sont au centre de la compétition mondiale car ils constituent la brique fondamentale de la plupart des applications d’IA générative actuelles.
Pourquoi le départ de Liu Wei de Tencent est-il significatif ?
Liu Wei dirigeait l’équipe Hunyuan, l’unité de modèles fondamentaux de Tencent, l’un des géants technologiques les mieux financés de Chine. Son départ moins d’un an après le lancement du modèle soulève des questions sur la direction stratégique de l’IA chinoise et sur la capacité des grandes entreprises à attirer les talents qui cherchent à innover plutôt qu’à optimiser.
Qu'est-ce que le concept de 'fanshi' et pourquoi est-il important ?
« Fanshi » signifie « paradigme » en chinois. Dans le domaine de l’IA, ce terme désigne une percée technologique qui redéfinit toute une ère d’innovations. ChatGPT ou Claude Code d’Anthropic en sont des exemples récents. Selon Liu Wei, la Chine n’a pas encore produit ce type de rupture fondamentale – elle adapte et copie plutôt qu’elle n’invente.
Les modèles d'IA chinois ont-ils vraiment rattrapé les modèles américains ?
Les scores sur les benchmarks publics semblent parfois le suggérer. Mais selon Liu Wei, ces tests standardisés ne reflètent pas l’utilité réelle des modèles dans des situations concrètes. L’écart reste significatif sur le terrain. Par ailleurs, DeepSeek V4 n’a pas reproduit l’impact de ses prédécesseurs, tandis qu’Anthropic a lancé un nouveau modèle de pointe en avril 2025.

Pierre Woo

Je m'appelle Pierre, diplômé d'un MBA en affaires internationales. Je suis passionné par la Chine. J'ai étudié et travaillé dans l'empire du milieu pendant plusieurs années. Cette expérience a non seulement approfondi ma compréhension de la Chine moderne, mais elle m'a aussi permis de saisir les nuances complexes de son économie en rapide évolution.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *