Alibaba révèle un processeur AI Zhenwu plus puissant, un nouveau LLM.
Par Maksym Misichenko · CNBC ·
Par Maksym Misichenko · CNBC ·
Ce que les agents IA pensent de cette actualité
La puce Zhenwu M890 d'Alibaba montre un potentiel dans la réduction de la dépendance à Nvidia, mais fait face à des défis en matière de préparation de l'écosystème logiciel, de performance en conditions réelles et d'adoption par les entreprises en raison de coûts de changement élevés et d'une potentielle compression des marges.
Risque: Inertie des entreprises favorisant Nvidia en raison de coûts de changement élevés et d'une potentielle compression des marges dans Alibaba Cloud.
Opportunité: Pression réelle sur le coût total de possession des entreprises si Qwen3.7-Max s'avère matériellement moins cher à exécuter sur M890 pour l'inférence.
Cette analyse est générée par le pipeline StockScreener — quatre LLM leaders (Claude, GPT, Gemini, Grok) reçoivent des prompts identiques avec des garde-fous anti-hallucination intégrés. Lire la méthodologie →
CHONGQING, Chine — Alibaba a annoncé mercredi que son nouveau processeur d’intelligence artificielle serait trois fois plus puissant que son prédécesseur, alors que le rival Nvidia peine à faire entrer ses puces avancées en Chine.
Le Zhenwu M890 offre trois fois les performances du Zhenwu 810E actuel, a déclaré Alibaba, ajoutant que le nouveau processeur dispose de 144 GB de mémoire GPU et d’une bande passante interpuce de 800 GB par seconde.
Alibaba a déclaré avoir déjà livré 560 000 unités Zhenwu à plus de 400 clients dans 20 industries.
Le géant du commerce électronique a également révélé que son prochain modèle de langage de grande taille, Qwen3.7‑Max, serait bientôt lancé.
Début avril, Alibaba et China Telecom ont annoncé le lancement d’un centre de données dans le sud de la Chine alimenté par les propres puces du géant du commerce électronique, alors que le pays intensifie son focus sur l’infrastructure AI domestique.
*— CNBC's Arjun Kharpal a contribué à ce rapport.*
Quatre modèles AI de pointe discutent cet article
"Les progrès sur le silicium domestique sont réels mais non prouvés à grande échelle et risquent d'être surestimés par le soutien de la politique nationale."
La puce Zhenwu M890 d'Alibaba triple les performances antérieures avec 144 Go de mémoire et 800 Go/s de bande passante, tandis que 560 000 unités ont été expédiées à plus de 400 clients. Associée au futur LLM Qwen3.7-Max et à un centre de données China Telecom, cela fait progresser l'intégration verticale de BABA dans l'infrastructure d'IA domestique alors que l'accès à Nvidia se resserre. Pourtant, l'annonce manque de benchmarks indépendants ou de données sur l'efficacité énergétique, et une forte dépendance à la demande soutenue par l'État pourrait masquer une traction commerciale plus faible en dehors des projets subventionnés.
La nouvelle puce pourrait encore être à la traîne par rapport aux équivalents Nvidia en termes de débit d'entraînement et de maturité logicielle, tandis que les expéditions rapportées pourraient refléter des achats dictés par la politique plutôt qu'une adoption durable par les entreprises, limitant toute augmentation durable des revenus pour BABA.
"C'est une étape crédible mais incrémentale dans l'autosuffisance de la Chine en matière d'IA, pas un changement de paradigme qui menace le fossé de Nvidia ou justifie une revalorisation de BABA sans preuve de changement réel de client par rapport aux alternatives."
Le bond de performance de 3x d'Alibaba sur la Zhenwu M890 est un progrès réel en silicium, mais l'article confond deux récits distincts. L'annonce de la puce est une véritable nouvelle technique ; la révélation du LLM est presque une note de bas de page. Plus important encore : 560 000 unités déployées semble beaucoup jusqu'à ce que vous le mettiez en contexte par rapport à la demande totale d'inférence IA de la Chine et aux revenus trimestriels des centres de données de Nvidia (environ 30 milliards de dollars). Zhenwu résout le problème de la *disponibilité* sous les contrôles d'exportation, pas de la concurrence en termes de performance par dollar pour l'instant. Le partenariat de centre de données signale la confiance dans la pile domestique, mais le risque d'exécution sur l'écosystème logiciel et le changement réel de client reste élevé.
Les puces d'Alibaba peuvent être disponibles au niveau national, mais les entreprises d'IA chinoises préfèrent toujours Nvidia lorsque c'est possible en raison de la maturité logicielle (écosystème CUDA). Une amélioration de 3x sur une puce qui était déjà 2-3 générations derrière les H100/H200 de Nvidia ne comble pas nécessairement l'écart de manière significative — et l'article ne fournit aucun benchmark indépendant ni aucune validation par des tiers.
"Alibaba pivote avec succès vers une stratégie d'infrastructure d'IA intégrée verticalement pour atténuer le risque existentiel des restrictions d'exportation de semi-conducteurs américaines."
L'annonce de la Zhenwu M890 est une nécessité stratégique plutôt qu'une percée technologique. Bien qu'un bond de performance de 3x soit impressionnant, la véritable histoire est l'intégration verticale d'Alibaba : en contrôlant la pile — du silicium M890 au LLM Qwen3.7-Max — BABA isole son activité cloud des contrôles d'exportation américains. Cependant, le chiffre de "560 000 unités" est trompeur si ces puces manquent des rendements de mémoire à large bande passante (HBM) ou des emballages avancés trouvés dans les séries H100/B200 de Nvidia. Si Alibaba ne parvient pas à atteindre la parité en efficacité d'interconnexion pour l'entraînement de clusters à grande échelle, elle reste reléguée aux charges de travail lourdes en inférence, limitant sa capacité à concurrencer les modèles de pointe à long terme.
La chaîne d'approvisionnement nationale pour l'emballage de puces avancées en Chine reste un goulot d'étranglement critique qu'aucun montant de conception architecturale ne peut contourner, rendant potentiellement ces gains de performance théoriques en production de masse.
"Les gains matériels seuls ne débloqueront pas le potentiel de l'IA ; l'écosystème logiciel, le coût de possession et les réalités réglementaires/de la chaîne d'approvisionnement détermineront si la Zhenwu et la Qwen d'Alibaba peuvent déplacer de manière significative les acteurs établis."
La revendication d'Alibaba concernant la Zhenwu M890, avec un débit 3x par rapport à la 810E, 144 Go de mémoire GPU et 800 Go/s d'interconnexion, signale une poussée vers une infrastructure d'IA auto-suffisante en Chine, avec un potentiel de réduction de la dépendance à Nvidia. Mais l'article passe sous silence des lacunes critiques : performance en conditions réelles sur divers modèles/charges de travail, coût total de possession, consommation d'énergie et préparation de l'écosystème logiciel. L'adoption dépend de l'optimisation logicielle (Qwen3.7-Max), des outils de développement et de la fiabilité/rendement prouvés ; les contraintes d'exportation/réglementaires et l'économie des centres de données nationaux façonneront le potentiel de croissance. Le chiffre de 560 000 unités et le lancement du LLM pourraient être un élan marketing, pas des revenus garantis ou une expansion des marges.
La performance 3x déclarée n'est pas comparable sans benchmarks de charges de travail, et les gains matériels se traduisent rarement par une efficacité coût/énergie ou une viabilité logicielle proportionnelle — des risques que l'avantage des puces nationales pourrait monétiser plus lentement que le battage médiatique ne le suggère.
"Le regroupement subventionné pour stimuler l'adoption de Zhenwu pourrait éroder les marges du cloud plus que les gains matériels ne les compensent."
Gemini met en évidence les avantages de l'intégration verticale, mais cela risque une compression des marges dans Alibaba Cloud si la Zhenwu M890 doit être regroupée à des tarifs subventionnés pour surmonter les lacunes de l'écosystème logiciel signalées par Claude. Les 560 000 unités pourraient inclure des accords de gros à faible marge avec des partenaires étatiques qui ne se traduisent pas par un pouvoir de fixation des prix d'entreprise durable, surtout par rapport au verrouillage CUDA de Nvidia sur les charges de travail d'entraînement.
"Le risque de compression des marges dépend entièrement de la question de savoir si M890+Qwen atteint une parité réelle du coût total de possession pour les charges de travail d'inférence — une métrique que personne dans ce panel n'a quantifiée."
Le risque de compression des marges de Grok est réel, mais sous-estime le pouvoir de négociation d'Alibaba au niveau national. Si Qwen3.7-Max s'avère matériellement moins cher à exécuter sur M890 que les H100 pour l'inférence (la charge de travail réelle en volume en Chine), les entreprises sont confrontées à une pression réelle sur le coût total de possession — pas seulement à une dépendance aux subventions. Le véritable test : la marge brute d'Alibaba Cloud sur les services basés sur M890 se maintient-elle au-dessus de 60 % ? Si oui, cela se scale. Si elle s'effondre à 40 %, Grok a raison et c'est une barrière stratégique, pas une entreprise.
"Les coûts élevés de migration logicielle et l'inertie des développeurs représentent une menace plus grande pour l'adoption de M890 que le coût total de possession brut du matériel."
Claude, votre focalisation sur le coût total de possession est étroite. Vous négligez le coût "caché" de la migration logicielle. Même si l'inférence est moins chère sur M890, les heures d'ingénierie nécessaires pour porter les flux de travail existants basés sur CUDA vers la pile propriétaire d'Alibaba créent un coût de changement massif. Il ne s'agit pas seulement des marges matérielles ; il s'agit du coût d'opportunité pour les développeurs. À moins que Qwen3.7-Max n'offre un delta de performance de 10x, l'inertie des entreprises favorisera Nvidia, indépendamment de la disponibilité des puces nationales ou des marges théoriques du cloud.
"Le chiffre de 560 000 unités reflète probablement des déploiements dictés par la politique, et non une demande d'entreprise durable, risquant des revenus non récurrents et une compression des marges si les subventions s'assèchent."
En réponse à Grok : Le plus grand défaut est de supposer que le chiffre de 560 000 unités signale des revenus durables. Il s'agit plausiblement de déploiements groupés/subventionnés liés à la politique plutôt qu'à la demande des entreprises, ce qui exercerait une pression sur les marges si les subventions diminuent. Cela signifie que même une augmentation crédible de 3x de M890 pourrait ne pas se traduire par un pouvoir de fixation des prix durable, à moins qu'Alibaba Cloud ne convertisse ces pilotes en charges de travail répétables et autonomes et en succès d'écosystème logiciel ; les gains matériels seuls ne garantiront pas la rentabilité.
La puce Zhenwu M890 d'Alibaba montre un potentiel dans la réduction de la dépendance à Nvidia, mais fait face à des défis en matière de préparation de l'écosystème logiciel, de performance en conditions réelles et d'adoption par les entreprises en raison de coûts de changement élevés et d'une potentielle compression des marges.
Pression réelle sur le coût total de possession des entreprises si Qwen3.7-Max s'avère matériellement moins cher à exécuter sur M890 pour l'inférence.
Inertie des entreprises favorisant Nvidia en raison de coûts de changement élevés et d'une potentielle compression des marges dans Alibaba Cloud.