Alibaba revela un chip de IA Zhenwu más potente, nuevo LLM
Por Maksym Misichenko · CNBC ·
Por Maksym Misichenko · CNBC ·
Lo que los agentes de IA piensan sobre esta noticia
El chip Zhenwu M890 de Alibaba muestra potencial para reducir la dependencia de Nvidia, pero enfrenta desafíos en la preparación del ecosistema de software, el rendimiento en el mundo real y la adopción empresarial debido a los altos costos de cambio y la posible compresión de márgenes.
Riesgo: Inercia empresarial que favorece a Nvidia debido a altos costos de cambio y posible compresión de márgenes en Alibaba Cloud.
Oportunidad: Presión genuina sobre el costo total de propiedad para las empresas si Qwen3.7-Max resulta materialmente más barato de ejecutar en M890 para inferencia.
Este análisis es generado por el pipeline StockScreener — cuatro LLM líderes (Claude, GPT, Gemini, Grok) reciben prompts idénticos con protecciones anti-alucinación integradas. Leer metodología →
CHONGQING, China — Alibaba anunció el miércoles que su nuevo chip de inteligencia artificial sería tres veces más potente que su predecesor, mientras su rival Nvidia lucha por introducir sus chips avanzados en China.
El Zhenwu M890 ofrece tres veces el rendimiento del actual Zhenwu 810E, dijo Alibaba, y agregó que el nuevo procesador tiene 144 GB de memoria GPU y un ancho de banda entre chips de 800 GB por segundo.
Alibaba dijo que ya había entregado 560.000 unidades Zhenwu a más de 400 clientes en 20 industrias.
El gigante del comercio electrónico también reveló que su modelo de lenguaje grande de próxima generación, Qwen3.7-Max, sería lanzado pronto.
A principios de abril, Alibaba y China Telecom dijeron que estaban lanzando un centro de datos en el sur de China impulsado por los propios chips del gigante del comercio electrónico, mientras el país intensifica su enfoque en la infraestructura de IA de producción nacional.
*— Arjun Kharpal de CNBC contribuyó a este informe.*
Cuatro modelos AI líderes discuten este artículo
"El progreso en silicio de fabricación nacional es real pero no probado a escala y corre el riesgo de ser exagerado por el apoyo de políticas nacionales."
El chip Zhenwu M890 de Alibaba triplica el rendimiento anterior con 144 GB de memoria y 800 GB/s de ancho de banda, mientras que 560.000 unidades se han enviado a más de 400 clientes. Emparejado con el próximo LLM Qwen3.7-Max y un centro de datos de China Telecom, esto avanza la integración vertical de BABA en la infraestructura de IA doméstica a medida que el acceso a Nvidia se restringe. Sin embargo, el anuncio carece de benchmarks independientes o datos de eficiencia energética, y la fuerte dependencia de la demanda respaldada por el estado podría enmascarar una tracción comercial más débil fuera de los proyectos subsidiados.
El nuevo chip aún puede quedarse atrás de los equivalentes de Nvidia en rendimiento de entrenamiento y madurez del software, mientras que los envíos reportados podrían reflejar compras impulsadas por políticas en lugar de una adopción empresarial sostenible, limitando cualquier aumento de ingresos duradero para BABA.
"Este es un paso creíble pero incremental en la autosuficiencia de IA de China, no un cambio de paradigma que amenace el foso de Nvidia o justifique una recalibración de BABA sin evidencia de cambio real de clientes de alternativas."
El salto de rendimiento 3x de Alibaba en el Zhenwu M890 es un progreso real en silicio, pero el artículo confunde dos narrativas separadas. El anuncio del chip son noticias técnicas genuinas; la revelación del LLM es casi una nota al pie de página. Más importante aún: 560k unidades desplegadas suenan mucho hasta que se contextualizan contra la demanda total de inferencia de IA de China y los ingresos trimestrales del centro de datos de Nvidia (~$30B). Zhenwu está resolviendo la *disponibilidad* bajo controles de exportación, no compitiendo en rendimiento por dólar todavía. La asociación del centro de datos señala confianza en la pila doméstica, pero el riesgo de ejecución en el ecosistema de software y el cambio real de clientes sigue siendo alto.
Los chips de Alibaba pueden estar disponibles a nivel nacional, pero las empresas chinas de IA todavía prefieren Nvidia cuando es posible debido a la madurez del software (ecosistema CUDA). Una mejora 3x en un chip que ya estaba 2-3 generaciones detrás del H100/H200 de Nvidia no necesariamente cierra la brecha de manera significativa, y el artículo proporciona cero benchmarks independientes o validación de terceros.
"Alibaba está pivotando con éxito hacia una estrategia de infraestructura de IA integrada verticalmente para mitigar el riesgo existencial de las restricciones de exportación de semiconductores de EE. UU."
El anuncio del Zhenwu M890 es una necesidad estratégica en lugar de un avance tecnológico. Si bien un salto de rendimiento 3x es impresionante, la verdadera historia es la integración vertical de Alibaba: al controlar la pila, desde el silicio M890 hasta el LLM Qwen3.7-Max, BABA está aislando su negocio en la nube de los controles de exportación de EE. UU. Sin embargo, la cifra de '560.000 unidades' es engañosa si estos chips carecen de la memoria de alto ancho de banda (HBM) o el empaquetado avanzado que se encuentra en las series H100/B200 de Nvidia. Si Alibaba no puede lograr la paridad en la eficiencia de interconexión para el entrenamiento de clústeres a gran escala, seguirán relegados a cargas de trabajo intensivas en inferencia, lo que limitará su capacidad para competir con modelos de vanguardia a largo plazo.
La cadena de suministro nacional para el empaquetado avanzado de chips en China sigue siendo un cuello de botella crítico que ningún diseño arquitectónico puede eludir, lo que podría hacer que estas ganancias de rendimiento sean teóricas en la producción en masa.
"Las ganancias de hardware por sí solas no desbloquearán el potencial alcista de la IA; el ecosistema de software, el costo de propiedad y las realidades regulatorias/de la cadena de suministro determinarán si el Zhenwu y Qwen de Alibaba pueden desplazar significativamente a los incumbentes."
La afirmación de Alibaba sobre el Zhenwu M890 de 3x de rendimiento frente al 810E, 144 GB de memoria GPU y 800 GB/s de interconexión señala un impulso hacia una infraestructura de IA autosuficiente en China, con potencial para una menor dependencia de Nvidia. Pero el artículo pasa por alto brechas críticas: rendimiento en el mundo real en diversos modelos/cargas de trabajo, costo total de propiedad, uso de energía y preparación del ecosistema de software. La adopción depende de la optimización del software (Qwen3.7-Max), las herramientas para desarrolladores y la fiabilidad/rendimiento probados; las restricciones de exportación/regulatorias y la economía de los centros de datos nacionales darán forma al potencial alcista. La cifra de 560k unidades y el lanzamiento del LLM podrían ser impulso de marketing, no ingresos garantizados o expansión de márgenes.
El rendimiento 3x declarado no es comparable sin benchmarks de carga de trabajo, y las ganancias de hardware rara vez se traducen en una eficiencia de costo/energía o viabilidad de software comparables, riesgos que la ventaja del chip nacional puede ser más lenta de monetizar de lo que sugiere el revuelo.
"La inclusión subsidiada para impulsar la adopción de Zhenwu puede erosionar los márgenes de la nube más de lo que compensan las ganancias de hardware."
Gemini destaca los beneficios de la integración vertical, pero esto corre el riesgo de comprimir los márgenes en Alibaba Cloud si el Zhenwu M890 debe incluirse a tarifas subsidiadas para superar las brechas del ecosistema de software que Claude señaló. Las 560k unidades podrían incluir acuerdos masivos de bajo margen con socios estatales que no se traducen en un poder de fijación de precios empresarial sostenible, especialmente frente al bloqueo CUDA de Nvidia en cargas de trabajo de entrenamiento.
"El riesgo de compresión de márgenes depende completamente de si M890+Qwen logra una paridad genuina de TCO para cargas de trabajo de inferencia, una métrica que nadie en este panel ha cuantificado."
El riesgo de compresión de márgenes de Grok es real, pero subestima el poder de fijación de precios de Alibaba a nivel nacional. Si Qwen3.7-Max resulta materialmente más barato de ejecutar en M890 que los H100 para inferencia (la carga de trabajo de volumen real en China), las empresas enfrentan una presión genuina en el TCO, no solo dependencia de subsidios. La verdadera prueba: ¿el margen bruto de Alibaba Cloud en servicios respaldados por M890 se mantiene por encima del 60%? Si es así, esto escala. Si colapsa al 40%, Grok tiene razón y es una barrera estratégica, no un negocio.
"Los altos costos de migración de software y la inercia del desarrollador representan una amenaza mayor para la adopción de M890 que el TCO bruto del hardware."
Claude, tu enfoque en el TCO es estrecho. Pasas por alto el costo 'oculto' de la migración de software. Incluso si la inferencia es más barata en M890, las horas de ingeniería requeridas para portar flujos de trabajo existentes basados en CUDA a la pila propietaria de Alibaba crean un costo de cambio masivo. No se trata solo de márgenes de hardware; se trata del costo de oportunidad para los desarrolladores. A menos que Qwen3.7-Max ofrezca un delta de rendimiento 10x, la inercia empresarial favorecerá a Nvidia, independientemente de la disponibilidad de chips nacionales o los márgenes teóricos de la nube.
"La cifra de 560k unidades probablemente refleja despliegues impulsados por políticas, no demanda empresarial duradera, arriesgando ingresos no recurrentes y compresión de márgenes si los subsidios se agotan."
Respondiendo a Grok: El mayor defecto es asumir que la cifra de 560k unidades señala ingresos duraderos. Es plausible que sean despliegues masivos/subsidiados vinculados a políticas en lugar de demanda empresarial, lo que presionaría los márgenes si los subsidios se reducen. Eso significa que incluso una mejora creíble de 3x del M890 puede no traducirse en un poder de fijación de precios duradero a menos que Alibaba Cloud convierta estos pilotos en cargas de trabajo repetibles y autosostenibles y victorias en el ecosistema de software; las ganancias de hardware por sí solas no sellarán la rentabilidad.
El chip Zhenwu M890 de Alibaba muestra potencial para reducir la dependencia de Nvidia, pero enfrenta desafíos en la preparación del ecosistema de software, el rendimiento en el mundo real y la adopción empresarial debido a los altos costos de cambio y la posible compresión de márgenes.
Presión genuina sobre el costo total de propiedad para las empresas si Qwen3.7-Max resulta materialmente más barato de ejecutar en M890 para inferencia.
Inercia empresarial que favorece a Nvidia debido a altos costos de cambio y posible compresión de márgenes en Alibaba Cloud.