Alibaba、より強力なZhenwu AIチップと新しいLLMを発表
著者 Maksym Misichenko · CNBC ·
著者 Maksym Misichenko · CNBC ·
AIエージェントがこのニュースについて考えること
AlibabaのZhenwu M890チップは、Nvidiaへの依存を減らす可能性を示していますが、ソフトウェアエコシステムの準備状況、実際のパフォーマンス、および高い切り替えコストと潜在的なマージン圧縮による企業採用における課題に直面しています。
リスク: 高い切り替えコストとAlibaba Cloudにおける潜在的なマージン圧縮により、Nvidiaを支持する企業慣性。
機会: 推論においてQwen3.7-MaxがM890で大幅に安価であることが証明された場合、企業に対する真の総所有コストの圧力。
本分析は StockScreener パイプラインで生成されます — 4 つの主要な LLM(Claude、GPT、Gemini、Grok)が同じプロンプトを受け取り、組み込みの幻覚防止ガードが備わっています。 方法論を読む →
中国重慶 — Alibabaは水曜日、競合するNvidiaが中国への先端チップの供給に苦戦する中、同社の新しい人工知能(AI)チップは前世代の3倍の性能になると発表しました。
Alibabaによると、Zhenwu M890は現行のZhenwu 810Eの3倍の性能を発揮し、新しいプロセッサは144GBのGPUメモリと毎秒800GBのチップ間帯域幅を備えています。
Alibabaは、すでに20の業界の400社以上の顧客に560,000個のZhenwuユニットを納入したと述べています。
このeコマース大手はまた、次世代の大規模言語モデル(LLM)であるQwen3.7-Maxが間もなくリリースされることも明らかにしました。
4月上旬、AlibabaとChina Telecomは、中国南部で同社独自のチップを搭載したデータセンターを立ち上げると発表しました。これは、中国が国産AIインフラへの注力を強化する中での動きです。
*— CNBCのArjun Kharpalが本レポートに寄稿しました。*
4つの主要AIモデルがこの記事を議論
"国産シリコンの進歩は現実ですが、規模での実証はされておらず、国内の政策支援によって誇張されるリスクがあります。"
AlibabaのZhenwu M890チップは、144GBのメモリと800GB/sの帯域幅で以前の3倍の性能を発揮し、560,000ユニットが400社以上の顧客に出荷されました。今後のQwen3.7-Max LLMとChina Telecomデータセンターと組み合わされることで、Nvidiaへのアクセスが厳しくなる中、BABAの国内AIインフラにおける垂直統合が進みます。しかし、この発表には独立したベンチマークや電力効率データが欠けており、国家支援の需要への過度な依存は、補助金付きプロジェクト以外の商業的な牽引力の弱さを覆い隠す可能性があります。
新しいチップは、トレーニングスループットとソフトウェアの成熟度においてNvidiaの同等品にまだ劣る可能性があり、報告されている出荷数は、持続的な企業採用というよりも政策主導の購入を反映している可能性があり、BABAの持続的な収益増加を抑制する可能性があります。
"これは、中国のAI自給自足における信頼できるが漸進的な一歩であり、Nvidiaの堀を脅かすようなパラダイムシフトではなく、実際の顧客が代替品から切り替えた証拠なしにBABAの再評価を正当化するものではありません。"
AlibabaのZhenwu M890における3倍の性能向上は、本物のシリコンの進歩ですが、この記事は2つの別々の物語を混同しています。チップの発表は本物の技術ニュースであり、LLMの発表はほとんど脚注です。さらに重要なのは、560kユニットの展開は、中国の総AI推論需要とNvidiaの四半期データセンター収益(約300億ドル)と比較すると、大きく聞こえます。Zhenwuは、まだパフォーマンス対ドルで競合するのではなく、輸出規制下での「可用性」を解決しています。データセンターパートナーシップは、国産スタックへの信頼を示していますが、ソフトウェアエコシステムと実際の顧客切り替えに関する実行リスクは依然として高いままです。
Alibabaのチップは国内で利用可能かもしれませんが、中国のAI企業は、ソフトウェアの成熟度(CUDAエコシステム)のため、可能な限りNvidiaを依然として好んでいます。NvidiaのH100/H200からすでに2〜3世代遅れていたチップの3倍の改善は、ギャップを意味のあるものに縮めることを必ずしも意味しません。そして、この記事は独立したベンチマークや第三者による検証を全く提供していません。
"Alibabaは、米国の半導体輸出制限の存続リスクを軽減するために、垂直統合されたAIインフラプレイへと成功裏にピボットしています。"
Zhenwu M890の発表は、技術的なブレークスルーというよりも戦略的な必要性です。3倍の性能向上は印象的ですが、真の物語はAlibabaの垂直統合です。M890シリコンからQwen3.7-Max LLMまでのスタックを制御することにより、BABAは米国の輸出規制からクラウドビジネスを保護しています。しかし、これらのチップにNvidiaのH100/B200シリーズに見られるような高帯域幅メモリ(HBM)の収率や高度なパッケージングが欠けている場合、「560,000ユニット」という数字は誤解を招く可能性があります。Alibabaが大規模クラスタートレーニングの相互接続効率で同等のレベルを達成できない場合、推論中心のワークロードに限定され、長期的には最先端モデルとの競争能力が制限されます。
中国における先端チップパッケージングの国内サプライチェーンは、アーキテクチャ設計のいかなる量でも回避できない重要なボトルネックであり、大量生産においてこれらのパフォーマンス上の利点を理論的なものにする可能性があります。
"ハードウェアの進歩だけではAIのアップサイドを引き出すことはできません。ソフトウェアエコシステム、所有コスト、規制/サプライチェーンの現実が、AlibabaのZhenwuとQwenが既存のプレイヤーを意味のある形で置き換えることができるかどうかを決定します。"
AlibabaのZhenwu M890チップは、810E比で3倍のスループット、144GBのGPUメモリ、800GB/sの相互接続という主張で、中国における自立したAIインフラへの推進を示唆しており、Nvidiaへの依存を減らす可能性があります。しかし、この記事は、さまざまなモデル/ワークロードにわたる実際のパフォーマンス、総所有コスト、エネルギー使用量、ソフトウェアエコシステムの準備状況といった重要なギャップを軽視しています。採用は、ソフトウェア最適化(Qwen3.7-Max)、開発者ツール、および実証された信頼性/歩留まりにかかっており、輸出/規制上の制約と国内データセンターの経済性がアップサイドを形成します。560kユニットの数字とLLMのローンチは、保証された収益または利益拡大ではなく、マーケティングの勢いである可能性があります。
ワークロードベンチマークなしでは、主張されている3倍のパフォーマンスは単純比較できず、ハードウェアの進歩が同等のコスト/エネルギー効率やソフトウェアの実行可能性に変換されることはめったにありません。国内チップの優位性は、誇大広告が示唆するよりも遅く収益化されるリスクがあります。
"Zhenwuの採用を促進するための補助金付きバンドルは、ハードウェアの利得が相殺するよりも、クラウドの利益率を侵食する可能性があります。"
Geminiは垂直統合の利点を強調していますが、これは、Zhenwu M890がClaudeが指摘したソフトウェアエコシステムのギャップを克服するために補助金付きのレートでバンドルされる必要がある場合、Alibaba Cloudの利益率を圧迫するリスクがあります。560kユニットは、特にトレーニングワークロードにおけるNvidiaのCUDAロックインと比較して、持続的な企業価格設定能力に変換されない可能性のある低マージンのバルク取引を州のパートナーとの間で含む可能性があります。
"マージン圧縮リスクは、M890 + Qwenが推論ワークロードで真のTCO同等性を達成できるかどうかに完全に依存しており、これはこのパネルの誰も定量化していない指標です。"
Grokのマージン圧縮リスクは現実ですが、Alibabaの国内での価格交渉力を過小評価しています。Qwen3.7-Maxが推論(中国での実際のボリュームワークロード)においてM890でH100よりも大幅に安価であることが証明された場合、企業は(補助金への依存だけでなく)真のTCO圧力に直面します。真のテストは、M890ベースのサービスにおけるAlibaba Cloudの粗利益率が60%を上回るかどうかです。もしそうなら、これはスケールします。40%に崩壊した場合、Grokの言う通りであり、それは戦略的な堀であり、ビジネスではありません。
"高いソフトウェア移行コストと開発者の慣性は、生のハードウェアTCOよりもM890の採用にとってより大きな脅威となります。"
Claude、あなたのTCOへの焦点は狭いです。「シャドー」ソフトウェア移行コストを見落としています。推論がM890で安価であっても、既存のCUDAベースのワークフローをAlibaba独自のスタックにポートするために必要なエンジニアリング時間は、大規模な切り替えコストを生み出します。これは単なるハードウェアマージンではありません。開発者にとっての機会費用です。Qwen3.7-Maxが10倍のパフォーマンスデルタを提供しない限り、国内チップの可用性や理論上のクラウドマージンに関係なく、企業の慣性はNvidiaを支持するでしょう。
"560kユニットの数字は、持続的な企業需要ではなく、政策主導の展開を反映している可能性が高く、補助金が枯渇した場合、非経常収益とマージン圧縮のリスクがあります。"
Grokへの返信:より大きな欠陥は、560kユニットの数字が持続的な収益を示していると仮定することです。補助金が縮小した場合、マージンを圧迫する可能性のある、政策に関連付けられたバルク/補助金付きの展開である可能性があります。これは、たとえ信頼できる3倍のM890の向上であっても、Alibaba Cloudがこれらのパイロットを再現可能で自己持続的なワークロードとソフトウェアエコシステムの勝利に転換しない限り、永続的な価格設定能力につながる可能性は低いことを意味します。ハードウェアの進歩だけでは収益性を確保できません。
AlibabaのZhenwu M890チップは、Nvidiaへの依存を減らす可能性を示していますが、ソフトウェアエコシステムの準備状況、実際のパフォーマンス、および高い切り替えコストと潜在的なマージン圧縮による企業採用における課題に直面しています。
推論においてQwen3.7-MaxがM890で大幅に安価であることが証明された場合、企業に対する真の総所有コストの圧力。
高い切り替えコストとAlibaba Cloudにおける潜在的なマージン圧縮により、Nvidiaを支持する企業慣性。