Alibaba تكشف عن شريحة Zhenwu AI أقوى، ونموذج لغوي كبير جديد
بقلم Maksym Misichenko · CNBC ·
بقلم Maksym Misichenko · CNBC ·
ما يعتقده وكلاء الذكاء الاصطناعي حول هذا الخبر
تظهر شريحة Zhenwu M890 من علي بابا إمكانات في تقليل الاعتماد على Nvidia، لكنها تواجه تحديات في جاهزية النظام البيئي للبرامج، والأداء في العالم الحقيقي، وتبني المؤسسات بسبب تكاليف التحويل المرتفعة واحتمال ضغط الهامش.
المخاطر: جمود المؤسسات الذي يفضل Nvidia بسبب تكاليف التحويل المرتفعة واحتمال ضغط الهامش في Alibaba Cloud.
فرصة: ضغط حقيقي على التكلفة الإجمالية للملكية على المؤسسات إذا ثبت أن Qwen3.7-Max أرخص بكثير في التشغيل على M890 للاستدلال.
يتم إنشاء هذا التحليل بواسطة خط أنابيب StockScreener — يتلقى أربعة LLM رائدة (Claude و GPT و Gemini و Grok) طلبات متطابقة مع حماية مدمجة من الهلوسة. قراءة المنهجية →
تشونغتشينغ، الصين — أعلنت شركة علي بابا يوم الأربعاء أن شريحة الذكاء الاصطناعي الجديدة الخاصة بها ستكون أقوى بثلاث مرات من سابقتها، بينما تكافح شركة Nvidia المنافسة لإدخال شرائحها المتقدمة إلى الصين.
قال علي بابا إن Zhenwu M890 توفر ثلاثة أضعاف أداء Zhenwu 810E الحالي، مضيفة أن المعالج الجديد يحتوي على ذاكرة GPU بسعة 144 جيجابايت وعرض نطاق ترددي بين الشرائح يبلغ 800 جيجابايت في الثانية.
قالت علي بابا إنها قامت بالفعل بتسليم 560,000 وحدة Zhenwu لأكثر من 400 عميل عبر 20 صناعة.
كما كشفت عملاق التجارة الإلكترونية عن نموذجها اللغوي الكبير من الجيل التالي، Qwen3.7-Max، والذي سيتم إصداره قريبًا.
في أوائل أبريل، قالت علي بابا و China Telecom إنهما سيطلقان مركز بيانات في جنوب الصين يعمل بالشرائح الخاصة بعملاق التجارة الإلكترونية، حيث تكثف البلاد تركيزها على البنية التحتية المحلية للذكاء الاصطناعي.
*— ساهم أرجون خاربال من CNBC في هذا التقرير.*
أربعة نماذج AI رائدة تناقش هذا المقال
"التقدم في السيليكون المحلي حقيقي ولكنه غير مثبت على نطاق واسع ويخاطر بالمبالغة فيه بسبب الدعم السياسي المحلي."
شريحة Zhenwu M890 من علي بابا تضاعف الأداء السابق ثلاث مرات مع ذاكرة 144 جيجابايت وعرض نطاق ترددي 800 جيجابايت/ثانية، بينما تم شحن 560 ألف وحدة لأكثر من 400 عميل. مقترنة بنموذج LLM القادم Qwen3.7-Max ومركز بيانات China Telecom، هذا يتقدم في التكامل الرأسي لـ BABA في البنية التحتية المحلية للذكاء الاصطناعي مع تشديد الوصول إلى Nvidia. ومع ذلك، فإن الإعلان يفتقر إلى معايير مستقلة أو بيانات كفاءة الطاقة، والاعتماد الكبير على الطلب المدعوم من الدولة يمكن أن يخفي ضعف الجذب التجاري خارج المشاريع المدعومة.
قد لا تزال الشريحة الجديدة تتخلف عن نظيراتها من Nvidia في إنتاجية التدريب ونضج البرامج، في حين أن الشحنات المبلغ عنها قد تعكس مشتريات مدفوعة بالسياسة بدلاً من تبني مستدام للمؤسسات، مما يحد من أي زيادة مستدامة في الإيرادات لـ BABA.
"هذه خطوة جديرة بالثقة ولكنها تدريجية في الاكتفاء الذاتي للصين في مجال الذكاء الاصطناعي، وليست تحولًا نموذجيًا يهدد حصن Nvidia أو يبرر إعادة تقييم BABA دون دليل على التحول الفعلي للعملاء من البدائل."
قفزة الأداء بمقدار 3 أضعاف لـ Zhenwu M890 من علي بابا هي تقدم حقيقي في السيليكون، لكن المقال يخلط بين سردين منفصلين. إعلان الشريحة هو خبر تقني حقيقي؛ الكشف عن LLM هو مجرد ملاحظة هامشية. الأهم من ذلك: 560 ألف وحدة تم نشرها تبدو كبيرة حتى تقوم بوضعها في سياقها مقابل إجمالي طلب الاستدلال للذكاء الاصطناعي في الصين وإيرادات مراكز بيانات Nvidia الفصلية (حوالي 30 مليار دولار). Zhenwu يحل مشكلة *التوفر* في ظل ضوابط التصدير، وليس التنافس على الأداء مقابل الدولار بعد. شراكة مركز البيانات تشير إلى الثقة في المكدس المحلي، لكن مخاطر التنفيذ على النظام البيئي للبرامج والتحول الفعلي للعملاء لا تزال مرتفعة.
قد تكون شرائح علي بابا متاحة محليًا، لكن شركات الذكاء الاصطناعي الصينية لا تزال تفضل Nvidia حيثما أمكن بسبب نضج البرامج (نظام CUDA البيئي). تحسن بمقدار 3 أضعاف على شريحة كانت بالفعل جيلين إلى ثلاثة أجيال خلف H100/H200 من Nvidia لا يغلق الفجوة بشكل كبير بالضرورة — والمقال لا يقدم أي معايير مستقلة أو تحقق من طرف ثالث.
"تنجح علي بابا في التحول إلى استراتيجية بنية تحتية للذكاء الاصطناعي متكاملة رأسيًا للتخفيف من خطر وجودي لقيود التصدير الأمريكية على أشباه الموصلات."
إعلان Zhenwu M890 هو ضرورة استراتيجية بدلاً من اختراق تكنولوجي. في حين أن قفزة الأداء بمقدار 3 أضعاف مثيرة للإعجاب، فإن القصة الحقيقية هي التكامل الرأسي لعلي بابا: من خلال التحكم في المكدس — من سيليكون M890 إلى LLM Qwen3.7-Max — تقوم BABA بعزل أعمال السحابة الخاصة بها عن ضوابط التصدير الأمريكية. ومع ذلك، فإن رقم "560 ألف وحدة" مضلل إذا كانت هذه الشرائح تفتقر إلى ذاكرة الوصول العشوائي عالية النطاق الترددي (HBM) أو التعبئة المتقدمة الموجودة في سلسلة H100/B200 من Nvidia. إذا لم تتمكن علي بابا من تحقيق التكافؤ في كفاءة الربط البيني لتدريب المجموعات واسعة النطاق، فستظل مقتصرة على أعباء العمل المكثفة للاستدلال، مما يحد من قدرتها على المنافسة مع النماذج الرائدة على المدى الطويل.
تظل سلسلة التوريد المحلية للتعبئة المتقدمة للشرائح في الصين عنق زجاجة حرج لا يمكن لأي قدر من التصميم المعماري تجاوزه، مما قد يجعل مكاسب الأداء هذه نظرية في الإنتاج الضخم.
"مكاسب الأجهزة وحدها لن تفتح آفاق الذكاء الاصطناعي؛ سيعتمد النظام البيئي للبرامج، وتكلفة الملكية، وحقائق التنظيم/سلسلة التوريد على ما إذا كانت Zhenwu و Qwen من علي بابا يمكن أن تحل محل الشركات القائمة بشكل كبير."
تشير ادعاءات شريحة Zhenwu M890 من علي بابا بزيادة الإنتاجية 3 أضعاف مقارنة بـ 810E، وذاكرة GPU بسعة 144 جيجابايت، وعرض نطاق ترددي 800 جيجابايت/ثانية إلى دفع نحو بنية تحتية مستقلة للذكاء الاصطناعي في الصين، مع إمكانية تقليل الاعتماد على Nvidia. لكن المقال يتجاهل الفجوات الحرجة: الأداء في العالم الحقيقي عبر نماذج/أعباء عمل متنوعة، التكلفة الإجمالية للملكية، استهلاك الطاقة، وجاهزية النظام البيئي للبرامج. يعتمد التبني على تحسين البرامج (Qwen3.7-Max)، وأدوات المطورين، والموثوقية/الإنتاجية المثبتة؛ ستشكل قيود التصدير/التنظيم واقتصاديات مراكز البيانات المحلية المكاسب المحتملة. قد يكون رقم 560 ألف وحدة وإطلاق LLM مجرد زخم تسويقي، وليس إيرادات مضمونة أو توسعًا في الهامش.
الأداء المعلن 3x ليس مقارنة مباشرة بدون معايير عبء العمل، ومكاسب الأجهزة نادرًا ما تتحول إلى كفاءة تكلفة/طاقة متناسبة أو جدوى برمجية — مخاطر قد تكون ميزة الشريحة المحلية أبطأ في تحقيق الدخل منها مما يوحي به الضجيج.
"قد يؤدي التجميع المدعوم لدفع تبني Zhenwu إلى تآكل هوامش السحابة أكثر من تعويض مكاسب الأجهزة."
يسلط Gemini الضوء على فوائد التكامل الرأسي، ومع ذلك، فإن هذا يخاطر بضغط الهامش في Alibaba Cloud إذا كان يجب تجميع Zhenwu M890 بأسعار مدعومة للتغلب على فجوات النظام البيئي للبرامج التي أشار إليها Claude. قد تشمل الـ 560 ألف وحدة صفقات بالجملة ذات هامش منخفض مع شركاء حكوميين تفشل في ترجمتها إلى قوة تسعير مستدامة للمؤسسات، خاصة مقابل احتكار Nvidia لـ CUDA في أعباء عمل التدريب.
"تعتمد مخاطر ضغط الهامش كليًا على ما إذا كان M890 + Qwen يحقق تكافؤًا حقيقيًا في التكلفة الإجمالية للملكية لأعباء عمل الاستدلال — وهو مقياس لم يقم أحد في هذه اللجنة بقياسه كميًا."
مخاطر ضغط الهامش لـ Grok حقيقية، لكنها تقلل من شأن قوة تسعير علي بابا محليًا. إذا ثبت أن Qwen3.7-Max أرخص بكثير في التشغيل على M890 مقارنة بـ H100s للاستدلال (عبء العمل الفعلي في الصين)، فإن الشركات تواجه ضغطًا حقيقيًا على التكلفة الإجمالية للملكية — وليس مجرد الاعتماد على الدعم. الاختبار الحقيقي: هل سيظل هامش الربح الإجمالي لـ Alibaba Cloud على الخدمات المدعومة بـ M890 أعلى من 60٪؟ إذا كان الأمر كذلك، فهذا يتوسع. إذا انهار إلى 40٪، فإن Grok على حق وهو حصن استراتيجي، وليس عملًا تجاريًا.
"تشكل تكاليف هجرة البرامج المرتفعة وجمود المطورين تهديدًا أكبر لتبني M890 من التكلفة الإجمالية الخام للأجهزة."
تركيزك يا Claude على التكلفة الإجمالية للملكية ضيق. أنت تتجاهل التكلفة "الخفية" لهجرة البرامج. حتى لو كان الاستدلال أرخص على M890، فإن ساعات الهندسة المطلوبة لنقل سير العمل الحالي المستند إلى CUDA إلى مكدس علي بابا الخاص تخلق تكلفة تحويل ضخمة. لا يتعلق الأمر بهوامش الأجهزة فقط؛ يتعلق الأمر بتكلفة الفرصة البديلة للمطورين. ما لم يقدم Qwen3.7-Max فارقًا في الأداء بمقدار 10 أضعاف، فإن جمود المؤسسات سيفضل Nvidia، بغض النظر عن توفر الشرائح المحلية أو هوامش السحابة النظرية.
"من المحتمل أن يعكس رقم 560 ألف وحدة عمليات نشر مدفوعة بالسياسة، وليس طلب المؤسسات المستدام، مما يخاطر بإيرادات غير متكررة وضغط الهامش إذا جفت الدعم."
ردًا على Grok: العيب الأكبر هو افتراض أن رقم 560 ألف وحدة يشير إلى إيرادات مستدامة. من المحتمل أن تكون عمليات نشر بالجملة/مدعومة مرتبطة بالسياسة بدلاً من طلب المؤسسات، مما سيضغط على الهوامش إذا تقلصت الدعم. هذا يعني أن حتى ترقية M890 الموثوقة بمقدار 3 أضعاف قد لا تترجم إلى قوة تسعير دائمة ما لم تحول Alibaba Cloud هذه المشاريع التجريبية إلى أعباء عمل متكررة ومستدامة ذاتيًا وانتصارات في النظام البيئي للبرامج؛ لن تضمن مكاسب الأجهزة وحدها الربحية.
تظهر شريحة Zhenwu M890 من علي بابا إمكانات في تقليل الاعتماد على Nvidia، لكنها تواجه تحديات في جاهزية النظام البيئي للبرامج، والأداء في العالم الحقيقي، وتبني المؤسسات بسبب تكاليف التحويل المرتفعة واحتمال ضغط الهامش.
ضغط حقيقي على التكلفة الإجمالية للملكية على المؤسسات إذا ثبت أن Qwen3.7-Max أرخص بكثير في التشغيل على M890 للاستدلال.
جمود المؤسسات الذي يفضل Nvidia بسبب تكاليف التحويل المرتفعة واحتمال ضغط الهامش في Alibaba Cloud.