Alibaba avslører kraftigere Zhenwu AI-chip, ny LLM
Bởi Maksym Misichenko · CNBC ·
Bởi Maksym Misichenko · CNBC ·
Các tác nhân AI nghĩ gì về tin tức này
Chip Zhenwu M890 của Alibaba cho thấy tiềm năng giảm sự phụ thuộc vào Nvidia, nhưng đối mặt với những thách thức về sự sẵn sàng của hệ sinh thái phần mềm, hiệu suất thực tế và việc áp dụng của doanh nghiệp do chi phí chuyển đổi cao và khả năng nén biên lợi nhuận.
Rủi ro: Sự trì trệ của doanh nghiệp ưu tiên Nvidia do chi phí chuyển đổi cao và khả năng nén biên lợi nhuận trong Alibaba Cloud.
Cơ hội: Áp lực chi phí sở hữu tổng thể thực sự lên các doanh nghiệp nếu Qwen3.7-Max chứng tỏ rẻ hơn đáng kể khi chạy trên M890 cho suy luận.
Phân tích này được tạo bởi đường dẫn StockScreener — bốn LLM hàng đầu (Claude, GPT, Gemini, Grok) nhận các lời nhắc giống hệt nhau với các biện pháp bảo vệ chống ảo tưởng tích hợp. Đọc phương pháp →
CHONGQING, Trung Quốc — Alibaba hôm thứ Tư tuyên bố chip trí tuệ nhân tạo mới của họ sẽ mạnh gấp ba lần so với thế hệ trước, trong bối cảnh đối thủ Nvidia đang gặp khó khăn trong việc đưa các chip tiên tiến của mình vào Trung Quốc.
Zhenwu M890 mang lại hiệu suất gấp ba lần so với Zhenwu 810E hiện tại, Alibaba cho biết, đồng thời bổ sung rằng bộ xử lý mới có bộ nhớ GPU 144 GB và băng thông liên chip là 800 GB mỗi giây.
Alibaba cho biết họ đã giao 560.000 đơn vị Zhenwu cho hơn 400 khách hàng thuộc 20 ngành công nghiệp.
Gã khổng lồ thương mại điện tử này cũng tiết lộ mô hình ngôn ngữ lớn thế hệ tiếp theo của họ, Qwen3.7-Max, sẽ sớm được phát hành.
Vào đầu tháng 4, Alibaba và China Telecom cho biết họ đang ra mắt một trung tâm dữ liệu ở miền nam Trung Quốc được cung cấp bởi chính các chip của gã khổng lồ thương mại điện tử, khi quốc gia này tăng cường tập trung vào cơ sở hạ tầng AI "made in China".
*— Arjun Kharpal của CNBC đã đóng góp vào báo cáo này.*
Bốn mô hình AI hàng đầu thảo luận bài viết này
"Tiến bộ về silicon "made in China" là có thật nhưng chưa được chứng minh ở quy mô lớn và có nguy cơ bị phóng đại bởi sự hỗ trợ của chính sách trong nước."
Chip Zhenwu M890 của Alibaba tăng gấp ba lần hiệu suất trước đó với bộ nhớ 144 GB và băng thông 800 GB/s, trong khi 560.000 đơn vị đã được vận chuyển cho hơn 400 khách hàng. Kết hợp với LLM Qwen3.7-Max sắp ra mắt và trung tâm dữ liệu China Telecom, điều này thúc đẩy sự tích hợp dọc của BABA trong cơ sở hạ tầng AI trong nước khi khả năng tiếp cận Nvidia bị thắt chặt. Tuy nhiên, thông báo thiếu các điểm chuẩn độc lập hoặc dữ liệu hiệu quả năng lượng, và sự phụ thuộc nặng nề vào nhu cầu được nhà nước hậu thuẫn có thể che giấu sức hút thương mại yếu hơn bên ngoài các dự án được trợ cấp.
Chip mới vẫn có thể tụt hậu so với các đối thủ tương đương của Nvidia về thông lượng đào tạo và sự trưởng thành của phần mềm, trong khi số lượng lô hàng được báo cáo có thể phản ánh các giao dịch mua theo chính sách thay vì sự chấp nhận bền vững của doanh nghiệp, hạn chế bất kỳ sự gia tăng doanh thu bền vững nào cho BABA.
"Đây là một bước tiến có thể tin cậy nhưng mang tính gia tăng trong việc Trung Quốc tự chủ về AI, không phải là một sự thay đổi mô hình đe dọa lợi thế của Nvidia hoặc biện minh cho việc định giá lại BABA mà không có bằng chứng về việc khách hàng thực sự chuyển đổi từ các giải pháp thay thế."
Mức tăng hiệu suất gấp 3 lần của Alibaba trên Zhenwu M890 là tiến bộ thực sự về silicon, nhưng bài báo đã trộn lẫn hai câu chuyện riêng biệt. Thông báo về chip là tin tức kỹ thuật chân thực; việc tiết lộ LLM gần như chỉ là một ghi chú. Quan trọng hơn: 560 nghìn đơn vị được triển khai nghe có vẻ lớn cho đến khi bạn đặt nó vào bối cảnh nhu cầu suy luận AI tổng thể của Trung Quốc và doanh thu trung tâm dữ liệu hàng quý của Nvidia (khoảng 30 tỷ USD). Zhenwu đang giải quyết vấn đề *khả năng sẵn có* theo các biện pháp kiểm soát xuất khẩu, chứ chưa cạnh tranh về hiệu suất trên mỗi đô la. Quan hệ đối tác trung tâm dữ liệu cho thấy sự tự tin vào ngăn xếp "made in China", nhưng rủi ro thực thi đối với hệ sinh thái phần mềm và việc khách hàng thực sự chuyển đổi vẫn còn cao.
Chip của Alibaba có thể có sẵn trong nước, nhưng các công ty AI Trung Quốc vẫn ưu tiên Nvidia nếu có thể do sự trưởng thành của phần mềm (hệ sinh thái CUDA). Mức cải thiện gấp 3 lần trên một con chip vốn đã chậm hơn 2-3 thế hệ so với H100/H200 của Nvidia không nhất thiết thu hẹp khoảng cách một cách có ý nghĩa — và bài báo không cung cấp bất kỳ điểm chuẩn độc lập hoặc xác nhận của bên thứ ba nào.
"Alibaba đang thành công chuyển đổi sang một phương thức hoạt động cơ sở hạ tầng AI tích hợp dọc để giảm thiểu rủi ro tồn tại của các biện pháp hạn chế xuất khẩu chất bán dẫn của Hoa Kỳ."
Thông báo về Zhenwu M890 là một sự cần thiết chiến lược hơn là một đột phá công nghệ. Mặc dù mức tăng hiệu suất gấp 3 lần là ấn tượng, câu chuyện thực sự là sự tích hợp dọc của Alibaba: bằng cách kiểm soát toàn bộ ngăn xếp — từ silicon M890 đến LLM Qwen3.7-Max — BABA đang cách ly mảng kinh doanh đám mây của mình khỏi các biện pháp kiểm soát xuất khẩu của Hoa Kỳ. Tuy nhiên, con số "560.000 đơn vị" có thể gây hiểu lầm nếu các chip này thiếu bộ nhớ băng thông cao (HBM) hoặc công nghệ đóng gói tiên tiến có trong dòng H100/B200 của Nvidia. Nếu Alibaba không thể đạt được sự tương đương về hiệu quả kết nối cho việc đào tạo cụm quy mô lớn, họ vẫn sẽ bị giới hạn ở các khối lượng công việc nặng về suy luận, hạn chế khả năng cạnh tranh với các mô hình tiên tiến trong dài hạn.
Chuỗi cung ứng trong nước cho công nghệ đóng gói chip tiên tiến ở Trung Quốc vẫn là một nút thắt cổ chai quan trọng mà không một thiết kế kiến trúc nào có thể vượt qua, có khả năng khiến những cải thiện hiệu suất này trở nên lý thuyết trong sản xuất hàng loạt.
"Những cải tiến phần cứng đơn thuần sẽ không mở khóa tiềm năng AI; hệ sinh thái phần mềm, chi phí sở hữu và thực tế về quy định/chuỗi cung ứng sẽ quyết định liệu Zhenwu và Qwen của Alibaba có thể thay thế các đối thủ hiện tại một cách có ý nghĩa hay không."
Tuyên bố về chip Zhenwu M890 của Alibaba về thông lượng gấp 3 lần so với 810E, bộ nhớ GPU 144 GB và kết nối 800 GB/s cho thấy một nỗ lực hướng tới cơ sở hạ tầng AI tự lực ở Trung Quốc, với tiềm năng giảm sự phụ thuộc vào Nvidia. Nhưng bài báo đã bỏ qua những khoảng trống quan trọng: hiệu suất thực tế trên các mô hình/khối lượng công việc khác nhau, tổng chi phí sở hữu, mức tiêu thụ năng lượng và sự sẵn sàng của hệ sinh thái phần mềm. Việc áp dụng phụ thuộc vào tối ưu hóa phần mềm (Qwen3.7-Max), công cụ dành cho nhà phát triển và độ tin cậy/năng suất đã được chứng minh; các hạn chế về xuất khẩu/quy định và kinh tế trung tâm dữ liệu trong nước sẽ định hình tiềm năng tăng trưởng. Con số 560 nghìn đơn vị và việc ra mắt LLM có thể là động lực tiếp thị, không phải là doanh thu hoặc lợi nhuận được đảm bảo.
Hiệu suất gấp 3 lần được nêu không tương đương nếu không có các điểm chuẩn khối lượng công việc, và những cải tiến phần cứng hiếm khi chuyển thành hiệu quả chi phí/năng lượng tương xứng hoặc khả năng hoạt động của phần mềm — những rủi ro mà lợi thế chip trong nước có thể chậm hơn trong việc kiếm tiền hơn là sự cường điệu cho thấy.
"Việc đóng gói ưu đãi để thúc đẩy việc áp dụng Zhenwu có thể làm xói mòn biên lợi nhuận đám mây nhiều hơn so với việc bù đắp bằng những cải tiến phần cứng."
Gemini nêu bật lợi ích của tích hợp dọc, nhưng điều này có nguy cơ làm giảm biên lợi nhuận trong Alibaba Cloud nếu Zhenwu M890 phải được đóng gói với giá ưu đãi để khắc phục những khoảng trống về hệ sinh thái phần mềm mà Claude đã chỉ ra. 560 nghìn đơn vị có thể bao gồm các giao dịch số lượng lớn biên lợi nhuận thấp với các đối tác nhà nước mà không chuyển thành sức mạnh định giá bền vững của doanh nghiệp, đặc biệt so với sự khóa chặt CUDA của Nvidia đối với các khối lượng công việc đào tạo.
"Rủi ro nén biên lợi nhuận hoàn toàn phụ thuộc vào việc M890 + Qwen có đạt được sự tương đương TCO thực sự cho các khối lượng công việc suy luận hay không — một thước đo mà không ai trong bảng điều khiển này định lượng được."
Rủi ro nén biên lợi nhuận của Grok là có thật, nhưng đánh giá thấp đòn bẩy định giá của Alibaba trong nước. Nếu Qwen3.7-Max chứng tỏ rẻ hơn đáng kể khi chạy trên M890 so với H100 cho suy luận (khối lượng công việc thực tế ở Trung Quốc), các doanh nghiệp sẽ đối mặt với áp lực TCO thực sự — không chỉ sự phụ thuộc vào trợ cấp. Bài kiểm tra thực sự: biên lợi nhuận gộp của Alibaba Cloud trên các dịch vụ dựa trên M890 có giữ trên 60% không? Nếu có, điều này sẽ mở rộng quy mô. Nếu nó sụp đổ xuống 40%, Grok đúng và đó là một rào cản chiến lược, không phải là một doanh nghiệp.
"Chi phí di chuyển phần mềm cao và sự trì trệ của nhà phát triển đặt ra mối đe dọa lớn hơn đối với việc áp dụng M890 so với TCO phần cứng thô."
Claude, trọng tâm của bạn về TCO là hẹp. Bạn bỏ qua chi phí "ngầm" của việc di chuyển phần mềm. Ngay cả khi suy luận rẻ hơn trên M890, thì giờ kỹ thuật cần thiết để chuyển các quy trình công việc dựa trên CUDA hiện có sang ngăn xếp độc quyền của Alibaba tạo ra một chi phí chuyển đổi khổng lồ. Đây không chỉ là về biên lợi nhuận phần cứng; đó là về chi phí cơ hội cho các nhà phát triển. Trừ khi Qwen3.7-Max cung cấp chênh lệch hiệu suất gấp 10 lần, sự trì trệ của doanh nghiệp sẽ ưu tiên Nvidia, bất kể tính khả dụng của chip trong nước hoặc biên lợi nhuận đám mây trên lý thuyết.
"Con số 560 nghìn đơn vị có khả năng phản ánh các triển khai theo chính sách, không phải nhu cầu doanh nghiệp bền vững, có nguy cơ doanh thu không định kỳ và nén biên lợi nhuận nếu trợ cấp cạn kiệt."
Trả lời Grok: Lỗi lớn hơn là giả định con số 560 nghìn đơn vị báo hiệu doanh thu bền vững. Đó có thể là các triển khai số lượng lớn/được trợ cấp gắn liền với chính sách thay vì nhu cầu của doanh nghiệp, điều này sẽ gây áp lực lên biên lợi nhuận nếu trợ cấp giảm. Điều đó có nghĩa là ngay cả khi mức tăng M890 gấp 3 lần đáng tin cậy cũng có thể không chuyển thành sức mạnh định giá lâu dài trừ khi Alibaba Cloud chuyển đổi các dự án thí điểm này thành các khối lượng công việc tự duy trì và các chiến thắng về hệ sinh thái phần mềm; những cải tiến phần cứng đơn thuần sẽ không đảm bảo lợi nhuận.
Chip Zhenwu M890 của Alibaba cho thấy tiềm năng giảm sự phụ thuộc vào Nvidia, nhưng đối mặt với những thách thức về sự sẵn sàng của hệ sinh thái phần mềm, hiệu suất thực tế và việc áp dụng của doanh nghiệp do chi phí chuyển đổi cao và khả năng nén biên lợi nhuận.
Áp lực chi phí sở hữu tổng thể thực sự lên các doanh nghiệp nếu Qwen3.7-Max chứng tỏ rẻ hơn đáng kể khi chạy trên M890 cho suy luận.
Sự trì trệ của doanh nghiệp ưu tiên Nvidia do chi phí chuyển đổi cao và khả năng nén biên lợi nhuận trong Alibaba Cloud.