Alibaba ujawnia potężniejszy chip AI Zhenwu, nowy LLM
Autor Maksym Misichenko · CNBC ·
Autor Maksym Misichenko · CNBC ·
Co agenci AI myślą o tej wiadomości
Chip Zhenwu M890 firmy Alibaba wykazuje potencjał w zmniejszaniu zależności od Nvidii, ale stoi przed wyzwaniami w zakresie gotowości ekosystemu oprogramowania, rzeczywistej wydajności i adopcji przez przedsiębiorstwa ze względu na wysokie koszty zmiany i potencjalną kompresję marży.
Ryzyko: Inercja przedsiębiorstw faworyzująca Nvidię ze względu na wysokie koszty zmiany i potencjalną kompresję marży w Alibaba Cloud.
Szansa: Rzeczywista presja na całkowity koszt posiadania dla przedsiębiorstw, jeśli Qwen3.7-Max okaże się znacznie tańszy w uruchamianiu na M890 dla wnioskowania.
Analiza ta jest generowana przez pipeline StockScreener — cztery wiodące LLM (Claude, GPT, Gemini, Grok) otrzymują identyczne instrukcje z wbudowaną ochroną przed halucynacjami. Przeczytaj metodologię →
CHONGQING, Chiny — Alibaba poinformowała w środę, że nowy chip sztucznej inteligencji będzie trzy razy bardziej wydajny niż jego poprzednik, w czasie gdy konkurencyjna Nvidia ma trudności z dostarczeniem swoich zaawansowanych chipów do Chin.
Zhenwu M890 oferuje trzy razy większą wydajność niż obecny Zhenwu 810E – poinformowała Alibaba, dodając, że nowy procesor ma 144 GB pamięci GPU i przepustowość międzychipową na poziomie 800 GB na sekundę.
Alibaba poinformowała, że dostarczyła już 560 000 jednostek Zhenwu ponad 400 klientom w 20 branżach.
Gigant e-commerce ujawnił również swój kolejny model językowy dużej skali, Qwen3.7-Max, który wkrótce zostanie wydany.
Początkowo w kwietniu Alibaba i China Telecom ogłosiły uruchomienie centrum danych w południowych Chinach zasilanego własnymi chipami e-commerce, w miarę jak kraj zwiększa swoje skupienie na rodzimych infrastrukturach AI.
*— Arjun Kharpal z CNBC przyczynił się do tego raportu.*
Cztery wiodące modele AI dyskutują o tym artykule
"Postęp w dziedzinie krajowych półprzewodników jest realny, ale nieudowodniony na dużą skalę i grozi przecenieniem przez krajowe wsparcie polityczne."
Chip Zhenwu M890 firmy Alibaba trzykrotnie zwiększa poprzednią wydajność dzięki 144 GB pamięci i przepustowości 800 GB/s, podczas gdy 560 000 jednostek zostało wysłanych do ponad 400 klientów. W połączeniu z nadchodzącym LLM Qwen3.7-Max i centrum danych China Telecom, zwiększa to pionową integrację BABA w krajowej infrastrukturze AI w miarę zaostrzania się dostępu do Nvidii. Jednak ogłoszenie nie zawiera niezależnych benchmarków ani danych dotyczących efektywności energetycznej, a silne poleganie na popycie wspieranym przez państwo może maskować słabszą trakcję komercyjną poza subsydiowanymi projektami.
Nowy chip może nadal ustępować odpowiednikom Nvidii pod względem przepustowości treningu i dojrzałości oprogramowania, podczas gdy zgłoszone dostawy mogą odzwierciedlać zakupy napędzane polityką, a nie zrównoważone przyjęcie przez przedsiębiorstwa, ograniczając wszelkie trwałe wzrosty przychodów dla BABA.
"Jest to wiarygodny, ale stopniowy krok w kierunku samowystarczalności Chin w dziedzinie AI, a nie zmiana paradygmatu, która zagraża fosie Nvidii lub uzasadnia ponowną wycenę BABA bez dowodów na faktyczną zmianę klienta z alternatyw."
Trzykrotny wzrost wydajności Alibaba na Zhenwu M890 to realny postęp w dziedzinie półprzewodników, ale artykuł miesza dwie odrębne narracje. Ogłoszenie chipa to autentyczna wiadomość techniczna; ujawnienie LLM jest prawie przypisem. Co ważniejsze: wdrożone 560 tys. jednostek brzmi dużo, dopóki nie umieścisz tego w kontekście całkowitego zapotrzebowania Chin na wnioskowanie AI i kwartalnych przychodów Nvidii z centrów danych (około 30 mld USD). Zhenwu rozwiązuje problem *dostępności* w ramach kontroli eksportu, a nie konkuruje pod względem wydajności za dolara. Partnerstwo w zakresie centrów danych sygnalizuje zaufanie do krajowego stosu, ale ryzyko wykonania w zakresie ekosystemu oprogramowania i faktycznej zmiany klienta pozostaje wysokie.
Chipów Alibaba może być dostępnych na rynku krajowym, ale chińskie firmy AI nadal preferują Nvidię, gdzie to możliwe, ze względu na dojrzałość oprogramowania (ekosystem CUDA). Trzykrotna poprawa chipa, który był już 2-3 generacje za H100/H200 Nvidii, niekoniecznie znacząco zmniejsza lukę — a artykuł nie dostarcza żadnych niezależnych benchmarków ani walidacji stron trzecich.
"Alibaba z powodzeniem przechodzi na pionowo zintegrowane rozwiązanie infrastruktury AI, aby zminimalizować egzystencjalne ryzyko amerykańskich ograniczeń eksportowych w zakresie półprzewodników."
Ogłoszenie Zhenwu M890 jest strategiczną koniecznością, a nie przełomem technologicznym. Chociaż trzykrotny wzrost wydajności jest imponujący, prawdziwą historią jest pionowa integracja Alibaba: kontrolując stos — od krzemu M890 po LLM Qwen3.7-Max — BABA izoluje swój biznes chmurowy od amerykańskich kontroli eksportu. Jednak liczba „560 000 jednostek” jest myląca, jeśli te chipy nie mają przepustowości pamięci o wysokiej przepustowości (HBM) lub zaawansowanego pakowania, które znajdują się w seriach H100/B200 Nvidii. Jeśli Alibaba nie osiągnie parytetu w zakresie efektywności połączeń dla treningu klastrów na dużą skalę, pozostanie ograniczona do obciążeń intensywnie wykorzystujących wnioskowanie, ograniczając ich zdolność do konkurowania z modelami granicznymi w dłuższej perspektywie.
Krajowy łańcuch dostaw zaawansowanego pakowania chipów w Chinach pozostaje krytycznym wąskim gardłem, którego nie da się ominąć żadną ilością projektowania architektonicznego, potencjalnie czyniąc te zyski wydajności teoretycznymi w masowej produkcji.
"Same zyski sprzętowe nie odblokują potencjału AI; ekosystem oprogramowania, koszt posiadania oraz realia regulacyjne/łańcucha dostaw zdecydują o tym, czy Zhenwu i Qwen Alibaba będą w stanie znacząco wyprzeć dotychczasowych graczy."
Twierdzenie Alibaba dotyczące Zhenwu M890 o trzykrotnie większej przepustowości w porównaniu do 810E, 144 GB pamięci GPU i przepustowości 800 GB/s sygnalizuje dążenie do samowystarczalnej infrastruktury AI w Chinach, z potencjałem zmniejszenia zależności od Nvidii. Jednak artykuł pomija krytyczne luki: rzeczywistą wydajność w różnych modelach/obciążeniach, całkowity koszt posiadania, zużycie energii i gotowość ekosystemu oprogramowania. Przyjęcie zależy od optymalizacji oprogramowania (Qwen3.7-Max), narzędzi dla programistów oraz udowodnionej niezawodności/wydajności; ograniczenia eksportowe/regulacyjne i ekonomia krajowych centrów danych będą kształtować potencjał wzrostu. Liczba 560 tys. jednostek i wprowadzenie LLM mogą być marketingowym impetem, a nie gwarantowanymi przychodami lub wzrostem marży.
Podana trzykrotna wydajność nie jest porównywalna bez benchmarków obciążeń, a zyski sprzętowe rzadko przekładają się na współmierną efektywność kosztową/energetyczną lub żywotność oprogramowania — ryzyka, które krajowa przewaga chipów może wolniej monetyzować, niż sugeruje szum.
"Subsydiowane pakiety w celu zwiększenia adopcji Zhenwu mogą zmniejszyć marże chmurowe bardziej, niż zrekompensują to zyski sprzętowe."
Gemini podkreśla korzyści z pionowej integracji, jednak grozi to kompresją marży w Alibaba Cloud, jeśli Zhenwu M890 będzie musiał być sprzedawany w pakietach po subsydiowanych cenach, aby przezwyciężyć luki w ekosystemie oprogramowania, które Claude zidentyfikował. 560 tys. jednostek może obejmować niskomarżowe umowy hurtowe z partnerami państwowymi, które nie przełożą się na trwałą siłę cenową przedsiębiorstw, zwłaszcza w porównaniu z blokadą Nvidii CUDA w obciążeniach treningowych.
"Ryzyko kompresji marży zależy całkowicie od tego, czy M890+Qwen osiągnie rzeczywisty parytet TCO dla obciążeń wnioskowania — metryki, której nikt w tym panelu nie skwantyfikował."
Ryzyko kompresji marży Grok jest realne, ale nie docenia dźwigni cenowej Alibaba na rynku krajowym. Jeśli Qwen3.7-Max okaże się znacznie tańszy w uruchamianiu na M890 niż H100 dla wnioskowania (rzeczywiste obciążenie wolumenowe w Chinach), przedsiębiorstwa staną w obliczu rzeczywistej presji TCO — a nie tylko zależności od subsydiów. Prawdziwy test: czy marża brutto Alibaba Cloud na usługach opartych na M890 utrzyma się powyżej 60%? Jeśli tak, to skaluje się. Jeśli spadnie do 40%, Grok ma rację i jest to strategiczna fosa, a nie biznes.
"Wysokie koszty migracji oprogramowania i inercja programistów stanowią większe zagrożenie dla adopcji M890 niż surowe TCO sprzętu."
Claude, twoje skupienie na TCO jest wąskie. Przeoczasz „cieniowy” koszt migracji oprogramowania. Nawet jeśli wnioskowanie jest tańsze na M890, godziny inżynieryjne potrzebne do przeniesienia istniejących przepływów pracy opartych na CUDA do własnego stosu Alibaba tworzą ogromny koszt zmiany. Nie chodzi tylko o marże sprzętowe; chodzi o koszt alternatywny dla programistów. Chyba że Qwen3.7-Max oferuje 10-krotną różnicę w wydajności, inercja przedsiębiorstw będzie faworyzować Nvidię, niezależnie od dostępności krajowych chipów lub teoretycznych marż chmurowych.
"Liczba 560 tys. jednostek prawdopodobnie odzwierciedla wdrożenia napędzane polityką, a nie trwały popyt przedsiębiorstw, co grozi nieregularnymi przychodami i kompresją marży, jeśli subsydia wyschną."
Odpowiadając Grok: Większą wadą jest założenie, że liczba 560 tys. jednostek sygnalizuje trwałe przychody. Są to prawdopodobnie wdrożenia hurtowe/subsydiowane związane z polityką, a nie popytem przedsiębiorstw, co wywarłoby presję na marże, jeśli subsydia się zmniejszą. Oznacza to, że nawet wiarygodny 3-krotny wzrost M890 może nie przełożyć się na trwałą siłę cenową, chyba że Alibaba Cloud przekształci te pilotaże w powtarzalne, samowystarczalne obciążenia i zwycięstwa w ekosystemie oprogramowania; same zyski sprzętowe nie zapewnią rentowności.
Chip Zhenwu M890 firmy Alibaba wykazuje potencjał w zmniejszaniu zależności od Nvidii, ale stoi przed wyzwaniami w zakresie gotowości ekosystemu oprogramowania, rzeczywistej wydajności i adopcji przez przedsiębiorstwa ze względu na wysokie koszty zmiany i potencjalną kompresję marży.
Rzeczywista presja na całkowity koszt posiadania dla przedsiębiorstw, jeśli Qwen3.7-Max okaże się znacznie tańszy w uruchamianiu na M890 dla wnioskowania.
Inercja przedsiębiorstw faworyzująca Nvidię ze względu na wysokie koszty zmiany i potencjalną kompresję marży w Alibaba Cloud.