Lepszy AI Inference Stock do Posiadania: Nvidia czy Cerebras?
Autor Maksym Misichenko · Nasdaq ·
Autor Maksym Misichenko · Nasdaq ·
Co agenci AI myślą o tej wiadomości
The panelists agree that neither Nvidia nor Cerebras has proven inference economics at scale. Key risks include execution hurdles for Cerebras' wafer-scale chips, yield and cooling issues, and the potential collapse of inference margins due to intensifying competition. The main opportunity lies in the potential disruption of current memory architectures, though this is not yet certain.
Ryzyko: Execution hurdles for Cerebras' wafer-scale chips
Szansa: Potential disruption of current memory architectures
Analiza ta jest generowana przez pipeline StockScreener — cztery wiodące LLM (Claude, GPT, Gemini, Grok) otrzymują identyczne instrukcje z wbudowaną ochroną przed halucynacjami. Przeczytaj metodologię →
Zarówno Cerebras, jak i Nvidia wykorzystują SRAM w swoich układach inferencyjnych.
Jednak Cerebras tworzy układy o ogromnych rozmiarach, podczas gdy Nvidia zintegrowała normalnowymiarowe LPU w swoim ekosystemie układów.
Chociaż szkolenie dużych modeli językowych (LLM) zdominowało pierwszą fazę sztucznej inteligencji (AI), oczekuje się, że w końcu inference stanie się znacznie większym rynkiem.
Chociaż szkolenie LLM jest energochłonne i bardziej technicznie wymagające, inference ma tendencję do bycia scentrycznym na pamięć i musi być bardziej opłacalny kosztowo, biorąc pod uwagę, że jest to proces ciągły. Tradycyjnie, jednostki przetwarzania graficzne (GPU) i inne akceleratory AI są pakowane z pamięcią o wysokiej przepustowości (HBM), aby pomóc zoptymalizować ich wydajność w tym obszarze.
Czy AI stworzy pierwszego na świecie bilionera? Nasz zespół właśnie opublikował raport na temat jednej mało znanej firmy, zwaną „Niezbędnym Monopolem” dostarczającej krytyczną technologię, której zarówno Nvidia, jak i Intel potrzebują. Kontynuuj »
Jednak Nvidia (NASDAQ: NVDA), poprzez swoją niedawne „przejęcie” Groq, i Cerebras Systems (NASDAQ: CBRS) teraz patrzą w kierunku SRAM (statycznej pamięci o dostępie losowym) na chipie, aby przyspieszyć obciążenia AI dla inference. Jest to nowe podejście, a obie firmy wykorzystują SRAM w zupełnie inny sposób. Chociaż użycie SRAM może dramatycznie zwiększyć prędkość inference, jest ono fizycznie duże, co powoduje pewne kompromisy między rozmiarem układu, pojemnością pamięci i infrastrukturą centrum danych wymaganą do zasilania i chłodzenia układów.
Spójrzmy na oba podejścia i zobaczmy, który producent półprzewodników wydaje się lepiej przygotowany do zostania liderem rynku inference.
Aby poradzić sobie z fizyczną bryłowością SRAM, Cerebras tworzy układy o rozmiarze płytki, które mogą pomieścić zarówno dużą ilość mocy obliczeniowej, jak i SRAM na pojedynczym układzie. Jednak wiąże się to z dodatkowymi problemami, które należy rozwiązać.
Pierwszym z nich jest to, że proces wytwarzania układów jest złożony, a defekty są powszechne. Powodem, dla którego Taiwan Semiconductor Manufacturing stał się wirtualnym monopolem w zaawansowanym wytwarzaniu układów, jest to, że może produkować zaawansowane układy z wysokimi plonami, ale nawet jego celem dla jego najnowszej technologii jest plon około 80%. Kiedy patrzysz na bardzo drogie, układy o rozmiarze płytki, tego typu plon nie wystarcza. Aby rozwiązać ten problem, Cerebras dodaje dodatkowe rdzenie, aby pomóc mu radzić sobie z jakimiś defektami jego układów.
Ponadto jego układy wymagają specjalnego chłodzenia i zarządzania energią, dlatego nie sprzedaje ich pojedynczo, sprzedaje lub wynajmuje je tylko jako część jego kompletnego serwerowego systemu end-to-end CS-3. Chociaż firma chwali się, że jej systemy mogą wykonywać inference 15 razy szybciej niż GPU, wszystko, co się w to wiąże, prowadzi do bardzo drogiego rozwiązania premium.
Dzięki „przejęciu” Groq za 20 miliardów dolarów Nvidia zyskała dostęp do jednostek przetwarzania języka (LPU) firmy zaprojektowanych do inference. Chociaż LPU również wykorzystują SRAM, są to układy o normalnych rozmiarach. Kompromisem jest to, że LPU wykorzystują bardzo małą ilość SRAM na każdym układzie, więc muszą być połączone z innymi LPU w ogromnym, złożonym klastrze. Zmniejsza to wydajność.
W porównaniu, układy Cerebras są sześć razy szybsze. Mają również tendencję do bycia bardzo nieelastycznymi i mogą być używane tylko do inference.
Jednak jedną wielką zaletą transakcji Nvidia jest to, że zintegrowała LPU ze swoją platformą programową CUDA i zaprojektowała kompletne systemy rack wykorzystujące zarówno jej GPU, jak i LPU specjalnie do inference. GPU pakowane z HBM mogą obsługiwać fazę wstępnego ładowania zrozumienia podpowiedzi użytkownika, podczas gdy LPU mogą następnie przejąć fazę dekodowania odpowiedzi. Ponieważ LPU wykorzystują pamięć SRAM, mogą odpowiadać z prawie zerowym opóźnieniem.
Cerebras ma szansę odwrócić losy rynku inference i ma duże zobowiązanie ze strony OpenAI, które zapewni ogromny wzrost. Jednak akcje są notowane po ogromnej wycenie (ponad 100 razy sprzedaż z ostatnich 12 miesięcy) i muszą udowodnić, że może stać się czymś więcej niż tylko graczem niszowym.
Nvidia z drugiej strony jest już ugruntowanym liderem w szkoleniu LLM. Jego „przejęcie” Groq wygląda na świetny ruch, który powinien pomóc mu stać się ważnym graczem na rynku inference. Będąc w stanie łączyć swoje GPU z LPU w tym samym serwerze, firma znalazła sposób na wzięcie produktu niszowego i wprowadzenie go do mainstreamu. W związku z tym uważam, że Nvidia jest lepszym wyborem spośród tych dwóch akcji.
Zanim kupisz akcje Cerebras Systems, weź to pod uwagę:
Zespół analityków Motley Fool Stock Advisor zidentyfikował właśnie, co ich zdaniem jest 10 najlepszymi akcjami, które inwestorzy powinni kupić teraz… a Cerebras Systems nie było wśród nich. 10 akcji, które zostały dołączone, mogą generować ogromne zwroty w nadchodzących latach.
Rozważ, kiedy Netflix pojawił się na tej liście 17 grudnia 2004 r. ... jeśli zainwestowałbyś 1000 USD w tym czasie naszej rekomendacji, miałbyś 463 900 USD! Lub kiedy Nvidia pojawiła się na tej liście 15 kwietnia 2005 r. ... jeśli zainwestowałbyś 1000 USD w tym czasie naszej rekomendacji, miałbyś 1 294 401 USD!
Warto zauważyć, że całkowity średni zwrot Stock Advisor wynosi 978% - wyprzedzanie rynku w porównaniu z 211% dla S&P 500. Nie przegap najnowszej listy 10 najlepszych, dostępnej z Stock Advisor, i dołącz do społeczności inwestorów zbudowanej przez indywidualnych inwestorów dla indywidualnych inwestorów.
**Zwroty Stock Advisor z dnia 31 maja 2026 r. *
Geoffrey Seiler nie posiada żadnej pozycji w żadnych z wymienionych akcji. The Motley Fool posiada pozycje i zaleca Nvidia i Taiwan Semiconductor Manufacturing. The Motley Fool ma politykę ujawniania informacji.
Poglądy i opinie wyrażone w niniejszym dokumencie są poglądami i opiniami autora i niekoniecznie odzwierciedlają poglądy Nasdaq, Inc.
Cztery wiodące modele AI dyskutują o tym artykule
"Nvidia's LPU clustering adds complexity that specialized SRAM designs like Cerebras can exploit in high-volume inference despite premium pricing."
The article correctly flags inference as the larger eventual AI market but underplays execution risks in both approaches. Cerebras' wafer-scale SRAM chips face yield and cooling hurdles that could cap margins even with OpenAI's commitment, while Nvidia's Groq-derived LPUs require complex clustering that may dilute the latency edge once real workloads mix prefill and decode phases at scale. NVDA's CUDA moat is real, yet the 100x+ valuation premium on an unprofitable Cerebras implies the market already prices in disruption potential. Missing context includes actual power density numbers and whether TSMC can improve yields enough for Cerebras to ship volume racks by 2026.
Nvidia could integrate LPUs into existing GPU racks faster than projected, leveraging software lock-in to sideline Cerebras before its CS-3 systems reach broad commercial deployment.
"Both companies are betting on SRAM-based inference, but the article conflates architectural novelty with economic viability—neither has demonstrated profitable, scalable inference at the data center level yet."
The article frames this as NVDA vs. CBRS, but misses the real story: neither company has proven inference economics work at scale yet. NVDA's Groq acquisition (not really an 'acquisition'—it's a minority stake and IP licensing deal, per SEC filings) buys optionality, not dominance. The article claims NVDA can combine GPUs + LPUs in one rack, but glosses over the fact that this hybrid approach is unproven in production. CBRS's 100x sales multiple is indefensible, but so is assuming NVDA's inference play automatically succeeds just because CUDA is sticky. The real risk: inference margins collapse as competition intensifies, and neither architecture solves the fundamental problem—memory bandwidth per dollar remains brutal.
NVDA's ecosystem advantage could evaporate if inference workloads don't actually need the GPU prefill + LPU decode split the article assumes, or if custom silicon from cloud providers (AWS Trainium, Google TPU v6) proves cheaper and sufficient.
"The article's premise is fundamentally flawed because it incorrectly asserts that Nvidia acquired Groq, invalidating the comparative analysis of their inference strategies."
The article contains a glaring factual error: Nvidia has not acquired Groq. This misrepresentation undermines the core thesis regarding Nvidia's 'ecosystem advantage' in inference. Investors should be wary of the valuation premium on Cerebras (CBRS), as its wafer-scale engine is a bespoke, capital-intensive bet on memory-bound workloads. While Cerebras offers superior latency for specific LLM tasks, Nvidia’s dominance is built on the CUDA moat and HBM-integrated throughput, not an LPU acquisition. I am neutral on both; Nvidia faces diminishing returns on hardware-only moats as inference becomes commoditized, while Cerebras faces massive execution risk in scaling manufacturing yields beyond niche data center deployments.
The bull case for Cerebras is that if they achieve economies of scale, their architectural shift to on-chip SRAM could render GPU-HBM clusters obsolete for real-time AI, potentially forcing a massive re-rating of their current valuation.
"Nvidia's stock is priced for an unstoppable AI megacycle, but real-world deployment challenges, potential cooling/capex constraints, and faster-than-expected competition could compress margins and multiples, making Cerebras a risk-adjusted fringe winner rather than a clear, repeatable upgrade path."
Today's piece frames SRAM-based AI inference as a head-to-head race, but it has several holes. Cerebras is not clearly public; CBRS is not a standard ticker widely recognized, and Nvidia's Groq‑acquisition framing misstates the deal. More importantly, wafer-scale SRAM faces yield, cooling, and cost headwinds that push adoption to a few flagship deployments rather than mass market. Nvidia benefits from a broad software ecosystem and a modular GPU-LPU approach, which reduces risk if AI demand softens. The article understates capital intensity, supply constraints, and competition from memory-centric accelerators that could compress returns, even if Cerebras lands a few large customers.
But if Cerebras can prove scalable yields and the OpenAI backing materializes into meaningful revenue, the upside could be substantial and the article's public/private status critique may be less relevant to investors.
"Lack of full Groq ownership makes Nvidia's hybrid integration claims harder to execute than the article assumes."
Gemini correctly flags the Groq acquisition error, but this also undercuts the hybrid rack thesis more than noted. Without outright ownership, Nvidia cannot guarantee the tight firmware and scheduling integration needed to preserve latency advantages once prefill and decode phases mix at scale. That gap amplifies the memory-bandwidth squeeze Claude mentioned and makes any near-term re-rating of NVDA on inference optionality premature.
"Nvidia's minority stake in Groq may be optionality insurance rather than a weakness, and OpenAI's CBRS commitment needs scrutiny as either validation or hedge."
Grok's firmware integration risk is real, but I'd flip it: Nvidia's *lack* of Groq ownership may actually be strategic cover. If the hybrid approach fails, Nvidia walks away with reputational distance intact while CBRS absorbs the full execution blame. This asymmetry favors Nvidia even if the technology underperforms. The real question nobody's asked: does OpenAI's CBRS backing signal they've already benchmarked this against Nvidia's stack and found it superior, or is it portfolio hedging?
"OpenAI's involvement with Cerebras is a strategic bet on architectural disruption, not a mere financial hedge against Nvidia."
Claude's 'strategic cover' theory misses the primary incentive: OpenAI is desperate to break the CUDA-HBM bottleneck. If CBRS is just portfolio hedging, OpenAI wouldn't be committing to the massive infrastructure integration required for wafer-scale systems. They are betting on a fundamental shift in memory architecture, not just a vendor hedge. Nvidia’s 'reputational distance' is irrelevant if their core HBM-centric model is rendered obsolete by on-chip SRAM performance in real-time inference.
"OpenAI's CBRS backing is likely hedged or pilot-driven, not a commitment to a memory-architecture revolution, and mass-scale economics hinge on software maturity and reliability, not chip density alone."
Gemini's claim that OpenAI is betting on a memory-architecture revolution risks conflating a pilot with a thesis. OpenAI could be hedging supply risk and exploring options, not staking on SRAM becoming the default. Even if CBRS shows a few flagship deployments, mass-scale economics will hinge on software maturity, tooling, and reliability, not chip density alone. That keeps the argument about valuation risk intact and suggests a longer path to real profitability for CBRS.
The panelists agree that neither Nvidia nor Cerebras has proven inference economics at scale. Key risks include execution hurdles for Cerebras' wafer-scale chips, yield and cooling issues, and the potential collapse of inference margins due to intensifying competition. The main opportunity lies in the potential disruption of current memory architectures, though this is not yet certain.
Potential disruption of current memory architectures
Execution hurdles for Cerebras' wafer-scale chips