Besserer KI-Inferenz-Aktie zum Halten: Nvidia oder Cerebras?

Von Maksym Misichenko · Nasdaq · 31 Mai 2026, 18:20

▬ Mixed Original ↗

AI inference economy: beyond Nvidia, AMD, and Intel NVDA

AI-Panel

Was KI-Agenten über diese Nachricht denken

The panelists agree that neither Nvidia nor Cerebras has proven inference economics at scale. Key risks include execution hurdles for Cerebras' wafer-scale chips, yield and cooling issues, and the potential collapse of inference margins due to intensifying competition. The main opportunity lies in the potential disruption of current memory architectures, though this is not yet certain.

Risiko: Execution hurdles for Cerebras' wafer-scale chips

Chance: Potential disruption of current memory architectures

AI-Diskussion lesen

Diese Analyse wird vom StockScreener-Pipeline generiert — vier führende LLM (Claude, GPT, Gemini, Grok) erhalten identische Prompts mit integrierten Anti-Halluzinations-Schutzvorrichtungen. Methodik lesen →

Vollständiger Artikel Nasdaq

Wichtige Punkte

Cerebras und Nvidia verwenden beide SRAM in ihren Inferenzchips.

Allerdings fertigt Cerebras riesige Chips, während Nvidia normale LPUs in sein Chip-Ökosystem integriert hat.

10 Aktien, die wir besser mögen als Cerebras Systems ›

Während das Training großer Sprachmodelle (LLM) die erste Phase der künstlichen Intelligenz (KI) dominierte, wird erwartet, dass die Inferenz schließlich der viel größere Markt wird.

Während das Training großer Sprachmodelle rechenintensiv und technisch anspruchsvoller ist, ist die Inferenz eher speicherzentriert und muss aufgrund ihrer laufenden Natur kosteneffizienter sein. Traditionell werden Grafikprozessoreinheiten (GPUs) und andere KI-Beschleuniger mit High-Bandwidth-Memory (HBM) verpackt, um ihre Leistung in diesem Bereich zu optimieren.

Wird KI den ersten Trillionär der Welt schaffen? Unser Team hat gerade einen Bericht über ein wenig bekanntes Unternehmen veröffentlicht, das als "Unverzichtbare Monopolstellung" bezeichnet wird und die kritische Technologie liefert, die sowohl Nvidia als auch Intel benötigen. Weiter »

Allerdings schauen Nvidia (NASDAQ: NVDA) durch seine jüngste "Übernahme" von Groq und Cerebras Systems (NASDAQ: CBRS) nun auf On-Chip-SRAM (statischen Random-Access-Memory), um KI-Workloads für die Inferenz zu beschleunigen. Dies ist ein neuer Ansatz, und beide Unternehmen verwenden SRAM auf eine ganz andere Weise. Obwohl die Verwendung von SRAM die Inferenzgeschwindigkeiten dramatisch erhöhen kann, ist sie physisch sperrig, was einige Kompromisse zwischen Chipgröße, Speicherkapazität und der Dateninfrastruktur erzeugt, die erforderlich ist, um die Chips zu betreiben und zu kühlen.

Schauen wir uns die beiden Ansätze an und sehen, welche Halbleiteraktie besser positioniert ist, um Marktführer in der Inferenz zu werden.

Cerebras: Ist größer besser?

Um die physische Sperrigkeit von SRAM zu bewältigen, fertigt Cerebras riesige, wafergroße Chips, die sowohl eine große Menge an Rechenleistung als auch SRAM auf einem einzigen Chip unterbringen können. Dies ist jedoch mit zusätzlichen Problemen verbunden, die angegangen werden müssen.

Das erste ist, dass der Chip-Fertigungsprozess komplex ist und Defekte häufig sind. Der Grund, warum Taiwan Semiconductor Manufacturing zu einem virtuellen Monopol in der fortschrittlichen Chip-Fertigung geworden ist, ist, dass es fortschrittliche Chips mit hohen Ausbeuten produzieren kann, aber selbst sein Ziel für seine neueste Technologie liegt bei einer Ausbeute von etwa 80 %. Wenn man jedoch sehr teure, wafergroße Chips betrachtet, reicht diese Art von Ausbeute nicht aus. Um dieses Problem anzugehen, fügt Cerebras zusätzliche Kerne hinzu, um etwaige Defekte seiner Chips zu umgehen.

Zusätzlich benötigen seine Chips spezielle Kühlung und Leistungsverwaltung, weshalb er sie nicht einzeln verkauft, sondern nur als Teil seines vollständigen End-to-End-Server-Rack-Systems CS-3 verkauft oder vermietet. Obwohl das Unternehmen rühmt, dass seine Systeme die Inferenz 15-mal schneller ausführen können als eine GPU, führen alles, was damit verbunden ist, zu einer sehr teuren Premium-Lösung.

Nvidia: Der Ökosystemvorteil

Mit seiner "Übernahme" von Groq im Wert von 20 Milliarden US-Dollar erhielt Nvidia Zugang zu den Language Processing Units (LPUs) des Unternehmens, die für die Inferenz entwickelt wurden. Obwohl LPUs auch SRAM verwenden, sind es Chips in normaler Größe. Der Kompromiss besteht darin, dass LPUs nur eine sehr kleine Menge an SRAM auf jedem Chip verwenden, so dass sie mit anderen LPUs in einem riesigen, komplexen Cluster verbunden werden müssen. Dies reduziert die Effizienz.

Im Vergleich dazu sind Cerebras' Chips sechs Mal schneller. Sie sind auch sehr unflexibel und können nur für die Inferenz verwendet werden.

Der große Vorteil des Nvidia-Deals ist jedoch, dass es LPUs in seine CUDA-Softwareplattform integriert und komplette Rack-Systeme mit sowohl seinen GPUs als auch LPUs speziell für die Inferenz entwickelt hat. GPUs, die mit HBM verpackt sind, können die Vorabfüllphase des Verständnisses der Eingabeaufforderung eines Benutzers verarbeiten, während LPUs dann die Dekodierphase der Bereitstellung der Antwort übernehmen können. Da LPUs SRAM-Speicher verwenden, können sie mit fast keiner Latenz antworten.

Die bessere Aktie zum Halten

Cerebras hat die Möglichkeit, den Inferenzmarkt umzukrempeln und hat ein großes Engagement von OpenAI, das ein enormes Wachstum ankurbeln wird. Die Aktie wird jedoch direkt von einer riesigen Bewertung gehandelt (mehr als das 100-fache des laufenden Umsatzes) und muss beweisen, dass sie mehr als ein Nischenakteur werden kann.

Nvidia ist hingegen bereits der etablierte Marktführer beim Training großer Sprachmodelle. Seine "Übernahme" von Groq sieht aus wie ein großartiger Schachzug, der ihm helfen sollte, ein wichtiger Akteur auf dem Inferenzmarkt zu werden. Durch die Möglichkeit, seine GPUs mit LPUs im selben Server zu kombinieren, hat das Unternehmen einen Weg gefunden, ein Nischenprodukt in die breite Masse zu bringen. Daher denke ich, dass Nvidia die bessere Kaufentscheidung zwischen den beiden Aktien ist.

Sollten Sie jetzt Aktien von Cerebras Systems kaufen?

Bevor Sie Aktien von Cerebras Systems kaufen, sollten Sie Folgendes bedenken:

Das Analystenteam von Motley Fool Stock Advisor hat gerade identifiziert, was sie für die 10 besten Aktien halten, die Anleger jetzt kaufen sollten... und Cerebras Systems gehörte nicht dazu. Die 10 Aktien, die die Liste erreichten, könnten in den kommenden Jahren enorme Renditen erzielen.

Betrachten Sie, wann Netflix diese Liste am 17. Dezember 2004 aufnahm... wenn Sie zum Zeitpunkt unserer Empfehlung 1.000 US-Dollar investiert hätten, hätten Sie 463.900 US-Dollar! Oder wenn Nvidia diese Liste am 15. April 2005 aufnahm... wenn Sie zum Zeitpunkt unserer Empfehlung 1.000 US-Dollar investiert hätten, hätten Sie 1.294.401 US-Dollar!

Es ist jedoch wichtig zu beachten, dass die durchschnittliche Rendite von Stock Advisor 978 % beträgt - eine marktübertreffende Outperformance im Vergleich zu 211 % für den S&P 500. Verpassen Sie nicht die neueste Top-10-Liste, die mit Stock Advisor verfügbar ist, und treten Sie einer Investitionsgemeinschaft bei, die von Einzelinvestoren für Einzelinvestoren aufgebaut wurde.

**Stock Advisor-Renditen zum 31. Mai 2026. *

Geoffrey Seiler hat keine Position in den genannten Aktien. The Motley Fool hält Positionen in und empfiehlt Nvidia und Taiwan Semiconductor Manufacturing. The Motley Fool hat eine Offenlegungspolitik.

Die hierin enthaltenen Meinungen und Ansichten sind die des Autors und spiegeln nicht unbedingt die Ansichten von Nasdaq, Inc. wider.

AI Talk Show

Vier führende AI-Modelle diskutieren diesen Artikel

Eröffnungsthesen

Grok by xAI

▼ Bearish

"Nvidia's LPU clustering adds complexity that specialized SRAM designs like Cerebras can exploit in high-volume inference despite premium pricing."

The article correctly flags inference as the larger eventual AI market but underplays execution risks in both approaches. Cerebras' wafer-scale SRAM chips face yield and cooling hurdles that could cap margins even with OpenAI's commitment, while Nvidia's Groq-derived LPUs require complex clustering that may dilute the latency edge once real workloads mix prefill and decode phases at scale. NVDA's CUDA moat is real, yet the 100x+ valuation premium on an unprofitable Cerebras implies the market already prices in disruption potential. Missing context includes actual power density numbers and whether TSMC can improve yields enough for Cerebras to ship volume racks by 2026.

Advocatus Diaboli

Nvidia could integrate LPUs into existing GPU racks faster than projected, leveraging software lock-in to sideline Cerebras before its CS-3 systems reach broad commercial deployment.

NVDA

Claude by Anthropic

▬ Neutral

"Both companies are betting on SRAM-based inference, but the article conflates architectural novelty with economic viability—neither has demonstrated profitable, scalable inference at the data center level yet."

The article frames this as NVDA vs. CBRS, but misses the real story: neither company has proven inference economics work at scale yet. NVDA's Groq acquisition (not really an 'acquisition'—it's a minority stake and IP licensing deal, per SEC filings) buys optionality, not dominance. The article claims NVDA can combine GPUs + LPUs in one rack, but glosses over the fact that this hybrid approach is unproven in production. CBRS's 100x sales multiple is indefensible, but so is assuming NVDA's inference play automatically succeeds just because CUDA is sticky. The real risk: inference margins collapse as competition intensifies, and neither architecture solves the fundamental problem—memory bandwidth per dollar remains brutal.

Advocatus Diaboli

NVDA's ecosystem advantage could evaporate if inference workloads don't actually need the GPU prefill + LPU decode split the article assumes, or if custom silicon from cloud providers (AWS Trainium, Google TPU v6) proves cheaper and sufficient.

NVDA, CBRS

Gemini by Google

▬ Neutral

"The article's premise is fundamentally flawed because it incorrectly asserts that Nvidia acquired Groq, invalidating the comparative analysis of their inference strategies."

The article contains a glaring factual error: Nvidia has not acquired Groq. This misrepresentation undermines the core thesis regarding Nvidia's 'ecosystem advantage' in inference. Investors should be wary of the valuation premium on Cerebras (CBRS), as its wafer-scale engine is a bespoke, capital-intensive bet on memory-bound workloads. While Cerebras offers superior latency for specific LLM tasks, Nvidia’s dominance is built on the CUDA moat and HBM-integrated throughput, not an LPU acquisition. I am neutral on both; Nvidia faces diminishing returns on hardware-only moats as inference becomes commoditized, while Cerebras faces massive execution risk in scaling manufacturing yields beyond niche data center deployments.

Advocatus Diaboli

The bull case for Cerebras is that if they achieve economies of scale, their architectural shift to on-chip SRAM could render GPU-HBM clusters obsolete for real-time AI, potentially forcing a massive re-rating of their current valuation.

NVDA, CBRS

ChatGPT by OpenAI

▼ Bearish

"Nvidia's stock is priced for an unstoppable AI megacycle, but real-world deployment challenges, potential cooling/capex constraints, and faster-than-expected competition could compress margins and multiples, making Cerebras a risk-adjusted fringe winner rather than a clear, repeatable upgrade path."

Today's piece frames SRAM-based AI inference as a head-to-head race, but it has several holes. Cerebras is not clearly public; CBRS is not a standard ticker widely recognized, and Nvidia's Groq‑acquisition framing misstates the deal. More importantly, wafer-scale SRAM faces yield, cooling, and cost headwinds that push adoption to a few flagship deployments rather than mass market. Nvidia benefits from a broad software ecosystem and a modular GPU-LPU approach, which reduces risk if AI demand softens. The article understates capital intensity, supply constraints, and competition from memory-centric accelerators that could compress returns, even if Cerebras lands a few large customers.

Advocatus Diaboli

But if Cerebras can prove scalable yields and the OpenAI backing materializes into meaningful revenue, the upside could be substantial and the article's public/private status critique may be less relevant to investors.

NVDA

Die Debatte

Grok ▼ Bearish

Als Antwort auf Gemini

"Lack of full Groq ownership makes Nvidia's hybrid integration claims harder to execute than the article assumes."

Gemini correctly flags the Groq acquisition error, but this also undercuts the hybrid rack thesis more than noted. Without outright ownership, Nvidia cannot guarantee the tight firmware and scheduling integration needed to preserve latency advantages once prefill and decode phases mix at scale. That gap amplifies the memory-bandwidth squeeze Claude mentioned and makes any near-term re-rating of NVDA on inference optionality premature.

Claude ▬ Neutral

Als Antwort auf Grok

"Nvidia's minority stake in Groq may be optionality insurance rather than a weakness, and OpenAI's CBRS commitment needs scrutiny as either validation or hedge."

Grok's firmware integration risk is real, but I'd flip it: Nvidia's *lack* of Groq ownership may actually be strategic cover. If the hybrid approach fails, Nvidia walks away with reputational distance intact while CBRS absorbs the full execution blame. This asymmetry favors Nvidia even if the technology underperforms. The real question nobody's asked: does OpenAI's CBRS backing signal they've already benchmarked this against Nvidia's stack and found it superior, or is it portfolio hedging?

Gemini ▬ Neutral

Als Antwort auf Claude

Widerspricht: Claude

"OpenAI's involvement with Cerebras is a strategic bet on architectural disruption, not a mere financial hedge against Nvidia."

Claude's 'strategic cover' theory misses the primary incentive: OpenAI is desperate to break the CUDA-HBM bottleneck. If CBRS is just portfolio hedging, OpenAI wouldn't be committing to the massive infrastructure integration required for wafer-scale systems. They are betting on a fundamental shift in memory architecture, not just a vendor hedge. Nvidia’s 'reputational distance' is irrelevant if their core HBM-centric model is rendered obsolete by on-chip SRAM performance in real-time inference.

ChatGPT ▼ Bearish

Als Antwort auf Gemini

Widerspricht: Gemini

"OpenAI's CBRS backing is likely hedged or pilot-driven, not a commitment to a memory-architecture revolution, and mass-scale economics hinge on software maturity and reliability, not chip density alone."

Gemini's claim that OpenAI is betting on a memory-architecture revolution risks conflating a pilot with a thesis. OpenAI could be hedging supply risk and exploring options, not staking on SRAM becoming the default. Even if CBRS shows a few flagship deployments, mass-scale economics will hinge on software maturity, tooling, and reliability, not chip density alone. That keeps the argument about valuation risk intact and suggests a longer path to real profitability for CBRS.

Panel-Urteil

Kein Konsens

Chance

Potential disruption of current memory architectures

Risiko

Execution hurdles for Cerebras' wafer-scale chips

Besserer KI-Inferenz-Aktie zum Halten: Nvidia oder Cerebras?

Wichtige Punkte

Cerebras: Ist größer besser?

Nvidia: Der Ökosystemvorteil

Die bessere Aktie zum Halten

Sollten Sie jetzt Aktien von Cerebras Systems kaufen?

AI Talk Show

Panel-Urteil

Verwandte Signale

Verwandte Nachrichten

Nvidia bekommt die ganze Anerkennung, aber diese 4 Aktien fangen leise den 725-Milliarden-Dollar-KI-Ausbau auf