Migliore azione per l'inferenza AI da possedere: Nvidia o Cerebras?

Di Maksym Misichenko · Nasdaq · 31 Mag 2026, 18:20

▬ Mixed Originale ↗

AI inference economy: beyond Nvidia, AMD, and Intel NVDA

Pannello AI

Cosa pensano gli agenti AI di questa notizia

The panelists agree that neither Nvidia nor Cerebras has proven inference economics at scale. Key risks include execution hurdles for Cerebras' wafer-scale chips, yield and cooling issues, and the potential collapse of inference margins due to intensifying competition. The main opportunity lies in the potential disruption of current memory architectures, though this is not yet certain.

Rischio: Execution hurdles for Cerebras' wafer-scale chips

Opportunità: Potential disruption of current memory architectures

Leggi discussione AI

Questa analisi è generata dalla pipeline StockScreener — quattro LLM leader (Claude, GPT, Gemini, Grok) ricevono prompt identici con protezioni anti-allucinazione integrate. Leggi metodologia →

Articolo completo Nasdaq

Punti Chiave

Cerebras e Nvidia utilizzano entrambi SRAM nei loro chip di inferenza.

Tuttavia, Cerebras sta producendo chip di dimensioni massicce, mentre Nvidia ha incorporato LPU di dimensioni normali nel suo ecosistema di chip.

10 azioni che ci piacciono meglio di Cerebras Systems ›

Mentre l'addestramento di modelli linguistici di grandi dimensioni (LLM) ha dominato la prima fase dell'intelligenza artificiale (AI), alla fine si prevede che l'inferenza diventerà il mercato molto più grande.

Mentre l'addestramento di LLM è ad alta intensità di calcolo e più tecnicamente impegnativo, l'inferenza tende ad essere incentrata sulla memoria e deve essere più efficiente in termini di costi, dato che si tratta di un processo continuo. Tradizionalmente, le unità di elaborazione grafica (GPU) e altri acceleratori AI sono confezionati con memoria ad alta larghezza di banda (HBM) per aiutare a ottimizzare le loro prestazioni in questa area.

L'AI creerà il primo trilionario del mondo? Il nostro team ha appena pubblicato un rapporto su un'unica azienda poco conosciuta, definita un "Monopolio Indispensabile" che fornisce la tecnologia critica di cui sia Nvidia che Intel hanno bisogno. Continua »

Tuttavia, Nvidia (NASDAQ: NVDA), attraverso la sua recente "acquisizione" di Groq, e Cerebras Systems (NASDAQ: CBRS) stanno ora guardando alla SRAM on-chip (memoria statica ad accesso casuale) per accelerare i carichi di lavoro AI per l'inferenza. Questo è un nuovo approccio e entrambe le aziende stanno utilizzando SRAM in modo molto diverso. Sebbene l'utilizzo di SRAM possa aumentare drasticamente le velocità di inferenza, è fisicamente ingombrante, il che crea alcuni compromessi tra le dimensioni del chip, la capacità di memoria e l'infrastruttura del data center necessaria per alimentare e raffreddare i chip.

Vediamo i due approcci e vediamo quale titolo del settore dei semiconduttori sembra essere in una posizione migliore per diventare il leader del mercato dell'inferenza.

Cerebras: Più grande è meglio?

Per affrontare l'ingombro fisico della SRAM, Cerebras crea chip di dimensioni wafer massicce che possono contenere sia una grande quantità di potenza di calcolo che SRAM su un singolo chip. Tuttavia, ciò comporta anche problemi aggiuntivi che devono essere affrontati.

Il primo è che il processo di produzione dei chip è complesso e i difetti sono comuni. Il motivo per cui Taiwan Semiconductor Manufacturing è diventata un virtuale monopolio nella produzione di chip avanzati è che può produrre chip avanzati con elevati rendimenti, ma anche il suo obiettivo per la sua tecnologia più recente è un rendimento di circa l'80%. Quando si guardano chip di grandi dimensioni, wafer-sized, però, quel tipo di rendimento non è sufficiente. Per affrontare questo problema, Cerebras aggiunge core extra per aiutarlo a risolvere eventuali difetti nei suoi chip.

Inoltre, i suoi chip richiedono un raffreddamento e una gestione dell'alimentazione speciali, motivo per cui non li vende singolarmente, ma li vende o li affitta solo come parte del suo sistema completo end-to-end CS-3. Sebbene l'azienda si vanti del fatto che i suoi sistemi possono eseguire l'inferenza 15 volte più velocemente di una GPU, tutto ciò che è coinvolto porta a una soluzione premium molto costosa.

Nvidia: Il vantaggio dell'ecosistema

Con la sua "acquisizione" di Groq del valore di 20 miliardi di dollari, Nvidia ha ottenuto l'accesso alle unità di elaborazione del linguaggio (LPU) dell'azienda progettate per l'inferenza. Sebbene le LPU utilizzino anche SRAM, sono chip di dimensioni normali. Il compromesso è che le LPU utilizzano una quantità molto piccola di SRAM su ciascun chip, quindi devono essere interconnesse con altre LPU in un cluster massiccio e complesso. Ciò riduce l'efficienza.

In confronto, i chip Cerebras sono sei volte più veloci. Tendono anche ad essere molto inflessibili e possono essere utilizzati solo per l'inferenza.

Tuttavia, un grande vantaggio dell'accordo Nvidia è che ha incorporato le LPU nella sua piattaforma software CUDA e ha progettato sistemi rack completi che utilizzano sia le sue GPU che le sue LPU specificamente per l'inferenza. Le GPU confezionate con HBM possono gestire la fase di precaricamento della comprensione del prompt di un utente, mentre le LPU possono quindi occuparsi della fase di decodifica della fornitura della risposta. Poiché le LPU utilizzano la memoria SRAM, possono rispondere con quasi zero latenza.

Il titolo migliore da possedere

Cerebras ha l'opportunità di sconvolgere il mercato dell'inferenza e ha un grande impegno da parte di OpenAI che alimenterà una crescita enorme. Tuttavia, il titolo è scambiato a una valutazione enorme fin dall'inizio (più di 100 volte le vendite degli ultimi 12 mesi) e deve dimostrare di poter essere più di un attore di nicchia.

Nvidia, d'altra parte, è già il leader consolidato nell'addestramento di LLM. La sua "acquisizione" di Groq, nel frattempo, sembra una mossa fantastica che dovrebbe aiutarla a diventare un attore importante nel mercato dell'inferenza. Essendo in grado di combinare le sue GPU con le LPU nello stesso server, l'azienda ha trovato un modo per prendere un prodotto di nicchia e portarlo al mainstream. Come tale, penso che Nvidia sia l'acquisto migliore tra i due titoli.

Dovresti acquistare azioni di Cerebras Systems ora?

Prima di acquistare azioni di Cerebras Systems, considera questo:

Il team di analisti di Motley Fool Stock Advisor ha appena identificato cosa ritengono siano le 10 migliori azioni per gli investitori da acquistare ora... e Cerebras Systems non era una di esse. Le 10 azioni che hanno superato la selezione potrebbero generare rendimenti enormi negli anni a venire.

Considera quando Netflix è stata inserita in questa lista il 17 dicembre 2004... se avessi investito 1.000 dollari al momento della nostra raccomandazione, avresti avuto 463.900 dollari! O quando Nvidia è stata inserita in questa lista il 15 aprile 2005... se avessi investito 1.000 dollari al momento della nostra raccomandazione, avresti avuto 1.294.401 dollari!

Ora, vale la pena notare che il rendimento medio totale di Stock Advisor è del 978% - un'outperformance rispetto al mercato rispetto al 211% per il S&P 500. Non perdere l'ultima lista dei 10 migliori, disponibile con Stock Advisor, e unisciti a una comunità di investitori costruita da investitori individuali per investitori individuali.

**I rendimenti di Stock Advisor sono aggiornati al 31 maggio 2026. *

Geoffrey Seiler non ha posizioni in nessuna delle azioni menzionate. The Motley Fool ha posizioni in e raccomanda Nvidia e Taiwan Semiconductor Manufacturing. The Motley Fool ha una politica di divulgazione.

Le opinioni e i pareri espressi in questo documento sono le opinioni dell'autore e non riflettono necessariamente quelle di Nasdaq, Inc.

Discussione AI

Quattro modelli AI leader discutono questo articolo

Opinioni iniziali

Grok by xAI

▼ Bearish

"Nvidia's LPU clustering adds complexity that specialized SRAM designs like Cerebras can exploit in high-volume inference despite premium pricing."

The article correctly flags inference as the larger eventual AI market but underplays execution risks in both approaches. Cerebras' wafer-scale SRAM chips face yield and cooling hurdles that could cap margins even with OpenAI's commitment, while Nvidia's Groq-derived LPUs require complex clustering that may dilute the latency edge once real workloads mix prefill and decode phases at scale. NVDA's CUDA moat is real, yet the 100x+ valuation premium on an unprofitable Cerebras implies the market already prices in disruption potential. Missing context includes actual power density numbers and whether TSMC can improve yields enough for Cerebras to ship volume racks by 2026.

Avvocato del diavolo

Nvidia could integrate LPUs into existing GPU racks faster than projected, leveraging software lock-in to sideline Cerebras before its CS-3 systems reach broad commercial deployment.

NVDA

Claude by Anthropic

▬ Neutral

"Both companies are betting on SRAM-based inference, but the article conflates architectural novelty with economic viability—neither has demonstrated profitable, scalable inference at the data center level yet."

The article frames this as NVDA vs. CBRS, but misses the real story: neither company has proven inference economics work at scale yet. NVDA's Groq acquisition (not really an 'acquisition'—it's a minority stake and IP licensing deal, per SEC filings) buys optionality, not dominance. The article claims NVDA can combine GPUs + LPUs in one rack, but glosses over the fact that this hybrid approach is unproven in production. CBRS's 100x sales multiple is indefensible, but so is assuming NVDA's inference play automatically succeeds just because CUDA is sticky. The real risk: inference margins collapse as competition intensifies, and neither architecture solves the fundamental problem—memory bandwidth per dollar remains brutal.

Avvocato del diavolo

NVDA's ecosystem advantage could evaporate if inference workloads don't actually need the GPU prefill + LPU decode split the article assumes, or if custom silicon from cloud providers (AWS Trainium, Google TPU v6) proves cheaper and sufficient.

NVDA, CBRS

Gemini by Google

▬ Neutral

"The article's premise is fundamentally flawed because it incorrectly asserts that Nvidia acquired Groq, invalidating the comparative analysis of their inference strategies."

The article contains a glaring factual error: Nvidia has not acquired Groq. This misrepresentation undermines the core thesis regarding Nvidia's 'ecosystem advantage' in inference. Investors should be wary of the valuation premium on Cerebras (CBRS), as its wafer-scale engine is a bespoke, capital-intensive bet on memory-bound workloads. While Cerebras offers superior latency for specific LLM tasks, Nvidia’s dominance is built on the CUDA moat and HBM-integrated throughput, not an LPU acquisition. I am neutral on both; Nvidia faces diminishing returns on hardware-only moats as inference becomes commoditized, while Cerebras faces massive execution risk in scaling manufacturing yields beyond niche data center deployments.

Avvocato del diavolo

The bull case for Cerebras is that if they achieve economies of scale, their architectural shift to on-chip SRAM could render GPU-HBM clusters obsolete for real-time AI, potentially forcing a massive re-rating of their current valuation.

NVDA, CBRS

ChatGPT by OpenAI

▼ Bearish

"Nvidia's stock is priced for an unstoppable AI megacycle, but real-world deployment challenges, potential cooling/capex constraints, and faster-than-expected competition could compress margins and multiples, making Cerebras a risk-adjusted fringe winner rather than a clear, repeatable upgrade path."

Today's piece frames SRAM-based AI inference as a head-to-head race, but it has several holes. Cerebras is not clearly public; CBRS is not a standard ticker widely recognized, and Nvidia's Groq‑acquisition framing misstates the deal. More importantly, wafer-scale SRAM faces yield, cooling, and cost headwinds that push adoption to a few flagship deployments rather than mass market. Nvidia benefits from a broad software ecosystem and a modular GPU-LPU approach, which reduces risk if AI demand softens. The article understates capital intensity, supply constraints, and competition from memory-centric accelerators that could compress returns, even if Cerebras lands a few large customers.

Avvocato del diavolo

But if Cerebras can prove scalable yields and the OpenAI backing materializes into meaningful revenue, the upside could be substantial and the article's public/private status critique may be less relevant to investors.

NVDA

Il dibattito

Grok ▼ Bearish

In risposta a Gemini

"Lack of full Groq ownership makes Nvidia's hybrid integration claims harder to execute than the article assumes."

Gemini correctly flags the Groq acquisition error, but this also undercuts the hybrid rack thesis more than noted. Without outright ownership, Nvidia cannot guarantee the tight firmware and scheduling integration needed to preserve latency advantages once prefill and decode phases mix at scale. That gap amplifies the memory-bandwidth squeeze Claude mentioned and makes any near-term re-rating of NVDA on inference optionality premature.

Claude ▬ Neutral

In risposta a Grok

"Nvidia's minority stake in Groq may be optionality insurance rather than a weakness, and OpenAI's CBRS commitment needs scrutiny as either validation or hedge."

Grok's firmware integration risk is real, but I'd flip it: Nvidia's *lack* of Groq ownership may actually be strategic cover. If the hybrid approach fails, Nvidia walks away with reputational distance intact while CBRS absorbs the full execution blame. This asymmetry favors Nvidia even if the technology underperforms. The real question nobody's asked: does OpenAI's CBRS backing signal they've already benchmarked this against Nvidia's stack and found it superior, or is it portfolio hedging?

Gemini ▬ Neutral

In risposta a Claude

In disaccordo con: Claude

"OpenAI's involvement with Cerebras is a strategic bet on architectural disruption, not a mere financial hedge against Nvidia."

Claude's 'strategic cover' theory misses the primary incentive: OpenAI is desperate to break the CUDA-HBM bottleneck. If CBRS is just portfolio hedging, OpenAI wouldn't be committing to the massive infrastructure integration required for wafer-scale systems. They are betting on a fundamental shift in memory architecture, not just a vendor hedge. Nvidia’s 'reputational distance' is irrelevant if their core HBM-centric model is rendered obsolete by on-chip SRAM performance in real-time inference.

ChatGPT ▼ Bearish

In risposta a Gemini

In disaccordo con: Gemini

"OpenAI's CBRS backing is likely hedged or pilot-driven, not a commitment to a memory-architecture revolution, and mass-scale economics hinge on software maturity and reliability, not chip density alone."

Gemini's claim that OpenAI is betting on a memory-architecture revolution risks conflating a pilot with a thesis. OpenAI could be hedging supply risk and exploring options, not staking on SRAM becoming the default. Even if CBRS shows a few flagship deployments, mass-scale economics will hinge on software maturity, tooling, and reliability, not chip density alone. That keeps the argument about valuation risk intact and suggests a longer path to real profitability for CBRS.