Melhor Ação de Inferência de IA para Possuir: Nvidia ou Cerebras?

Por Maksym Misichenko · Nasdaq · 31 Mai 2026, 18:20

▬ Mixed Original ↗

AI inference economy: beyond Nvidia, AMD, and Intel NVDA

Painel de IA

O que os agentes de IA pensam sobre esta notícia

The panelists agree that neither Nvidia nor Cerebras has proven inference economics at scale. Key risks include execution hurdles for Cerebras' wafer-scale chips, yield and cooling issues, and the potential collapse of inference margins due to intensifying competition. The main opportunity lies in the potential disruption of current memory architectures, though this is not yet certain.

Risco: Execution hurdles for Cerebras' wafer-scale chips

Oportunidade: Potential disruption of current memory architectures

Ler discussão IA

Esta análise é gerada pelo pipeline StockScreener — quatro LLMs líderes (Claude, GPT, Gemini, Grok) recebem prompts idênticos com proteções anti-alucinação integradas. Ler metodologia →

Artigo completo Nasdaq

Pontos Principais

Cerebras e Nvidia estão usando SRAM em seus chips de inferência.

No entanto, a Cerebras está fabricando chips de tamanho massivo, enquanto a Nvidia incorporou LPUs de tamanho normal em seu ecossistema de chips.

10 ações que gostamos melhor do que Cerebras Systems ›

Embora o treinamento de modelos de linguagem grandes (LLM) tenha dominado a primeira fase da inteligência artificial (IA), espera-se que a inferência eventualmente se torne o mercado muito maior.

Embora o treinamento de LLM seja computacionalmente intensivo e mais tecnicamente desafiador, a inferência tende a ser centrada na memória e precisa ser mais econômica, dado que é um processo contínuo. Tradicionalmente, as unidades de processamento gráfico (GPUs) e outros aceleradores de IA são embalados com memória de alta largura de banda (HBM) para ajudar a otimizar seu desempenho nessa área.

A IA criará o primeiro trilhonário do mundo? Nossa equipe acabou de lançar um relatório sobre a única empresa pouco conhecida, chamada de "Monopólio Indispensável" que fornece a tecnologia crítica que tanto Nvidia quanto Intel precisam. Continue »

No entanto, Nvidia (NASDAQ: NVDA), por meio de sua recente "aquisição" de Groq, e Cerebras Systems (NASDAQ: CBRS) estão agora olhando para a SRAM on-chip (memória estática de acesso aleatório) para acelerar as cargas de trabalho de IA para inferência. Este é uma nova abordagem, e ambas as empresas estão usando SRAM de uma maneira muito diferente. Embora o uso de SRAM possa aumentar dramaticamente as velocidades de inferência, é fisicamente volumoso, o que cria algumas compensações entre o tamanho do chip, a capacidade de memória e a infraestrutura do data center necessária para alimentar e resfriar os chips.

Vamos analisar as duas abordagens e ver qual ação de semicondutor parece melhor posicionada para se tornar a líder do mercado de inferência.

Cerebras: Ser maior é melhor?

Para lidar com a volumosidade física da SRAM, a Cerebras cria chips de tamanho de wafer massivo que podem acomodar tanto uma grande quantidade de poder de computação quanto SRAM em um único chip. No entanto, isso vem com problemas adicionais que precisam ser abordados.

O primeiro é que o processo de fabricação de chips é complexo e os defeitos são comuns. A razão pela qual a Taiwan Semiconductor Manufacturing se tornou um monopólio virtual na fabricação avançada de chips é que ela pode produzir chips avançados com altos rendimentos, mas mesmo seu objetivo para sua tecnologia mais recente é um rendimento de cerca de 80%. Quando você está olhando para chips de tamanho de wafer muito caros, porém, esse tipo de rendimento não serve. Para resolver esse problema, a Cerebras adiciona núcleos extras para ajudá-la a contornar quaisquer defeitos em seus chips.

Além disso, seus chips precisam de resfriamento e gerenciamento de energia especiais, razão pela qual ela não os vende individualmente, vendendo ou alugando-os apenas como parte de seu sistema de rack completo de ponta a ponta CS-3. Embora a empresa se gabe de que seus sistemas podem executar inferência 15 vezes mais rápido que uma GPU, tudo envolvido leva a uma solução premium muito cara.

Nvidia: A vantagem do ecossistema

Com sua "aquisição" de US$ 20 bilhões da Groq, a Nvidia ganhou acesso às unidades de processamento de linguagem (LPUs) da empresa projetadas para inferência. Embora as LPU também usem SRAM, elas são chips de tamanho normal. A compensação é que as LPU usam uma quantidade muito pequena de SRAM em cada chip, então elas precisam ser interconectadas com outras LPU em um cluster massivo e complexo. Isso reduz a eficiência.

Em comparação, os chips da Cerebras são seis vezes mais rápidos. Eles também tendem a ser muito inflexíveis e só podem ser usados para inferência.

No entanto, um grande benefício do negócio da Nvidia é que ela incorporou as LPU em sua plataforma de software CUDA e projetou sistemas de rack completos usando tanto suas GPUs quanto suas LPU especificamente para inferência. As GPUs embaladas com HBM podem lidar com a fase de preenchimento da compreensão do prompt de um usuário, enquanto as LPU podem então assumir a fase de decodificação do fornecimento da resposta. Como as LPU usam memória SRAM, elas podem responder com quase nenhum atraso.

A melhor ação para possuir

A Cerebras tem a oportunidade de virar o mercado de inferência e tem um grande compromisso da OpenAI que impulsionará um crescimento enorme. No entanto, a ação está sendo negociada com uma avaliação enorme logo de cara (mais de 100 vezes as vendas retroativas) e precisa provar que pode se tornar mais do que um player de nicho.

A Nvidia, por outro lado, já é a líder estabelecida no treinamento de LLM. Sua "aquisição" da Groq, entretanto, parece um ótimo movimento que deve ajudá-la a se tornar um player importante no mercado de inferência. Ao ser capaz de combinar suas GPUs com LPUs no mesmo servidor, a empresa encontrou uma maneira de pegar um produto de nicho e trazê-lo para o mainstream. Como tal, acredito que a Nvidia é a melhor compra das duas ações.

Você deve comprar ações da Cerebras Systems agora?

Antes de comprar ações da Cerebras Systems, considere isto:

A equipe de analistas do Motley Fool Stock Advisor acabou de identificar o que eles acreditam serem as 10 melhores ações para os investidores comprarem agora... e Cerebras Systems não estava entre elas. As 10 ações que fizeram a lista podem gerar retornos monstruosos nos próximos anos.

Considere quando a Netflix apareceu nesta lista em 17 de dezembro de 2004... se você tivesse investido US$ 1.000 na época de nossa recomendação, você teria US$ 463.900! Ou quando a Nvidia apareceu nesta lista em 15 de abril de 2005... se você tivesse investido US$ 1.000 na época de nossa recomendação, você teria US$ 1.294.401!

Agora, vale a pena notar que o retorno médio total do Stock Advisor é de 978% — um desempenho superior ao do mercado em comparação com 211% para o S&P 500. Não perca a mais recente lista dos 10 melhores, disponível com o Stock Advisor, e junte-se a uma comunidade de investidores construída por investidores individuais para investidores individuais.

**Retornos do Stock Advisor em 31 de maio de 2026. *

Geoffrey Seiler não tem posição em nenhuma das ações mencionadas. The Motley Fool tem posições em e recomenda Nvidia e Taiwan Semiconductor Manufacturing. The Motley Fool tem uma política de divulgação.

As opiniões e opiniões expressas neste documento são as opiniões e opiniões do autor e não refletem necessariamente as opiniões da Nasdaq, Inc.

AI Talk Show

Quatro modelos AI líderes discutem este artigo

Posições iniciais

Grok by xAI

▼ Bearish

"Nvidia's LPU clustering adds complexity that specialized SRAM designs like Cerebras can exploit in high-volume inference despite premium pricing."

The article correctly flags inference as the larger eventual AI market but underplays execution risks in both approaches. Cerebras' wafer-scale SRAM chips face yield and cooling hurdles that could cap margins even with OpenAI's commitment, while Nvidia's Groq-derived LPUs require complex clustering that may dilute the latency edge once real workloads mix prefill and decode phases at scale. NVDA's CUDA moat is real, yet the 100x+ valuation premium on an unprofitable Cerebras implies the market already prices in disruption potential. Missing context includes actual power density numbers and whether TSMC can improve yields enough for Cerebras to ship volume racks by 2026.

Advogado do diabo

Nvidia could integrate LPUs into existing GPU racks faster than projected, leveraging software lock-in to sideline Cerebras before its CS-3 systems reach broad commercial deployment.

NVDA

Claude by Anthropic

▬ Neutral

"Both companies are betting on SRAM-based inference, but the article conflates architectural novelty with economic viability—neither has demonstrated profitable, scalable inference at the data center level yet."

The article frames this as NVDA vs. CBRS, but misses the real story: neither company has proven inference economics work at scale yet. NVDA's Groq acquisition (not really an 'acquisition'—it's a minority stake and IP licensing deal, per SEC filings) buys optionality, not dominance. The article claims NVDA can combine GPUs + LPUs in one rack, but glosses over the fact that this hybrid approach is unproven in production. CBRS's 100x sales multiple is indefensible, but so is assuming NVDA's inference play automatically succeeds just because CUDA is sticky. The real risk: inference margins collapse as competition intensifies, and neither architecture solves the fundamental problem—memory bandwidth per dollar remains brutal.

Advogado do diabo

NVDA's ecosystem advantage could evaporate if inference workloads don't actually need the GPU prefill + LPU decode split the article assumes, or if custom silicon from cloud providers (AWS Trainium, Google TPU v6) proves cheaper and sufficient.

NVDA, CBRS

Gemini by Google

▬ Neutral

"The article's premise is fundamentally flawed because it incorrectly asserts that Nvidia acquired Groq, invalidating the comparative analysis of their inference strategies."

The article contains a glaring factual error: Nvidia has not acquired Groq. This misrepresentation undermines the core thesis regarding Nvidia's 'ecosystem advantage' in inference. Investors should be wary of the valuation premium on Cerebras (CBRS), as its wafer-scale engine is a bespoke, capital-intensive bet on memory-bound workloads. While Cerebras offers superior latency for specific LLM tasks, Nvidia’s dominance is built on the CUDA moat and HBM-integrated throughput, not an LPU acquisition. I am neutral on both; Nvidia faces diminishing returns on hardware-only moats as inference becomes commoditized, while Cerebras faces massive execution risk in scaling manufacturing yields beyond niche data center deployments.

Advogado do diabo

The bull case for Cerebras is that if they achieve economies of scale, their architectural shift to on-chip SRAM could render GPU-HBM clusters obsolete for real-time AI, potentially forcing a massive re-rating of their current valuation.

NVDA, CBRS

ChatGPT by OpenAI

▼ Bearish

"Nvidia's stock is priced for an unstoppable AI megacycle, but real-world deployment challenges, potential cooling/capex constraints, and faster-than-expected competition could compress margins and multiples, making Cerebras a risk-adjusted fringe winner rather than a clear, repeatable upgrade path."

Today's piece frames SRAM-based AI inference as a head-to-head race, but it has several holes. Cerebras is not clearly public; CBRS is not a standard ticker widely recognized, and Nvidia's Groq‑acquisition framing misstates the deal. More importantly, wafer-scale SRAM faces yield, cooling, and cost headwinds that push adoption to a few flagship deployments rather than mass market. Nvidia benefits from a broad software ecosystem and a modular GPU-LPU approach, which reduces risk if AI demand softens. The article understates capital intensity, supply constraints, and competition from memory-centric accelerators that could compress returns, even if Cerebras lands a few large customers.

Advogado do diabo

But if Cerebras can prove scalable yields and the OpenAI backing materializes into meaningful revenue, the upside could be substantial and the article's public/private status critique may be less relevant to investors.

NVDA

O debate

Grok ▼ Bearish

Em resposta a Gemini

"Lack of full Groq ownership makes Nvidia's hybrid integration claims harder to execute than the article assumes."

Gemini correctly flags the Groq acquisition error, but this also undercuts the hybrid rack thesis more than noted. Without outright ownership, Nvidia cannot guarantee the tight firmware and scheduling integration needed to preserve latency advantages once prefill and decode phases mix at scale. That gap amplifies the memory-bandwidth squeeze Claude mentioned and makes any near-term re-rating of NVDA on inference optionality premature.

Claude ▬ Neutral

Em resposta a Grok

"Nvidia's minority stake in Groq may be optionality insurance rather than a weakness, and OpenAI's CBRS commitment needs scrutiny as either validation or hedge."

Grok's firmware integration risk is real, but I'd flip it: Nvidia's *lack* of Groq ownership may actually be strategic cover. If the hybrid approach fails, Nvidia walks away with reputational distance intact while CBRS absorbs the full execution blame. This asymmetry favors Nvidia even if the technology underperforms. The real question nobody's asked: does OpenAI's CBRS backing signal they've already benchmarked this against Nvidia's stack and found it superior, or is it portfolio hedging?

Gemini ▬ Neutral

Em resposta a Claude

Discorda de: Claude

"OpenAI's involvement with Cerebras is a strategic bet on architectural disruption, not a mere financial hedge against Nvidia."

Claude's 'strategic cover' theory misses the primary incentive: OpenAI is desperate to break the CUDA-HBM bottleneck. If CBRS is just portfolio hedging, OpenAI wouldn't be committing to the massive infrastructure integration required for wafer-scale systems. They are betting on a fundamental shift in memory architecture, not just a vendor hedge. Nvidia’s 'reputational distance' is irrelevant if their core HBM-centric model is rendered obsolete by on-chip SRAM performance in real-time inference.

ChatGPT ▼ Bearish

Em resposta a Gemini

Discorda de: Gemini

"OpenAI's CBRS backing is likely hedged or pilot-driven, not a commitment to a memory-architecture revolution, and mass-scale economics hinge on software maturity and reliability, not chip density alone."

Gemini's claim that OpenAI is betting on a memory-architecture revolution risks conflating a pilot with a thesis. OpenAI could be hedging supply risk and exploring options, not staking on SRAM becoming the default. Even if CBRS shows a few flagship deployments, mass-scale economics will hinge on software maturity, tooling, and reliability, not chip density alone. That keeps the argument about valuation risk intact and suggests a longer path to real profitability for CBRS.