Saham AI Inferensi yang Lebih Baik untuk Dimiliki: Nvidia atau Cerebras?
Oleh Maksym Misichenko · Nasdaq ·
Oleh Maksym Misichenko · Nasdaq ·
Apa yang dipikirkan agen AI tentang berita ini
The panelists agree that neither Nvidia nor Cerebras has proven inference economics at scale. Key risks include execution hurdles for Cerebras' wafer-scale chips, yield and cooling issues, and the potential collapse of inference margins due to intensifying competition. The main opportunity lies in the potential disruption of current memory architectures, though this is not yet certain.
Risiko: Execution hurdles for Cerebras' wafer-scale chips
Peluang: Potential disruption of current memory architectures
Analisis ini dihasilkan oleh pipeline StockScreener — empat LLM terkemuka (Claude, GPT, Gemini, Grok) menerima prompt identik dengan perlindungan anti-halusinasi bawaan. Baca metodologi →
Cerebras dan Nvidia sama-sama menggunakan SRAM dalam chip inferensi mereka.
Namun, Cerebras membuat chip berukuran besar, sementara Nvidia telah menggabungkan LPU berukuran normal ke dalam ekosistem chip-nya.
Meskipun pelatihan model bahasa besar (LLM) mendominasi fase pertama kecerdasan buatan (AI), inferensi pada akhirnya diperkirakan akan menjadi pasar yang jauh lebih besar.
Meskipun pelatihan LLM membutuhkan daya komputasi yang besar dan lebih menantang secara teknis, inferensi cenderung berfokus pada memori dan perlu lebih hemat biaya mengingat ini adalah proses yang berkelanjutan. Secara tradisional, unit pemrosesan grafis (GPU) dan akselerator AI lainnya dikemas dengan memori bandwidth tinggi (HBM) untuk membantu mengoptimalkan kinerja mereka di area ini.
Apakah AI akan menciptakan triliuner pertama di dunia? Tim kami baru-baru ini merilis laporan tentang satu perusahaan yang kurang dikenal, yang disebut "Monopoli yang Tak Tergantikan" menyediakan teknologi penting yang dibutuhkan Nvidia dan Intel. Lanjutkan »
Namun, Nvidia (NASDAQ: NVDA), melalui "perolehan" barunya dari Groq, dan Cerebras Systems (NASDAQ: CBRS) sekarang sedang melihat ke arah SRAM on-chip (memori akses acak statis) untuk mempercepat beban kerja AI untuk inferensi. Ini adalah pendekatan baru, dan kedua perusahaan menggunakan SRAM dengan cara yang sangat berbeda. Meskipun menggunakan SRAM dapat secara dramatis meningkatkan kecepatan inferensi, secara fisik besar, yang menciptakan beberapa trade-off antara ukuran chip, kapasitas memori, dan infrastruktur pusat data yang diperlukan untuk memberi daya dan mendinginkan chip.
Mari kita lihat kedua pendekatan tersebut dan lihat saham semikonduktor mana yang tampaknya lebih siap untuk menjadi pemimpin pasar inferensi.
Untuk mengatasi kebuntukan fisik SRAM, Cerebras membuat chip berukuran wafer besar yang dapat menampung sejumlah besar daya komputasi dan SRAM ke dalam satu chip. Namun, ini disertai dengan masalah tambahan yang perlu diatasi.
Yang pertama adalah proses manufaktur chip itu kompleks, dan cacat itu umum. Alasan mengapa Taiwan Semiconductor Manufacturing telah menjadi monopoli virtual dalam manufaktur chip canggih adalah karena dapat memproduksi chip canggih dengan hasil yang tinggi, tetapi bahkan tujuannya untuk teknologi terbarunya adalah hasil sekitar 80%. Ketika Anda melihat chip berukuran wafer yang sangat mahal, meskipun demikian, jenis hasil itu tidak memadai. Untuk mengatasi masalah ini, Cerebras menambahkan inti tambahan untuk membantunya mengatasi cacat apa pun pada chip-nya.
Selain itu, chipnya membutuhkan pendinginan dan manajemen daya khusus, itulah sebabnya ia tidak menjualnya secara individual, melainkan hanya menjual atau menyewakannya sebagai bagian dari sistem rak end-to-end CS-3 lengkapnya. Meskipun perusahaan membanggakan bahwa sistemnya dapat melakukan inferensi 15 kali lebih cepat daripada GPU, semuanya mengarah pada solusi premium yang sangat mahal.
Dengan "perolehan" senilai $20 miliar dari Groq, Nvidia mendapatkan akses ke unit pemrosesan bahasa (LPU) perusahaan yang dirancang untuk inferensi. Meskipun LPU juga menggunakan SRAM, mereka adalah chip berukuran biasa. Trade-off-nya adalah LPU menggunakan sejumlah kecil SRAM pada setiap chip, sehingga harus saling terhubung dalam kluster yang sangat besar dan kompleks. Ini mengurangi efisiensi.
Sebagai perbandingan, chip Cerebras enam kali lebih cepat. Mereka juga cenderung sangat tidak fleksibel dan hanya dapat digunakan untuk inferensi.
Namun, satu keuntungan besar dari kesepakatan Nvidia adalah telah menggabungkan LPU ke dalam platform perangkat lunak CUDA-nya dan merancang sistem rak lengkap menggunakan GPU dan LPU-nya secara khusus untuk inferensi. GPU yang dikemas dengan HBM dapat menangani fase prefill untuk memahami prompt pengguna, sementara LPU kemudian dapat mengambil alih fase dekode untuk memberikan respons. Karena LPU menggunakan memori SRAM, mereka dapat merespons dengan latensi yang hampir tidak ada.
Cerebras memiliki kesempatan untuk membalikkan pasar inferensi dan memiliki komitmen besar dari OpenAI yang akan mendorong pertumbuhan besar. Namun, saham tersebut diperdagangkan pada valuasi yang sangat tinggi sejak awal (lebih dari 100 kali penjualan historis) dan perlu membuktikan bahwa ia dapat menjadi lebih dari sekadar pemain ceruk.
Nvidia, di sisi lain, sudah menjadi pemimpin yang mapan dalam pelatihan LLM. "Perolehan" dari Groq, sementara itu, terlihat seperti langkah yang bagus yang harus membantunya menjadi pemain penting di pasar inferensi. Dengan mampu menggabungkan GPU-nya dengan LPU dalam satu server, perusahaan telah menemukan cara untuk mengambil produk ceruk dan membawanya ke arus utama. Sebagai hasilnya, saya pikir Nvidia adalah pembelian yang lebih baik dari kedua saham tersebut.
Sebelum Anda membeli saham di Cerebras Systems, pertimbangkan hal ini:
Tim analis Motley Fool Stock Advisor baru-baru ini mengidentifikasi apa yang mereka yakini sebagai 10 saham terbaik untuk dibeli investor sekarang… dan Cerebras Systems bukanlah salah satunya. 10 saham yang masuk ke daftar itu dapat menghasilkan pengembalian monster di tahun-tahun mendatang.
Pertimbangkan kapan Netflix masuk dalam daftar ini pada 17 Desember 2004... jika Anda menginvestasikan $1.000 pada saat rekomendasi kami, Anda akan memiliki $463.900! Atau ketika Nvidia masuk dalam daftar ini pada 15 April 2005... jika Anda menginvestasikan $1.000 pada saat rekomendasi kami, Anda akan memiliki $1.294.401!
Sekarang, perlu dicatat bahwa pengembalian rata-rata keseluruhan Stock Advisor adalah 978% — kinerja yang mengungguli pasar dibandingkan dengan 211% untuk S&P 500. Jangan lewatkan daftar 10 teratas terbaru, yang tersedia dengan Stock Advisor, dan bergabunglah dengan komunitas investasi yang dibangun oleh investor individu untuk investor individu.
**Pengembalian Stock Advisor seperti yang tercatat pada 31 Mei 2026. *
Geoffrey Seiler tidak memiliki posisi dalam saham apa pun yang disebutkan. The Motley Fool memiliki posisi di dan merekomendasikan Nvidia dan Taiwan Semiconductor Manufacturing. The Motley Fool memiliki kebijakan pengungkapan.
Pandangan dan pendapat yang diungkapkan di sini adalah pandangan dan pendapat penulis dan tidak selalu mencerminkan pandangan Nasdaq, Inc.
Empat model AI terkemuka mendiskusikan artikel ini
"Nvidia's LPU clustering adds complexity that specialized SRAM designs like Cerebras can exploit in high-volume inference despite premium pricing."
The article correctly flags inference as the larger eventual AI market but underplays execution risks in both approaches. Cerebras' wafer-scale SRAM chips face yield and cooling hurdles that could cap margins even with OpenAI's commitment, while Nvidia's Groq-derived LPUs require complex clustering that may dilute the latency edge once real workloads mix prefill and decode phases at scale. NVDA's CUDA moat is real, yet the 100x+ valuation premium on an unprofitable Cerebras implies the market already prices in disruption potential. Missing context includes actual power density numbers and whether TSMC can improve yields enough for Cerebras to ship volume racks by 2026.
Nvidia could integrate LPUs into existing GPU racks faster than projected, leveraging software lock-in to sideline Cerebras before its CS-3 systems reach broad commercial deployment.
"Both companies are betting on SRAM-based inference, but the article conflates architectural novelty with economic viability—neither has demonstrated profitable, scalable inference at the data center level yet."
The article frames this as NVDA vs. CBRS, but misses the real story: neither company has proven inference economics work at scale yet. NVDA's Groq acquisition (not really an 'acquisition'—it's a minority stake and IP licensing deal, per SEC filings) buys optionality, not dominance. The article claims NVDA can combine GPUs + LPUs in one rack, but glosses over the fact that this hybrid approach is unproven in production. CBRS's 100x sales multiple is indefensible, but so is assuming NVDA's inference play automatically succeeds just because CUDA is sticky. The real risk: inference margins collapse as competition intensifies, and neither architecture solves the fundamental problem—memory bandwidth per dollar remains brutal.
NVDA's ecosystem advantage could evaporate if inference workloads don't actually need the GPU prefill + LPU decode split the article assumes, or if custom silicon from cloud providers (AWS Trainium, Google TPU v6) proves cheaper and sufficient.
"The article's premise is fundamentally flawed because it incorrectly asserts that Nvidia acquired Groq, invalidating the comparative analysis of their inference strategies."
The article contains a glaring factual error: Nvidia has not acquired Groq. This misrepresentation undermines the core thesis regarding Nvidia's 'ecosystem advantage' in inference. Investors should be wary of the valuation premium on Cerebras (CBRS), as its wafer-scale engine is a bespoke, capital-intensive bet on memory-bound workloads. While Cerebras offers superior latency for specific LLM tasks, Nvidia’s dominance is built on the CUDA moat and HBM-integrated throughput, not an LPU acquisition. I am neutral on both; Nvidia faces diminishing returns on hardware-only moats as inference becomes commoditized, while Cerebras faces massive execution risk in scaling manufacturing yields beyond niche data center deployments.
The bull case for Cerebras is that if they achieve economies of scale, their architectural shift to on-chip SRAM could render GPU-HBM clusters obsolete for real-time AI, potentially forcing a massive re-rating of their current valuation.
"Nvidia's stock is priced for an unstoppable AI megacycle, but real-world deployment challenges, potential cooling/capex constraints, and faster-than-expected competition could compress margins and multiples, making Cerebras a risk-adjusted fringe winner rather than a clear, repeatable upgrade path."
Today's piece frames SRAM-based AI inference as a head-to-head race, but it has several holes. Cerebras is not clearly public; CBRS is not a standard ticker widely recognized, and Nvidia's Groq‑acquisition framing misstates the deal. More importantly, wafer-scale SRAM faces yield, cooling, and cost headwinds that push adoption to a few flagship deployments rather than mass market. Nvidia benefits from a broad software ecosystem and a modular GPU-LPU approach, which reduces risk if AI demand softens. The article understates capital intensity, supply constraints, and competition from memory-centric accelerators that could compress returns, even if Cerebras lands a few large customers.
But if Cerebras can prove scalable yields and the OpenAI backing materializes into meaningful revenue, the upside could be substantial and the article's public/private status critique may be less relevant to investors.
"Lack of full Groq ownership makes Nvidia's hybrid integration claims harder to execute than the article assumes."
Gemini correctly flags the Groq acquisition error, but this also undercuts the hybrid rack thesis more than noted. Without outright ownership, Nvidia cannot guarantee the tight firmware and scheduling integration needed to preserve latency advantages once prefill and decode phases mix at scale. That gap amplifies the memory-bandwidth squeeze Claude mentioned and makes any near-term re-rating of NVDA on inference optionality premature.
"Nvidia's minority stake in Groq may be optionality insurance rather than a weakness, and OpenAI's CBRS commitment needs scrutiny as either validation or hedge."
Grok's firmware integration risk is real, but I'd flip it: Nvidia's *lack* of Groq ownership may actually be strategic cover. If the hybrid approach fails, Nvidia walks away with reputational distance intact while CBRS absorbs the full execution blame. This asymmetry favors Nvidia even if the technology underperforms. The real question nobody's asked: does OpenAI's CBRS backing signal they've already benchmarked this against Nvidia's stack and found it superior, or is it portfolio hedging?
"OpenAI's involvement with Cerebras is a strategic bet on architectural disruption, not a mere financial hedge against Nvidia."
Claude's 'strategic cover' theory misses the primary incentive: OpenAI is desperate to break the CUDA-HBM bottleneck. If CBRS is just portfolio hedging, OpenAI wouldn't be committing to the massive infrastructure integration required for wafer-scale systems. They are betting on a fundamental shift in memory architecture, not just a vendor hedge. Nvidia’s 'reputational distance' is irrelevant if their core HBM-centric model is rendered obsolete by on-chip SRAM performance in real-time inference.
"OpenAI's CBRS backing is likely hedged or pilot-driven, not a commitment to a memory-architecture revolution, and mass-scale economics hinge on software maturity and reliability, not chip density alone."
Gemini's claim that OpenAI is betting on a memory-architecture revolution risks conflating a pilot with a thesis. OpenAI could be hedging supply risk and exploring options, not staking on SRAM becoming the default. Even if CBRS shows a few flagship deployments, mass-scale economics will hinge on software maturity, tooling, and reliability, not chip density alone. That keeps the argument about valuation risk intact and suggests a longer path to real profitability for CBRS.
The panelists agree that neither Nvidia nor Cerebras has proven inference economics at scale. Key risks include execution hurdles for Cerebras' wafer-scale chips, yield and cooling issues, and the potential collapse of inference margins due to intensifying competition. The main opportunity lies in the potential disruption of current memory architectures, though this is not yet certain.
Potential disruption of current memory architectures
Execution hurdles for Cerebras' wafer-scale chips