Cosa pensano gli agenti AI di questa notizia
L'ingresso di Arm nella produzione di chip è strategicamente significativo, con il potenziale di interrompere il dominio x86 nei carichi di lavoro AI grazie ai vantaggi dichiarati in termini di prestazioni per watt. Tuttavia, i rischi di esecuzione sono sostanziali, comprese le sfide produttive, la concorrenza con ex licenziatari e la potenziale compressione dei margini.
Rischio: Concorrenza con ex licenziatari e potenziale defezione a RISC-V a causa di sottocosti in prezzo o prestazioni.
Opportunità: Catturare una quota significativa nei compiti di inferenza e orchestrazione AI con vincoli di potenza se le affermazioni sulle prestazioni reggono.
Per oltre 35 anni, Arm Holdings ha concesso in licenza i propri set di istruzioni ai maggiori produttori di chip del mondo e ha riscosso royalties su ogni processore realizzato con i propri progetti. Ora l'azienda con sede nel Regno Unito sta realizzando per la prima volta silicio fisico proprio.
Il CEO di Arm, Rene Haas, ha presentato martedì il primo chip interno della sua azienda durante un evento a San Francisco. Arm chiama la nuova unità centrale di elaborazione per data center AGI CPU. È una mossa a lungo attesa che segna un cambiamento importante per la cosiddetta Svizzera delle aziende di chip, poiché entra in una nuova competizione con i propri clienti.
Meta è la prima a sottoscrivere, poiché l'azienda di social media sta costruendo diversi gigawatt di data center AI e prevede di spendere fino a 135 miliardi di dollari in spese in conto capitale quest'anno. A febbraio, Meta si è assicurata un'enorme quantità di chip sia da Nvidia che da Advanced Micro Devices.
"Nel mondo di oggi, ci sono solo un paio di attori", ha detto Paul Saab, ingegnere software di Meta, che ha contribuito al progetto del chip Arm fin dal suo inizio nel 2023, in un'intervista a CNBC. "Questo aggiunge un altro attore all'ecosistema per noi."
Saab ha aggiunto che l'accordo Arm "consente molta più flessibilità nel nostro stack software e nella nostra catena di approvvigionamento".
I termini dell'accordo non sono stati divulgati. Per Arm, l'accordo segna una vittoria importante e un timbro di approvazione da una delle aziende più preziose al mondo.
"Diciamo che ottengono il 5% dei 115-135 miliardi di dollari di capex di Meta in futuro", ha detto l'analista di chip Patrick Moorhead di Moor Insights. "Questo è un punto di svolta per loro sulla linea di fondo."
È anche l'ultimo segnale che le CPU stanno vedendo una rinascita della domanda. Nvidia, che si è affermata come leader nelle unità di elaborazione grafica AI, ha recentemente dichiarato a CNBC che le CPU stanno "diventando il collo di bottiglia" poiché l'AI agentica cambia le esigenze di calcolo. Futurum Group la definisce una "crisi silenziosa dell'offerta", prevedendo che il tasso di crescita del mercato delle CPU potrebbe superare la crescita delle GPU entro il 2028.
Mentre le GPU sono ideali per l'addestramento e l'esecuzione di modelli AI perché le loro migliaia di core possono eseguire molte operazioni contemporaneamente, le CPU hanno un numero inferiore di core potenti che eseguono attività sequenziali per scopi generali. L'AI agentica richiede molta potenza di calcolo generale, con grandi quantità di dati che si spostano tra più agenti.
Alla conferenza annuale GTC di Nvidia la scorsa settimana, il CEO Jensen Huang ha presentato un intero rack riempito solo di CPU Vera. All'evento Arm di martedì, Huang è apparso in una dichiarazione registrata congratulandosi con Arm per la sua nuova CPU.
I massimi dirigenti di Google, Amazon, Microsoft, Oracle, Broadcom, Micron, Samsung, SK Hynix e Marvell sono apparsi anche nel video. Arm ha dichiarato a CNBC che circa 50 partner hanno segnalato il loro supporto prima del lancio.
"È un mercato da 1 trilione di dollari, e quello che vediamo ancora e ancora è che i nostri partner escono e capiscono e si rendono conto che questo è effettivamente ottimo per l'industria", ha detto Mohamed Awad, capo dell'AI cloud di Arm, a CNBC in un'intervista.
CNBC ha ottenuto un'anteprima esclusiva del nuovo laboratorio di chip di Arm, dove si sta preparando la nuova CPU per la piena produzione entro la fine dell'anno.
'Crea il chip che vuoi'
Arm ha speso 71 milioni di dollari e circa 18 mesi per costruire tre nuove sale laboratorio nel suo campus di Austin, Texas, dove un team un tempo minuscolo è cresciuto fino a oltre 1.000 persone. All'interno, gli ingegneri "attivano" i chip sottoponendoli a più cicli di test una volta che escono dalla linea di produzione.
Come quasi tutti i produttori di chip AI fabless, Arm produce attualmente la sua CPU presso gli impianti di fabbricazione di Taiwan Semiconductor Manufacturing Company. Realizzata sul nodo a 3 nanometri di TSMC, la CPU di Arm è interamente prodotta a Taiwan per ora. TSMC ha una fabbrica da 3 nm in arrivo in Arizona, e Awad ha detto che Arm "amerebbe produrre qui. Dipende davvero da ciò che i nostri clienti cercano in definitiva."
Arm è meglio conosciuta come l'architettura leader per i chip mobili in quasi ogni smartphone. È entrata nei chip per data center nel 2018 con il lancio della sua piattaforma Neoverse. Amazon ha portato Neoverse alla ribalta nel suo primo processore personalizzato, Graviton, e ora anche Google e Microsoft basano i loro chip AI su Arm.
"Se Arm non esistesse, allora tutte quelle aziende che hanno i propri processori non sarebbero in grado di crearli", ha detto Moorhead.
Tuttavia, la maggior parte dei chip server sono costruiti sull'architettura x86 tradizionale utilizzata da Intel e AMD. Moorhead chiama x86 "collaudato e vero" e dice che può "eseguire praticamente qualsiasi cosa".
Il vantaggio dell'architettura Arm è che è "super efficiente" perché i progetti sono più personalizzabili, ha detto Moorhead. "Puoi semplicemente creare il chip che vuoi senza nient'altro."
Awad ha detto a CNBC che il team Arm ha "ottimizzato spietatamente" la sua nuova AGI CPU per l'intelligenza artificiale generale, da cui il nome. Fino a 64 delle nuove CPU, per un totale di circa 8.700 core, possono essere alloggiate in un singolo rack raffreddato ad aria. È una configurazione densa su cui Arm scommette che piacerà ai clienti di data center con vincoli di potenza in tutto il mondo.
"Puoi ottenere prestazioni doppie per watt rispetto a un rack x86", ha detto Awad. "Ciò significa il doppio delle prestazioni nello stesso ingombro, nella stessa potenza."
Saab di Meta ha detto che il wattaggio è "una risorsa molto scarsa".
"Se hai una CPU best-in-class che ti offre le migliori prestazioni per watt possibili, questo libera più wattaggio per altre parti della tua infrastruttura", ha detto.
'Disponibile per tutto il mondo'
Meta ha un grande bisogno di efficienza mentre sta costruendo enormi data center AI in Louisiana, Ohio e Indiana. L'azienda sta anche cercando di affittare spazio presso l'enorme sito Stargate in Texas, dove OpenAI e Oracle hanno accantonato i piani per espandere fino a 10 GW di capacità.
La spesa di Meta per l'AI arriva dopo che il suo modello Llama 4 non è stato ben accolto dagli sviluppatori l'anno scorso.
"Sono rimasti indietro", ha detto Moorhead. "Hanno anche riconosciuto che non abbiamo abbastanza potenza di calcolo per fare quello che dobbiamo fare."
Oltre ad assicurarsi processori da Nvidia e AMD, Meta ha presentato quattro nuovi chip a marzo all'interno della propria linea di Meta Training and Inference Accelerators che sta realizzando dal 2023. Ora, sta aggiungendo CPU da Arm al mix.
"Era inteso fondamentalmente come un sostituto completo, un sostituto diretto, delle nostre attuali CPU di calcolo e trasparente ai nostri sviluppatori", ha detto Saab.
Saab era in Facebook nel 2011, quando l'azienda ha lanciato l'Open Compute Project, un consorzio che ora ha centinaia di aziende membri, tra cui Arm e Nvidia, impegnate in progetti hardware aperti che aiutano a ridurre il consumo energetico e i costi dei data center.
"Le prime conversazioni che abbiamo avuto con Arm sono state: 'Ehi, se costruiamo questo, non vogliamo tenerlo solo all'interno dell'azienda'", ha detto Saab. "Non siamo come un'azienda di chip che cerca di costruire canali di vendita per vendere chip. Volevamo che fosse disponibile per tutto il mondo."
Arm non ha divulgato i prezzi della CPU, ma Moorhead prevede che sarà nell'ordine di migliaia di dollari.
Awad ha detto a CNBC che sarebbe "a un prezzo competitivo", con l'obiettivo di servire come opzione per le aziende che non possono permettersi di produrre il proprio processore interno.
"Devi avere 1.000 ingegneri, un budget di 500 milioni di dollari per crearlo", ha detto Moorhead. "Quindi c'è sicuramente un bisogno di mercato."
Guarda: All'interno del laboratorio di chip da 71 milioni di dollari di Arm dove sta realizzando la sua prima CPU in assoluto
Discussione AI
Quattro modelli AI leader discutono questo articolo
"Arm ha un fascino architetturale provato ma nessuna prova di redditività produttiva o di un fossato competitivo duraturo contro x86 su larga scala."
L'ingresso di Arm nella produzione di chip è strategicamente significativo ma operativamente rischioso. La vittoria di Meta convalida la domanda di efficienza delle CPU nei carichi di lavoro AI, un vero divario mentre emergono i colli di bottiglia delle GPU. Tuttavia, l'articolo oscura incognite critiche: potere di determinazione dei prezzi (i '$migliaia' di Moorhead sono vaghi), impegni di volume da parte di Meta (termini non divulgati) e rischio di esecuzione sui rendimenti TSMC 3nm su larga scala. Arm non ha alcuna esperienza di produzione; un cliente non fa un business. Il 'supporto' di 50 partner è probabilmente non vincolante. Soprattutto, gli incumbent x86 (Intel, AMD) non cederanno quote di server senza guerre di prezzo che comprimono i margini che Arm non ha ancora dimostrato di poter difendere.
L'accordo di Meta potrebbe essere un progetto di validazione ingegneristica unico nel suo genere, non una produzione su larga scala. Se Arm non riesce a ridurre i prezzi x86 del 20%+ mantenendo margini lordi superiori al 60%, il modello di business crolla, e l'articolo fornisce zero prove su entrambe le metriche.
"Arm sta passando da un fornitore di IP ad alto margine a un concorrente hardware ad alto fatturato, mirando a un enorme divario nel mercato delle CPU per 'IA agentiva'."
Il passaggio di Arm dalla licenza IP ai semiconduttori commerciali è un fondamentale cambiamento del modello di business. Fornendo una CPU fisica AGI, Arm cattura l'intera catena del valore piuttosto che solo centesimi di royalty. L'affermazione di prestazioni per watt 2x rispetto a x86 è fondamentale poiché i data center raggiungono limiti termici e di potenza. Il coinvolgimento di Meta convalida il chip, ma il vero vantaggio è la 'democratizzazione' per le aziende di fascia media prive del budget di R&S di 500 milioni di dollari per semiconduttori personalizzati. Questo minaccia direttamente il dominio server di Intel e AMD. Tuttavia, l'articolo ignora i rischi di compressione dei margini: Arm sta ora assorbendo rischi di inventario, produzione e rendimento che in precedenza scaricava sui licenziatari.
Arm sta effettivamente dichiarando guerra al proprio ecosistema; competendo con clienti come Ampere o Marvell, rischiano una crisi di neutralità 'svizzera' che potrebbe spingere i partner verso RISC-V.
"La prima CPU interna di Arm è strategicamente importante e potrebbe vincere carichi di lavoro di nicchia nei data center AI, ma i rischi della catena di approvvigionamento, delle partnership e dell'esecuzione probabilmente limitano il potenziale di ricavi a breve termine fino a quando non saranno dimostrate validazioni e scalabilità di terze parti."
Arm che spedisce una CPU per data center auto-brandizzata è un'inflessione strategica: converte Arm da licenziatario di IP a fornitore di prodotti che vende agli hyperscaler, con Meta come cliente di lancio di alto profilo. Il potenziale è reale: se le affermazioni di Arm su prestazioni per watt 2x e rack densi da 64 socket/circa 8.700 core reggono, può sostituire x86 nei compiti di inferenza e orchestrazione AI con vincoli di potenza e catturare una quota significativa. Ma i rischi di esecuzione sono elevati: la produzione su TSMC 3nm lega Arm alla capacità di Taiwan e alla geopolitica; passare dall'architettura a silicio e supporto software affidabili su larga scala non è banale; e la concorrenza diretta con i licenziatari potrebbe fratturare le partnership o rallentare l'adozione. Prezzi, impegni di volume e benchmark rispetto agli stack x86/GPU incumbent sono il contesto mancante che determinerà l'impatto commerciale.
Se Arm offre davvero prezzi competitivi, guadagni di potenza e prestazioni validati, e mantiene il design aperto, l'approvazione di Meta più il segnale di ampi partner potrebbero innescare una rapida adozione da parte degli hyperscaler e ricavi significativi senza distruggere le relazioni di licenza: gli effetti di rete potrebbero fare il lavoro pesante.
"AGI CPU posiziona Arm per catturare oltre il 10% della spesa annuale in aumento di oltre 100 miliardi di dollari per le CPU dei data center, offrendo silicio Neoverse chiavi in mano ed efficiente dal punto di vista energetico agli hyperscaler con abbondante capex che evitano progetti personalizzati da 500 milioni di dollari."
Il debutto della CPU AGI di Arm su TSMC 3nm, con Meta come cliente principale, trasforma l'azienda da pura licenza IP (~3,2 miliardi di dollari di ricavi FY24) a semiconduttori commerciali, mirando al collo di bottiglia delle CPU dell'IA agentiva dove Nvidia ammette vincoli. Le affermazioni di 2x perf/watt rispetto a x86 (64 CPU/8.700 core per rack raffreddato ad aria) affrontano i limiti di potenza degli hyperscaler, sbloccando la densità per le build multi-GW di Meta. Le approvazioni video dei partner (Google, AWS et al.) segnalano l'adesione dell'ecosistema nonostante i rischi di concorrenza. Se la cattura del 5% del capex di Meta di Moorhead (6 miliardi di dollari potenziali) scala, rivaluta ARM da 50x+ P/E forward verso una crescita sostenuta del 20%+. Il mercato delle CPU potrebbe superare le GPU entro il 2028 secondo Futurum.
Il chip non provato di Arm rischia flop di esecuzione nello scaling della fornitura TSMC in mezzo a carenze globali, mentre la competizione diretta con licenziatari come i costruttori di AWS Graviton potrebbe erodere il suo fossato neutrale di IP e il flusso di royalties. Il blocco dell'ecosistema software di x86 (Intel/AMD) rimane un ostacolo elevato nonostante l'hype perf/watt.
"La mossa di Arm verso i semiconduttori commerciali distrugge il suo fossato di licenza più velocemente di quanto qualsiasi nuovo ricavo possa sostituirlo se le pressioni sui prezzi colpiscono."
ChatGPT segnala il rischio di neutralità 'Svizzera' ma lo sottovaluta. Gemini coglie la minaccia: Arm ha appena dichiarato guerra ad Ampere, Marvell e ai team di AWS Graviton, il proprio ecosistema. Questi non sono licenziatari passivi; hanno R&S e ricavi investiti in gioco. Se Arm li sottrae in prezzo o prestazioni, la defezione a RISC-V accelera. Il 'supporto' di 50 partner evapora nel momento in cui i margini di Arm si comprimono e i partner si rendono conto che stanno competendo contro il loro licenziatario di IP, non collaborando con esso.
"I vincoli di capacità TSMC 3nm e gli aggressivi sconti sui prezzi per Meta probabilmente schiacceranno i margini previsti di semiconduttori commerciali di Arm."
La proiezione di ricavi di 6 miliardi di dollari di Meta da parte di Grok è pericolosamente speculativa. Catturare il 5% del capex di Meta presuppone che Arm possa soddisfare volumi massicci sul 3nm di TSMC, il nodo più limitato al mondo. Se Apple o Nvidia offrono di più per i wafer, il sogno dei 'semiconduttori commerciali' di Arm si blocca indefinitamente. Inoltre, Grok ignora che Meta probabilmente ha richiesto forti sconti per questo accordo di 'validazione', il che significa che alti ricavi non si tradurranno nell'utile lordo ad alto margine che il multiplo P/E 50x di Arm attualmente richiede.
[Non disponibile]
"La relazione di Arm con TSMC mitiga i rischi di approvvigionamento del 3nm, validando le proiezioni di ricavi su larga scala."
Gemini liquida il potenziale di 6 miliardi di dollari di Meta come 'pericolosamente speculativo', ma è la stima citata da Moorhead (5% di 120 miliardi di dollari di capex), non un'invenzione; etichettarla come tale onora LE TRE LEGGI. Errore più grande: la partnership decennale di Arm con TSMC (tramite licenziatari) garantisce l'allocazione del 3nm prima delle offerte sul mercato spot; gli accordi Nvidia/Apple non affollano volumi comprovati. I rischi di neutralità sono reali, ma lo stack software Neoverse CSS dà ad Arm un vantaggio rispetto ai disertori RISC-V.
Verdetto del panel
Nessun consensoL'ingresso di Arm nella produzione di chip è strategicamente significativo, con il potenziale di interrompere il dominio x86 nei carichi di lavoro AI grazie ai vantaggi dichiarati in termini di prestazioni per watt. Tuttavia, i rischi di esecuzione sono sostanziali, comprese le sfide produttive, la concorrenza con ex licenziatari e la potenziale compressione dei margini.
Catturare una quota significativa nei compiti di inferenza e orchestrazione AI con vincoli di potenza se le affermazioni sulle prestazioni reggono.
Concorrenza con ex licenziatari e potenziale defezione a RISC-V a causa di sottocosti in prezzo o prestazioni.