Traderanno presto sui prezzi dei chip per computer mentre l'AI fa lievitare i costi
Di Maksym Misichenko · CNBC ·
Di Maksym Misichenko · CNBC ·
Cosa pensano gli agenti AI di questa notizia
Il panel è diviso sui futures sulle GPU di CME, con preoccupazioni sull'incertezza della domanda, l'efficienza del software e il rischio di base che contrastano i potenziali benefici come la scoperta dei prezzi e le opportunità di copertura.
Rischio: Incertezza della domanda e rischio di base, come evidenziato da Claude e ChatGPT.
Opportunità: Potenziale di scoperta dei prezzi e di copertura, come menzionato da Grok e Claude.
Questa analisi è generata dalla pipeline StockScreener — quattro LLM leader (Claude, GPT, Gemini, Grok) ricevono prompt identici con protezioni anti-allucinazione integrate. Leggi metodologia →
Un nuovo mercato dei futures per i semiconduttori consentirà ai trader di coprire i loro investimenti in intelligenza artificiale con scommesse sul prezzo sempre più elevato della potenza di calcolo.
I contratti sul nuovo "mercato dei futures di calcolo" di CME Group si baseranno su indici dei prezzi delle unità di elaborazione grafica (GPU) di Silicon Data, hanno affermato le società in una dichiarazione rilasciata martedì che annuncia la joint venture, che è ancora in attesa di revisione normativa.
Il nuovo mercato consentirà agli investitori di bloccare un prezzo per la capacità di calcolo basato su un benchmark della GPU, che può essere utilizzato per coprirsi contro l'aumento dei tassi di noleggio delle GPU e altre spese operative nell'enorme e multiforme sviluppo dell'AI.
"I mercati delle GPU... storicamente sono mancati di una quotazione di riferimento standardizzata", ha affermato Carmen Li, amministratore delegato di Silicon Data, nella dichiarazione. "Il lancio dei futures di calcolo è un passo importante verso la fornitura di strumenti più affidabili per la valutazione, la copertura e la pianificazione a lungo termine per i costruttori di AI, i fornitori di cloud e gli investitori."
I mercati dei futures sono tradizionalmente associati a materie prime di base come alimenti, metalli e prodotti petroliferi, ma sono emersi anche per componenti assemblati in segmenti in rapido sviluppo dei settori industriali avanzati.
Durante l'esplosione della banda larga alla fine degli anni '90, la divisione dei servizi a banda larga di Enron mirava a vendere capacità inutilizzata sulla sua rete di cavi in fibra ottica prima del clamoroso fallimento dell'azienda.
Silicon Data vende l'accesso a indici di prezzi specializzati ai clienti, simili all'indice dei prezzi al consumo o all'indice delle spese di consumo personali, ad eccezione dei semiconduttori. I suoi prodotti includono un indice dei prezzi delle GPU standardizzato, un indice RAM e proiezioni per i prezzi di noleggio delle GPU.
Wall Street non prevede che la domanda di GPU, o unità di elaborazione centrale (CPU) più tradizionali, rallenti in tempi brevi.
"L'AI agentica richiede intere nuove file di server CPU che siedono accanto all'infrastruttura GPU ed eseguono il lavoro di tutti questi agenti", ha scritto l'analista Shawn Kim di Morgan Stanley in un rapporto lunedì.
"Il sistema AI in futuro assomiglierà a un sistema distribuito composto da file di GPU per il calcolo del modello denso... [e] file di CPU agentici per l'orchestrazione, l'elaborazione dei dati e l'esecuzione di strumenti", ha affermato Kim.
I prezzi dei chip di memoria sono saliti nel primo trimestre poiché l'AI ha guidato un aumento della domanda di CPU. Gli hyperscaler hanno aumentato la spesa per capitali a tutto tondo mentre i dirigenti hanno espresso preoccupazioni per un collo di bottiglia nella memoria che sta facendo aumentare i costi di input.
I produttori di chip di memoria stanno proiettando enormi margini di profitto per quest'anno e il prossimo poiché le valutazioni sono schizzate alle stelle.
Quattro modelli AI leader discutono questo articolo
"L'introduzione dei futures sulle GPU probabilmente comprimerà i margini hardware accelerando la mercificazione del calcolo IA, spostando potenzialmente il valore dai produttori agli utenti finali cloud-native."
La mossa di CME di rendere le GPU una commodity è un'arma a doppio taglio. Se da un lato fornisce strumenti di copertura necessari per gli hyperscaler come MSFT o AMZN per gestire le spese operative volatili, dall'altro segnala la "mercificazione" dello stack hardware dell'IA. Se il calcolo diventa una commodity negoziabile, il potere di determinazione dei prezzi dei leader hardware come NVDA potrebbe subire pressioni al ribasso a lungo termine poiché i margini si comprimono per eguagliare i prezzi degli indici standardizzati. Il confronto con il fallito mercato della banda larga di Enron è appropriato; la liquidità è l'ostacolo definitivo. Se questi contratti non riusciranno ad attrarre un volume sufficiente da parte degli utenti finali effettivi, rischiano di diventare un parco giochi speculativo che esacerba la volatilità anziché smorzarla.
La standardizzazione potrebbe effettivamente accelerare l'adozione abbassando la barriera per le aziende più piccole per entrare nello spazio dell'IA, espandendo efficacemente il mercato totale indirizzabile per il calcolo e sostenendo prezzi hardware elevati.
"I futures sulle GPU istituzionalizzano il calcolo come classe di asset copribile, posizionando CME per monetizzare il boom delle infrastrutture dell'IA con volumi che rivaleggiano con i prodotti crypto."
I futures sulle GPU di CME, legati agli indici di Silicon Data, colmano una lacuna critica per la copertura dei costi in rapida crescita del calcolo IA, vitale poiché gli hyperscaler affrontano colli di bottiglia nella memoria e l'IA agentiva richiede rack CPU/GPU ibridi secondo Morgan Stanley. Non si tratta solo di hype: i picchi dei prezzi della memoria nel primo trimestre e i grassi margini previsti per i produttori di chip sottolineano una domanda sostenuta. Per CME (CME), si tratta di una diversificazione vincente simile al loro successo nei futures sul Bitcoin, che potrebbe aggiungere volume in un mercato di capex IA annuale di oltre 100 miliardi di dollari. L'approvazione normativa è in sospeso, ma le basse barriere per i giganti del cloud per coprire i noleggi potrebbero generare rapidamente liquidità.
I mercati di nicchia dei futures come la capacità di banda larga di Enron falliscono storicamente a causa della liquidità se i prezzi sottostanti si normalizzano — le rampe di fornitura di Nvidia potrebbero ridurre i costi delle GPU, condannando l'interesse aperto iniziale.
"Un mercato dei futures è una condizione necessaria ma non sufficiente per l'inflazione dei costi delle GPU — abilita la copertura contro i movimenti di prezzo ma non dimostra che tali movimenti siano inevitabili o strutturali."
Il mercato dei futures sul calcolo affronta una lacuna reale: i prezzi delle GPU sono stati opachi e illiquidi, rendendo difficile la copertura per i costruttori di infrastrutture IA. L'ingresso di CME legittima la classe di asset e potrebbe sbloccare trilioni nella pianificazione dei capex IA. Tuttavia, l'articolo confonde due cose separate: (1) l'esistenza di un mercato dei futures, che è rialzista per la scoperta dei prezzi, e (2) l'evidenza che i costi delle GPU stanno effettivamente spirando in modo incontrollabile. I margini dei chip di memoria si stanno effettivamente espandendo, ma si tratta in parte di un recupero ciclico dai minimi del 2023, non necessariamente di un'inflazione strutturale. L'analogia della banda larga di Enron è un avvertimento: i nuovi mercati dei futures possono fallire spettacolarmente se le ipotesi di domanda sottostanti si rompono.
Se i prezzi delle GPU si stabilizzano o diminuiscono a causa dell'aumento dell'offerta (NVIDIA, AMD, TSMC aumentano tutte la produzione), questo mercato dei futures diventa una soluzione a un problema che si sta già risolvendo da solo — e il basso volume di scambi potrebbe renderlo illiquido e irrilevante entro 18 mesi.
"I futures sul calcolo potrebbero fallire come coperture efficaci a causa del rischio di base, dell'incerta liquidità e del disallineamento tra i prezzi degli indici e la spesa effettiva per il calcolo IA."
L'idea dei futures sul calcolo potrebbe aiutare a prezzare il rischio intorno alle espansioni dell'IA standardizzando un riferimento per i costi di capitale delle GPU. In teoria, offre uno strumento liquido per coprire le crescenti commissioni di capacità poiché la domanda di acceleratori IA rimane robusta. Ma ci sono grandi avvertenze: l'indice potrebbe non tracciare la spesa effettiva di calcolo tra cloud, on-premise o rack noleggiati, creando rischio di base per gli utenti con un utilizzo idiosincratico. La liquidità, le meccaniche di regolamento e l'approvazione normativa rimangono questioni aperte, e un picco nei prezzi delle GPU potrebbe non tradursi in costi effettivi più elevati se gli acquirenti si spostano verso l'ottimizzazione, architetture diverse o sconti di licenza. La qualità e la tempistica dei dati saranno cruciali.
Anche se i prezzi delle GPU rimangono elevati, la spesa effettiva per il calcolo potrebbe divergere a causa dell'efficienza d'uso, delle sfumature dei prezzi cloud e degli sconti sui contratti; i futures potrebbero faticare ad attrarre liquidità o potrebbero soffrire di rapidi cambiamenti nel contango/backwardation, rendendo le coperture inaffidabili.
"I rapidi guadagni di efficienza di calcolo guidati dal software renderanno i contratti futures basati su GPU strutturalmente obsoleti, disaccoppiando i costi hardware dai requisiti effettivi di addestramento dei modelli."
Claude ha ragione sulla ciclicità della memoria, ma tutti ignorano il rischio del "livello software". Se l'ottimizzazione del modello (ad esempio, quantizzazione, potatura) riduce il requisito di calcolo per token del 30% annuo, questi contratti futures affronteranno un crollo strutturale della domanda indipendentemente dall'offerta hardware. Coprire i costi hardware è futile se l'"unità di lavoro" sottostante diventa significativamente più economica attraverso l'efficienza software. Stiamo scommettendo su una commodity che viene attivamente ingegnerizzata verso l'obsolescenza dalle stesse aziende che la utilizzano.
"Le leggi di scala dell'IA guidano la crescita della domanda di calcolo più velocemente di quanto le efficienze software la erodano, rafforzando la vitalità dei futures."
Il tuo punto sull'efficienza software di Gemini esagera il rischio — i dati di Epoch AI mostrano che il calcolo raddoppia ogni 6-9 mesi tramite leggi di scala, superando le ottimizzazioni annuali del 30% (ad esempio, i guadagni 10x di inferenza di o1-preview richiedono ancora cluster più densi). I futures coprono perfettamente questa corsa agli armamenti. Non menzionato: i futures BTC di CME hanno catturato il 25% dell'interesse aperto nel primo anno; un'adozione simile da parte degli hyperscaler potrebbe creare rapidamente un mercato nozionale da 10 miliardi di dollari.
"I futures sulle GPU risolvono un problema di trasparenza che non esiste, non il rischio effettivo — ovvero se l'appetito per i capex degli hyperscaler si manterrà o si normalizzerà."
L'argomento di Grok sulle leggi di scala di Epoch AI presuppone che la corsa agli armamenti continui linearmente, ma ignora che i guadagni di efficienza di inferenza (10x di o1) potrebbero disaccoppiarsi dalle richieste di calcolo di addestramento. Se l'inferenza diventa il motore dei costi e si ottimizza più velocemente di quanto l'addestramento scala, i futures coprono una porzione decrescente della spesa IA totale. Anche il confronto di CME con Bitcoin è errato: i futures BTC hanno avuto successo perché la scoperta dei prezzi era il collo di bottiglia. La determinazione dei prezzi delle GPU è già trasparente tramite i mercati spot — il vero problema è l'incertezza della domanda, non l'opacità. I futures non risolvono questo problema.
"Il rischio di base potrebbe erodere l'utilità dei futures sul calcolo anche se si verificano miglioramenti dell'efficienza, a meno che l'indice non tracci esplicitamente il mix di carichi di lavoro effettivi e le strutture di sconto."
La cautela di Gemini sull'efficienza software è reale ma non fatale; il rischio maggiore è la base: se gli indici dei costi delle GPU non riescono a tracciare la spesa effettiva tra addestramento e inferenza, sconti cloud e affitti multi-tenant, le coperture prezzano male e la liquidità potrebbe evaporare. In breve, anche con miglioramenti dell'efficienza, l'"unità di lavoro" sta cambiando; l'indice potrebbe divergere, rendendo i futures inaffidabili come strumento di copertura a meno che i segmenti di domanda e i carichi di lavoro non siano esplicitamente mappati.
Il panel è diviso sui futures sulle GPU di CME, con preoccupazioni sull'incertezza della domanda, l'efficienza del software e il rischio di base che contrastano i potenziali benefici come la scoperta dei prezzi e le opportunità di copertura.
Potenziale di scoperta dei prezzi e di copertura, come menzionato da Grok e Claude.
Incertezza della domanda e rischio di base, come evidenziato da Claude e ChatGPT.