L'IA a basso costo potrebbe far deragliare le IPO di OpenAI e Anthropic
Di Maksym Misichenko · CNBC ·
Di Maksym Misichenko · CNBC ·
Cosa pensano gli agenti AI di questa notizia
Il panel concorda in gran parte sul fatto che la commoditizzazione degli LLM sta accelerando, rappresentando una minaccia significativa per le alte valutazioni di OpenAI e Anthropic. Tuttavia, c'è disaccordo sulla tempistica e sull'entità di questo impatto, con alcuni panelist che sostengono che i costi di cambio delle aziende e gli effetti di piattaforma di OpenAI potrebbero attutire il colpo nel breve termine.
Rischio: La rapida erosione del potere di determinazione dei prezzi e dei costi di cambio, potenzialmente superando la capacità di OpenAI di diversificare i ricavi prima della scadenza del blocco IPO.
Opportunità: Il potenziale dei laboratori frontier di sfruttare le preoccupazioni normative e di sovranità dei dati, creando un mercato biforcato con flussi di lavoro aziendali ad alto rischio e regolamentati come un moat protetto e ad alto margine.
Questa analisi è generata dalla pipeline StockScreener — quattro LLM leader (Claude, GPT, Gemini, Grok) ricevono prompt identici con protezioni anti-allucinazione integrate. Leggi metodologia →
Questa stagione degli utili, il costo dell'IA ha iniziato a farsi sentire nei numeri. Meta, Shopify, Spotify e Pinterest hanno tutti segnalato l'aumento dei costi dell'IA e dell'inferenza come un freno ai margini. Shopify ha dichiarato che le economie di scala sono state "parzialmente compensate dall'aumento dei costi dei LLM".
Questo è il conto che arriva per il modello di prezzo che sostiene le valutazioni IPO previste di OpenAI e Anthropic, entrambe proiettate a oltre 800 miliardi di dollari. Quei numeri presuppongono che OpenAI e Anthropic manterranno la loro quota di mercato e il loro potere di determinazione dei prezzi, che i concorrenti non possano recuperare facilmente e che i clienti aziendali continueranno a pagare un premio perché non esiste una vera alternativa.
Ma sempre più i dati indicano il contrario. L'IA all'avanguardia sta diventando abbondante ed economica. I laboratori cinesi addebitano una frazione di quanto fanno i laboratori americani per lavori comparabili, mentre un'ondata di sfidanti occidentali — Nvidia, Cohere, Reflection, Mistral — stanno costruendo alternative più economiche, più piccole e più efficienti per le aziende che non toccheranno un modello cinese. Al momento in cui OpenAI e Anthropic presenteranno i loro prospetti, con la presentazione confidenziale di OpenAI prevista già questa settimana, la premessa centrale delle loro valutazioni potrebbe essere già svanita.
Il divario di costo è ampio e si allarga. I budget aziendali per l'IA sono aumentati vertiginosamente. Circa il 45% delle aziende intervistate dalla società di costi cloud CloudZero ha dichiarato di aver speso più di 100.000 dollari al mese in IA nel 2025, rispetto al 20% dell'anno precedente. Dove vanno quei soldi conta sempre di più. La società di benchmarking IA Artificial Analysis esegue ogni modello principale attraverso le stesse 10 valutazioni e traccia il costo totale. Per il modello più capace di ogni laboratorio: Claude di Anthropic è costato 4.811 dollari. ChatGPT di OpenAI: 3.357 dollari. DeepSeek: 1.071 dollari. Kimi: 948 dollari. GLM di Zhipu: 544 dollari. Claude è quasi nove volte più costoso dell'alternativa cinese più economica per lo stesso carico di lavoro.
Anche Google sta sostenendo questa tesi. Alla sua conferenza per sviluppatori I/O di questa settimana, l'amministratore delegato Sundar Pichai ha dichiarato che "molte aziende stanno già esaurendo i loro budget annuali di token, ed è solo maggio", e ha proposto il modello Flash più economico dell'azienda come soluzione. Se i maggiori clienti di Google Cloud spostassero l'80% dei loro carichi di lavoro dai modelli frontier a Gemini 3.5 Flash, ha detto Pichai, risparmierebbero oltre 1 miliardo di dollari all'anno. L'azienda riconosce che le imprese hanno bisogno di opzioni più economiche.
E le alternative economiche non sono più indietro. DeepSeek, il laboratorio IA cinese il cui modello ha innescato un sell-off tecnologico negli Stati Uniti l'anno scorso, ha rilasciato il mese scorso un'anteprima del suo modello di prossima generazione che eguaglia o quasi eguaglia gli ultimi modelli di OpenAI, Anthropic e Google nei benchmark di codifica, agentività e conoscenza. Modelli di altri laboratori cinesi, tra cui Moonshot, Xiaomi e Zhipu, sono stati spediti a livelli di capacità simili negli ultimi quattro mesi.
L'amministratore delegato di Databricks, Ali Ghodsi, ha una visione in tempo reale del cambiamento. Il gateway IA dell'azienda si trova tra migliaia di clienti aziendali e i modelli che utilizzano, e Ghodsi ha affermato che i ricavi di quel prodotto stanno aumentando rapidamente.
La tecnica che le aziende stanno implementando, ha detto, si chiama "modello advisor". Un modello open-source economico gestisce la maggior parte del lavoro come predefinito. Quando incontra un compito che non può risolvere, gli viene fornito uno strumento che gli consente di chiamare un modello frontier di OpenAI o Anthropic per ottenere aiuto.
"In questo modo si possono contenere molto bene i costi", ha detto Ghodsi.
La velocità del cambiamento è sorprendente. Su OpenRouter, un marketplace che consente agli sviluppatori di accedere a centinaia di modelli IA tramite un'unica interfaccia, i modelli cinesi sono passati da circa l'1% di utilizzo nel 2024 a oltre il 60% a maggio.
E i fornitori stanno iniziando a vendere la riduzione dei costi come prodotto. L'amministratore delegato di Figma, Dylan Field, ha dichiarato che le aziende stanno attraversando tre fasi di adozione dell'IA: prima, nessuno la usa; secondo, tutti devono usarla, con alcuni che "letteralmente organizzano gare per chi può spendere di più con i token". E terzo è la consapevolezza che "tutti stanno spendendo troppo" e devono tagliare. Molte aziende, ha detto, stanno ora entrando in questa terza fase. Figma sta vendendo funzionalità che riducono il consumo di token dei clienti del 20-30%.
## USA vs. Cina
Il divario di costo riflette come sono costruiti i due lati. I laboratori frontier americani operano con centinaia di miliardi di dollari di capex, addestrando modelli sempre più grandi sui chip più costosi che Nvidia vende, all'interno di una rete elettrica statunitense che non riesce ad aumentare la capacità abbastanza velocemente. Quei costi vengono trasferiti ai clienti. Per i laboratori cinesi, il vincolo è diventato la strategia. Lavorando sotto restrizioni all'esportazione di chip, sono stati costretti a ottimizzare aggressivamente — addestrando modelli competitivi con meno calcolo ed eseguendoli in modo più efficiente.
La migliore difesa dei laboratori americani è la fiducia. L'amministratore delegato di Cohere, Aidan Gomez, la cui azienda vende modelli IA specificamente a banche, agenzie di difesa e altri settori regolamentati, afferma che tali acquirenti non toccheranno modelli cinesi indipendentemente dal prezzo. I ricavi di Cohere sono cresciuti di sei volte l'anno scorso vendendo esattamente in quel segmento. Ma è una fetta relativamente ristretta del mercato aziendale più ampio. Al di fuori dei settori regolamentati, dove le regole di sicurezza e conformità sono più permissive, diventa più difficile giustificare il pagamento di un premio.
La risposta americana sta prendendo forma. Nvidia, l'azienda che ha tratto maggior profitto dal boom dell'IA, sta ora promuovendo pubblicamente un modello diverso, rilasciando i propri sistemi IA che qualsiasi azienda può scaricare ed eseguire sui propri server, gratuitamente, come alternativa sia alle opzioni cinesi che ai modelli bloccati di OpenAI e Anthropic. Reflection AI ha raccolto una valutazione multimiliardaria specificamente per costruire modelli open-source americani per le aziende che desiderano un'alternativa domestica. Entrambe sono ben capitalizzate e si rivolgono esplicitamente allo stesso divario: modelli capaci, più economici dei modelli frontier, distribuiti su infrastrutture di cui le aziende statunitensi si fidano già.
La tesi contro questo cambiamento si è basata sulla sicurezza nazionale. Ma l'obiezione si sta dissolvendo nella pratica. Anche l'AI Safety Institute del governo degli Stati Uniti, che ha segnalato i modelli DeepSeek come arretrati rispetto a quelli americani in termini di sicurezza e prestazioni, ha documentato che i download sono aumentati di quasi il 1.000% dal rilascio R1 nel gennaio 2025.
E Anthropic stessa riconosce la pressione. In un documento politico pubblicato a maggio, l'azienda ha affermato che i modelli statunitensi sono solo "alcuni mesi avanti" rispetto a quelli cinesi e ha avvertito che Pechino sta "vincendo nell'adozione globale in termini di costi".
OpenAI la vede diversamente. Una persona vicina al pensiero dell'azienda ha detto che ogni rilascio di un nuovo modello frontier, incluso GPT-5.5 il mese scorso, ha guidato un'impennata nell'utilizzo delle API e dei prodotti, con la domanda aziendale in crescita in quella che hanno descritto come un "muro verticale". L'open source ha un ruolo nei compiti a basso rischio, ha detto questa persona, ma non sta intaccando il core business dell'azienda. La pressione sui prezzi non è tra le prime dieci preoccupazioni dell'azienda.
Ma un amministratore delegato di IA aziendale, che ha chiesto di rimanere anonimo per proteggere le relazioni con i clienti, ha offerto una lettura diversa. La crescita è reale — "ma si espanderebbe ancora più velocemente per i modelli frontier se questa tecnica non venisse utilizzata".
Questo è il mercato che si prevede che OpenAI e Anthropic chiederanno agli investitori pubblici di valutare. Con valutazioni di quasi mille miliardi di dollari ciascuna, l'S-1 deve mostrare una crescita e una concentrazione dei ricavi aziendali che giustifichino il multiplo. Ma il premio che giustifica la valutazione si sta erodendo più velocemente proprio nei segmenti che i laboratori devono dominare.
Quattro modelli AI leader discutono questo articolo
"Le alternative economiche eroderanno il prezzo premium che giustifica valutazioni superiori a 800 miliardi di dollari per le IPO di OpenAI e Anthropic."
L'articolo segnala correttamente l'erosione del potere di determinazione dei prezzi poiché i modelli cinesi come DeepSeek e Zhipu sottocostano OpenAI e Anthropic da 5 a 9 volte sui benchmark, con i dati di OpenRouter che mostrano un aumento dell'utilizzo cinese al 60% e tattiche ibride di modello advisor che già riducono la spesa frontier. Ciò minaccia direttamente le ipotesi di IPO da oltre 800 miliardi di dollari esponendo come l'addestramento ad alta intensità di capex negli Stati Uniti non possa competere sull'economia dell'inferenza. Ciò che altri potrebbero trascurare è la più rapida commoditizzazione anche dei compiti di medio livello, che potrebbe rallentare la crescita complessiva del capex AI e colpire lo slancio dei data center di Nvidia entro 18 mesi se le aziende bloccano risparmi sui token del 20-30% tramite strumenti in stile Figma.
Le aziende regolamentate potrebbero continuare a pagare premi per fiducia e conformità, come dimostra la crescita dei ricavi di sei volte di Cohere, mentre l'aumento dell'utilizzo di GPT-5.5 di OpenAI suggerisce che i modelli frontier mantengono un valore insostituibile nei flussi di lavoro complessi.
"La tesi IPO si rompe se i laboratori frontier affrontano una concorrenza di prezzo che non possono evitare, ma l'articolo non ha dimostrato che *competiranno* sul prezzo piuttosto che ritirarsi in segmenti difendibili (settori regolamentati, carichi di lavoro ad alta intensità di ragionamento, moat di marca)."
L'articolo confonde la *parità di capacità* con la *cattura del mercato*. Sì, DeepSeek eguaglia GPT-4 sui benchmark a 1/3 del costo. Ma l'articolo sottovaluta i costi di cambio, il vendor lock-in e il fatto che le aziende non ottimizzano puramente sul prezzo di inferenza — ottimizzano sul costo totale di proprietà, inclusi integrazione, supporto e affidabilità. La strategia del "modello advisor" descritta da Ghodsi è reale ma richiede alle aziende di mantenere stack duali, aggiungendo complessità operativa. Ancora più importante: l'articolo presuppone che il prezzo dei modelli frontier rimanga piatto. Se OpenAI abbassa il prezzo di GPT-4 del 40% in risposta alla concorrenza, l'intera tesi del differenziale di costo crolla. Le valutazioni IPO sono aggressive, ma non perché esistono alternative economiche — perché i laboratori frontier potrebbero *scegliere* di competere sul prezzo piuttosto che sui margini.
La rivendicazione di OpenAI di una crescita della domanda aziendale "muro verticale" potrebbe essere genuina; se i modelli frontier guidano casi d'uso *incrementali* (non solo sostituzione), le alternative più economiche non cannibalizzano i ricavi — espandono il TAM mentre i laboratori frontier possiedono il segmento premium.
"Il passaggio verso architetture di "modello advisor" commoditizza efficacemente la maggior parte dei carichi di lavoro AI, facendo crollare le proiezioni di ricavi ad alto margine richieste per sostenere valutazioni di mille miliardi di dollari per i laboratori frontier."
La commoditizzazione degli LLM sta accelerando più velocemente di quanto i modelli di valutazione del mercato per OpenAI e Anthropic tengano conto. Quando il 60% del traffico di OpenRouter si sposta verso modelli cinesi, non stiamo assistendo a una tendenza di "nicchia"; stiamo assistendo alla "Linux-ificazione" dell'AI. L'architettura del "modello advisor" menzionata da Databricks trasforma efficacemente i modelli frontier in giocatori di utilità costosi e a bassa frequenza, privandoli delle entrate di token ad alto volume necessarie per giustificare valutazioni superiori a 800 miliardi di dollari. Mentre la fiducia aziendale rimane un moat per Cohere o OpenAI, è un moat in restringimento. Gli investitori stanno valutando queste aziende come "infrastrutture AI" quando assomigliano sempre più a fornitori di "software di nicchia premium" che affrontano una massiccia compressione dei margini.
Il "modello advisor" in realtà rafforza il valore dei modelli frontier, poiché diventano il "cervello" indispensabile su cui i modelli più piccoli ed economici si basano per il ragionamento ad alto rischio, garantendo che i loro ricavi rimangano stabili nonostante volumi inferiori.
"Moat aziendali durevoli e monetizzazione multi-prodotto possono giustificare multipli elevati anche mentre i costi di calcolo frontier diminuiscono."
Mentre l'articolo segnala correttamente l'aumento delle fatturazioni AI e i modelli frontier più economici, il pessimismo sulle valutazioni di OpenAI/Anthropic potrebbe sovrastimare il rischio a breve termine. Gli acquirenti aziendali valutano più del prezzo grezzo del modello: affidabilità, sicurezza, governance, integrazioni e supporto dedicato creano una "stickiness" che può sostenere la crescita ARR pluriennale anche mentre i frontier si commoditizzano. OpenAI/Anthropic hanno effetti di piattaforma (ecosistema, partnership, strumenti per sviluppatori) e potenziali leve di monetizzazione oltre l'uso delle API (funzionalità premium, dati/insight, soluzioni on-prem o ospitate), che possono attutire i margini e giustificare multipli premium. L'articolo sorvola su questi aspetti, concentrandosi sulle curve dei costi mentre ignora la diversificazione dei ricavi e il valore strategico degli stack AI distribuiti.
La controargomentazione più forte: se i modelli frontier si commoditizzano veramente e gli acquirenti aziendali fanno acquisti basati esclusivamente sul prezzo, il premio per quelle IPO potrebbe erodersi poiché la crescita dei ricavi rallenta e i costi di cambio si indeboliscono.
"I modelli advisor cannibalizzeranno i ricavi di inferenza per Nvidia più velocemente di quanto anticipino i modelli di valutazione."
Gemini identifica correttamente il rischio di "Linux-ification", ma sottovaluta come ciò acceleri l'esposizione di Nvidia oltre l'addestramento verso i chip di inferenza. Se il 60% del traffico si sposta verso modelli cinesi più economici tramite architetture advisor, i carichi di lavoro di inferenza ad alto margine che giustificano le attuali previsioni di capex verranno arbitrati via, colpendo i multipli NVDA anche se la domanda di addestramento rimarrà stabile per un altro anno. I verticali regolamentati non compenseranno lo spostamento di volume.
"I costi di cambio si erodono in modo non lineare una volta che un'alternativa valida raggiunge un'adozione del 30%+. La tempistica IPO di OpenAI potrebbe non sopravvivere a quell'inflessione."
Claude e ChatGPT presumono entrambi che i costi di cambio rimangano stabili, ma nessuno dei due affronta la *velocità* di tale erosione. Il modello advisor di Figma non è una nicchia — è una prova architetturale che le aziende possono ottimizzare i costi senza un "rip-and-replace". Se l'adozione accelera al 30-40% dei carichi di lavoro entro 18 mesi, i costi di cambio crollano più velocemente di quanto il potere di determinazione dei prezzi possa adattarsi. Il vero rischio non è la concorrenza; è la velocità della compressione dei margini che supera la capacità di OpenAI di diversificare i ricavi prima della scadenza del blocco IPO.
"I requisiti di conformità geopolitica imporranno una biforcazione del mercato che proteggerà i margini dei modelli frontier occidentali nonostante la concorrenza sui prezzi di inferenza."
Claude, ti stai perdendo il rischio geopolitico. La "Linux-ification" tramite DeepSeek non riguarda solo il prezzo; è una "sovereign compute play". Se il 60% del routing open-source si sposta verso modelli cinesi, le aziende statunitensi affrontano enormi ostacoli normativi e di sovranità dei dati che OpenAI/Anthropic sfrutteranno. Il "modello advisor" crea effettivamente un mercato biforcato: i compiti a basso rischio vanno a modelli economici, potenzialmente compromessi, mentre i flussi di lavoro aziendali ad alto rischio e regolamentati diventano un moat protetto e ad alto margine per i laboratori frontier occidentali. Il rischio di valutazione non è la commoditizzazione; è la riduzione del mercato totale indirizzabile a causa della conformità.
"Le implementazioni dual-stack preservano la domanda di inferenza e il capex di NVDA, minando l'idea che la sola erosione dei prezzi farà crollare i ricavi frontier."
La critica di Claude sulla velocità di erosione non coglie il paradosso hardware: le aziende implementeranno stack duali — modelli economici per compiti di routine e modelli frontier per flussi di lavoro ad alto rischio. Ciò preserva una domanda di inferenza sostanziale e mantiene vivo il capex di NVDA, anche se i frontier si commoditizzano. Il vero rischio non è un crollo netto dei prezzi, ma una rapida riarchitettura che comprime le finestre ARR premium per i laboratori frontier, sostenendo al contempo un rialzo guidato dall'hardware per ora.
Il panel concorda in gran parte sul fatto che la commoditizzazione degli LLM sta accelerando, rappresentando una minaccia significativa per le alte valutazioni di OpenAI e Anthropic. Tuttavia, c'è disaccordo sulla tempistica e sull'entità di questo impatto, con alcuni panelist che sostengono che i costi di cambio delle aziende e gli effetti di piattaforma di OpenAI potrebbero attutire il colpo nel breve termine.
Il potenziale dei laboratori frontier di sfruttare le preoccupazioni normative e di sovranità dei dati, creando un mercato biforcato con flussi di lavoro aziendali ad alto rischio e regolamentati come un moat protetto e ad alto margine.
La rapida erosione del potere di determinazione dei prezzi e dei costi di cambio, potenzialmente superando la capacità di OpenAI di diversificare i ricavi prima della scadenza del blocco IPO.