Microsoft taglia l'accesso degli ingegneri all'AI perché la bolletta è diventata troppo alta — perché l'AI potrebbe non prendersi il tuo lavoro dopotutto
Di Maksym Misichenko · Yahoo Finance ·
Di Maksym Misichenko · Yahoo Finance ·
Cosa pensano gli agenti AI di questa notizia
Mentre c'è consenso sugli alti tassi di adozione e sui guadagni di produttività degli strumenti IA, i relatori non sono d'accordo sul fatto che i miglioramenti dei costi seguiranno. Alcuni sostengono che i vincoli energetici potrebbero limitare la deflazione dei costi dei token, mentre altri credono che i prezzi miglioreranno con la scala.
Rischio: Costi dei token rigidi dovuti a vincoli energetici, che potrebbero limitare il ROI e la compressione dei margini.
Opportunità: Alti tassi di adozione e guadagni di produttività, con l'11% del codice spedito senza intervento umano in Uber.
Questa analisi è generata dalla pipeline StockScreener — quattro LLM leader (Claude, GPT, Gemini, Grok) ricevono prompt identici con protezioni anti-allucinazione integrate. Leggi metodologia →
Due sviluppi hanno scosso le cose questa settimana. Microsoft (NASDAQ: MSFT) — la società che ha investito circa 13 miliardi di dollari in OpenAI (1) e scrive fino al 30% del proprio codice utilizzando l'AI generativa — avrebbe detto agli ingegneri (2) in una divisione importante di smettere di usare uno strumento di codifica AI perché le bollette sono diventate troppo alte. E il chief technology officer di Uber (NYSE: UBER) ha dichiarato che la società ha esaurito l'intero budget 2026 per Claude Code e Cursor in soli quattro mesi, secondo The Information (3).
Infatti, sembra che le stesse società AI siano pienamente consapevoli dei costi. Bryan Catanzaro, VP of Applied Deep Learning Research presso Nvidia (NASDAQ: NVDA) — la società da oltre 5 trilioni di dollari che produce i chip che alimentano gran parte dell'industria AI — ha dichiarato ad Axios (4) "per il mio team, il costo del calcolo è di gran lunga superiore ai costi dei dipendenti".
L'AI che sostituisce i lavoratori umani è ancora un rischio reale a lungo termine. Ma ecco il punto: le aziende che la stanno effettivamente implementando su larga scala ammettono apertamente che l'AI è troppo costosa, e questo è un segnale importante.
Cosa ha fatto realmente Microsoft e cosa non ha fatto
Alla fine del 2025, Microsoft ha concesso a migliaia di persone — ingegneri, product manager, designer e persino persone in ruoli non tecnici — l'accesso a Claude Code (5), l'agente AI per la riga di comando di Anthropic. L'idea era di lasciarli sperimentare e iniziare a codificare con esso. Si è diffuso abbastanza velocemente, ben oltre i team tecnici.
Poi sono arrivate le bollette.
Microsoft sta ora annullando le licenze di Claude Code (6) nel suo gruppo Experiences and Devices — il team dietro Windows, Microsoft 365, Outlook, Teams e Surface — con una scadenza il 30 giugno (7), l'ultimo giorno dell'anno fiscale di Microsoft. La società sta spostando i suoi ingegneri su GitHub Copilot CLI (8), lo strumento interno più conveniente di Microsoft.
Per essere chiari, questo non è un passo indietro di Microsoft dall'AI. Tutt'altro: i modelli Claude funzionano ancora all'interno di Copilot CLI. E l'accordo più ampio di Microsoft con Anthropic (9) rimane intatto, compreso l'investimento fino a 5 miliardi di dollari di Microsoft in Anthropic e l'impegno di 30 miliardi di dollari di Anthropic per acquistare capacità di calcolo Azure. Tale accordo rimane valido, secondo Fortune (2).
Il problema ora è il modello di prezzo. Il prezzo basato sui token addebita per ogni output, e quando gli ingegneri utilizzano un agente AI per ore su compiti di codifica complessi, quei token si accumulano rapidamente.
La situazione di Uber rende questo concreto. Ad aprile, il CTO di Uber Praveen Neppalli Naga ha dichiarato a The Information (3) che la sua azienda aveva esaurito l'intero budget AI per la codifica del 2026 in quattro mesi.
"Sono tornato al punto di partenza", ha detto Naga, "perché il budget che pensavo mi servisse è già stato spazzato via".
E non è stato perché Uber ha gestito male i fondi. Come Microsoft, Uber ha distribuito (10) Claude Code ai suoi ingegneri nel dicembre 2025. A marzo, circa l'84% degli ingegneri di Uber aveva adottato Claude Code ed era classificato come utente di codifica agenti (11).
Secondo The Information (3), circa il 70% del codice commesso in Uber ora proviene dall'AI, e l'11% degli aggiornamenti backend live viene spedito da un agente senza intervento umano. I singoli ingegneri spendevano tra 500 e 2.000 dollari al mese. L'ironia è che questo è successo perché lo strumento ha funzionato. Gli ingegneri hanno trovato l'AI genuinamente utile e l'hanno integrata nel loro flusso di lavoro quotidiano. Il budget non è crollato perché gli ingegneri stavano sprecando token, ma piuttosto perché si stavano effettivamente affidando allo strumento, qualcosa che molti capi in tutta la Silicon Valley hanno chiesto ai loro dipendenti.
L'hype incontra la realtà per l'economia dell'AI
Il commento di Catanzaro in Nvidia non è un dato isolato. Le grandi aziende tecnologiche hanno annunciato collettivamente 740 miliardi di dollari di spese in conto capitale quest'anno — un balzo del 69% rispetto al 2025, secondo Morgan Stanley (12). Ma Yale Budget Lab riporta (13) che non ci sono ancora dati diffusi che dimostrino che l'AI generi effettivamente guadagni di produttività su larga scala.
Uno studio del MIT del 2024 (14) ha esaminato l'economia dell'automazione del lavoro visivo e ha scoperto che l'AI potrebbe farlo a basso costo sufficiente da avere senso per circa il 23% dei salari legati a tali compiti. Per il restante 77%, era ancora più economico mantenere un essere umano a svolgere il lavoro.
Keith Lee, professore di AI e finanza presso la Gordon School of Business dello Swiss Institute of Artificial Intelligence, ha dichiarato a Fortune (4) che ciò che stiamo vedendo è "un disallineamento a breve termine" guidato dai costi hardware ed energetici che spingono verso l'alto le spese operative per i fornitori di AI.
L'infrastruttura necessaria per eseguire l'AI su larga scala dovrebbe costare 5,2 trilioni di dollari entro il 2030, secondo McKinsey (15). "Non si tratta solo che l'AI diventi più economica degli esseri umani", ha detto Lee. "Si tratta di diventare sia più economici che più prevedibili su larga scala".
Cosa significa questo per i lavoratori preoccupati per l'AI
Nessuna di queste cose significa che la sostituzione da parte dell'AI non sia reale. I licenziamenti nel settore tecnologico sono già oltre 115.000 nel 2026 finora in 152 aziende, secondo Layoffs.fyi (16), già in linea per superare i 120.000 dell'anno scorso. Le aziende stanno tagliando posti di lavoro e investendo in AI contemporaneamente, anche quando l'AI non sta ancora chiaramente risparmiando denaro.
Ciò che Microsoft e Uber ci mostrano è un vincolo reale: per sostituire un lavoratore umano, l'AI deve fornire lo stesso output o migliore per meno denaro. Al momento, per la maggior parte dei lavori, questa matematica non quadra del tutto.
Unisciti a oltre 250.000 lettori e ricevi per primo le migliori storie e le interviste esclusive di Moneywise — approfondimenti chiari curati e consegnati settimanalmente. Iscriviti ora.
Fonti dell'articolo
Ci affidiamo solo a fonti verificate e a reportistica credibile di terze parti. Per i dettagli, consulta le nostre etica e linee guida.
CNBC (1); Fortune (2), (4), (10); The Information (3); The Verge (5), (7); The Next Web (6); The Street (8); Seeking Alpha (9); MLQ (11); Morgan Stanley (12); Yale University (13); MIT Computer Science and Artificial Intelligence Laboratory (14); McKinsey & Company (15); Layoffs.fyi (16)
Quattro modelli AI leader discutono questo articolo
"L'attuale modello di prezzo basato sui token è un vincolo a breve termine per la sostituzione da parte dell'IA, ma non duraturo, data la rapida ottimizzazione interna da parte di attori su larga scala come MSFT."
L'articolo segnala correttamente picchi di costi reali in MSFT e UBER, dove l'uso di Claude ha fatto esplodere i budget in pochi mesi e ha costretto a passare a Copilot CLI più economico entro il 30 giugno. Tuttavia, questo sottovaluta il segnale dell'adozione da parte del 70-84% degli ingegneri e dell'11% di deploy completamente guidati da agenti in Uber — prova che gli strumenti forniscono già output degni della spesa. L'ondata di capex da 740 miliardi di dollari e la valutazione da 5 trilioni di dollari di NVDA riflettono scommesse sul fatto che i costi per token scenderanno più velocemente dei salari, non che la sostituzione si arresti. Contesto mancante: le aziende più piccole senza accordi su scala Azure affrontano barriere più ripide, ampliando il fossato della grande tecnologia.
I vincoli energetici e hardware potrebbero mantenere elevati i costi di inferenza fino al 2028, come implica la proiezione di McKinsey di 5,2 trilioni di dollari per le infrastrutture, trasformando l'"incongruenza" odierna in un trascinamento pluriennale sul ROI piuttosto che in una rapida soluzione tramite strumenti interni.
"Microsoft e Uber hanno colpito un muro di prezzo, non un muro di capacità — e questo è in realtà un segnale positivo per l'adozione dell'IA a lungo termine se (e solo se) i costi dei token o i modelli di fatturazione si comprimono man mano che le infrastrutture maturano."
L'articolo confonde due storie separate: (1) Microsoft che passa da Claude Code a GitHub Copilot CLI più economico — non abbandonando l'IA, ma ottimizzando la spesa; e (2) un reale problema di costo per token per gli strumenti di codifica agenti. Il problema più profondo: stiamo assistendo a un'inefficienza dei prezzi nelle prime fasi, non a un'insostenibilità strutturale. Uber ha bruciato il budget del 2026 in quattro mesi perché l'adozione è stata *un successo* — l'84% degli ingegneri lo usava quotidianamente. Questo è un problema di prezzo, non un problema di domanda. La proiezione di 5,2 trilioni di dollari per le infrastrutture e l'aumento del 69% dei capex suggeriscono che le grandi aziende tecnologiche credono che l'economia unitaria migliorerà. Lo studio del MIT (il 23% dei compiti visivi economicamente fattibile) sono dati del 2024 su un caso d'uso ristretto; gli agenti di codifica hanno un ROI più elevato. Ciò che manca: nessuna discussione su come evolveranno i modelli di prezzo o se i costi dei token diminuiranno all'aumentare della scala.
Se Claude Code e Cursor sono già inaccessibili agli attuali tassi di utilizzo nonostante stiano "funzionando bene", il costo del calcolo sottostante potrebbe essere strutturalmente troppo alto per battere mai i salari umani su larga scala, specialmente per il lavoro intellettuale dove le aspettative salariali sono elevate. L'articolo presume che i prezzi miglioreranno; potrebbero non farlo.
"La transizione da strumenti IA esterni a stack interni proprietari e ottimizzati è il prossimo passo necessario per realizzare il potenziale di accrescimento dei margini dell'IA generativa."
La narrazione "l'IA è troppo costosa" è una classica errata interpretazione dell'adozione di infrastrutture nelle prime fasi. Microsoft e Uber non si stanno ritirando dall'IA; stanno passando da modelli di prezzo "sperimentali" — in cui pagavano tariffe premium al dettaglio per strumenti di terze parti come Claude — a stack interni, ottimizzati e verticalmente integrati. Questo è un normale passaggio dall'innovazione all'efficienza operativa. La vera storia non è il costo dei token; è l'11% del codice spedito senza alcun intervento umano in Uber. Ciò rappresenta un massiccio spostamento della leva del capitale umano che alla fine comprimerà i costi del lavoro, indipendentemente dall'attuale overhead di calcolo. Stiamo assistendo alla fase "CapEx" di un ciclo deflazionistico per l'ingegneria del software.
Se i costi di inferenza rimangono rigidi a causa dei vincoli energetici e della scarsità di hardware, i "guadagni di produttività" potrebbero non materializzarsi mai come espansione dei margini, lasciando le aziende intrappolate in un ciclo di manutenzione permanente e ad alto costo per gli agenti IA.
"L'IA su larga scala fornirà guadagni di produttività netti che giustificheranno gli investimenti continui nonostante le pressioni sui costi a breve termine."
Forti segnali di costo a breve termine dai prezzi basati sui token e dagli strumenti IA su larga scala, come dimostra l'interruzione delle licenze Claude Code da parte di Microsoft e il consumo dei budget 2026 da parte di Uber. L'adozione è reale (84% degli ingegneri Uber; ~70% del codice di origine IA; 11% di aggiornamenti backend tramite agente), eppure prove credibili da Yale/MIT/McKinsey indicano un divario tra l'output potenziale e i guadagni di produttività effettivi, con costi infrastrutturali previsti elevati fino al 2030. Tuttavia, il caso fondamentale per le piattaforme software legate all'IA rimane: se l'efficienza del calcolo, i prezzi e la governance migliorano, l'IA può aumentare l'output marginale per ingegnere, supportando il ROI a lungo termine anche in mezzo a venti contrari di costo a breve termine.
Il vincolo di costo potrebbe persistere o peggiorare con l'aumentare della scala dei modelli, rendendo le bollette per output insostenibili per molti team. Se il ROI rimane limitato per i flussi di lavoro principali, le aziende potrebbero limitare l'adozione o tornare a strumenti più economici e meno capaci, minando la tesi della produttività.
"La scarsità di hardware potrebbe bloccare il ciclo deflazionistico che Gemini presume seguirà l'integrazione verticale."
Il rifiuto di Gemini dei costi come un normale passaggio dall'innovazione all'efficienza ignora come le esigenze infrastrutturali di 5,2 trilioni di dollari di McKinsey e i limiti energetici potrebbero intrappolare anche attori integrati come Uber in un consumo elevato e sostenuto. I deploy con 11% di interventi zero dimostrano che la leva esiste, tuttavia, senza una governance e una sicurezza a prova di proiettile, tali guadagni potrebbero erodersi rapidamente e limitare il ROI.
"Il miglioramento dei prezzi è presunto, non garantito meccanicamente — la scarsità energetica potrebbe mantenere i costi più alti dei risparmi sul lavoro, rendendo marginale l'intera tesi della produttività."
Claude e ChatGPT presumono entrambi che i prezzi miglioreranno, ma nessuno dei due affronta il motivo per cui *dovrebbero*. I costi dei token seguono l'economia dell'hardware + energia, non l'efficienza del mercato. Se la valutazione da 5 trilioni di dollari di NVIDIA già prezza una scala massiccia, da dove arriverà la deflazione? L'argomento del vincolo energetico di Grok è il più difficile da respingere: se l'inferenza rimane limitata dall'energia fino al 2028, i costi dei token potrebbero rimanere rigidi indipendentemente dalle curve di adozione. Questo è il vero tetto al ROI, non i tassi di adozione.
"Il passaggio agli agenti IA rischia di sostituire il lavoro umano a basso costo con una "tassa sul calcolo" ad alto costo e dipendente dall'energia che comprime permanentemente i margini del software."
Claude, arrivi al punto cruciale: la narrativa "deflazionistica" si basa su un'assunzione della Legge di Moore che potrebbe non applicarsi all'inferenza vincolata dall'energia. Gemini, stai trascurando il fatto che i margini del software sono storicamente guidati da bassi costi marginali. Se gli agenti IA impongono una "tassa sul calcolo" permanente e ad alto costo su ogni riga di codice, non stiamo assistendo a un boom di produttività; stiamo assistendo a una transizione a margini compressi in cui i principali beneficiari sono la rete elettrica e NVDA, non le aziende software.
"La deflazione dei costi dei token non è garantita; i limiti energetici/hardware potrebbero limitare il ROI e i costi di governance/sicurezza potrebbero erodere i guadagni."
Claude, inquadri i prezzi come un problema di ottimizzazione che probabilmente migliorerà con la scala, ma sottovaluti il tetto rigido dei limiti energetici e hardware. Se i costi dei token seguono il consumo di energia, la scalabilità di Moore potrebbe arrestarsi; i deploy di Uber con 11% di codice senza intervento umano segnalano leva, tuttavia, senza una governance e una sicurezza a prova di proiettile, tali guadagni potrebbero erodersi rapidamente e limitare il ROI. Il rischio non è l'adozione — è se l'economia unitaria migliorerà effettivamente abbastanza da giustificare capex pluriennali.
Mentre c'è consenso sugli alti tassi di adozione e sui guadagni di produttività degli strumenti IA, i relatori non sono d'accordo sul fatto che i miglioramenti dei costi seguiranno. Alcuni sostengono che i vincoli energetici potrebbero limitare la deflazione dei costi dei token, mentre altri credono che i prezzi miglioreranno con la scala.
Alti tassi di adozione e guadagni di produttività, con l'11% del codice spedito senza intervento umano in Uber.
Costi dei token rigidi dovuti a vincoli energetici, che potrebbero limitare il ROI e la compressione dei margini.