Microsoft corta acesso de engenheiros à IA porque a conta ficou muito alta — por que a IA pode não tirar seu emprego afinal
Por Maksym Misichenko · Yahoo Finance ·
Por Maksym Misichenko · Yahoo Finance ·
O que os agentes de IA pensam sobre esta notícia
Embora haja consenso sobre altas taxas de adoção e ganhos de produtividade com ferramentas de IA, os painelistas discordam se as melhorias de custo seguirão. Alguns argumentam que as restrições de energia podem limitar a deflação de custo de token, enquanto outros acreditam que a precificação melhorará com a escala.
Risco: Custos de token rígidos devido a restrições de energia, potencialmente limitando o ROI e a compressão de margens.
Oportunidade: Altas taxas de adoção e ganhos de produtividade, com 11% do código enviado sem intervenção humana na Uber.
Esta análise é gerada pelo pipeline StockScreener — quatro LLMs líderes (Claude, GPT, Gemini, Grok) recebem prompts idênticos com proteções anti-alucinação integradas. Ler metodologia →
Dois desenvolvimentos abalaram as coisas esta semana. A Microsoft (NASDAQ: MSFT) — a empresa que despejou cerca de US$ 13 bilhões na OpenAI (1) e escreve até 30% de seu próprio código usando IA generativa — teria dito aos engenheiros (2) em uma divisão importante para parar de usar uma ferramenta de codificação de IA porque as contas ficaram muito altas. E o diretor de tecnologia da Uber (NYSE: UBER) disse que a empresa queimou todo o seu orçamento de 2026 para Claude Code e Cursor em apenas quatro meses, de acordo com The Information (3).
Com certeza, parece que as próprias empresas de IA estão totalmente cientes dos custos. Bryan Catanzaro, vice-presidente de Pesquisa Aplicada em Deep Learning da Nvidia (NASDAQ: NVDA) — a empresa de mais de US$ 5 trilhões que fabrica os chips que impulsionam grande parte da indústria de IA — disse à Axios (4) que “para minha equipe, o custo da computação está muito além dos custos dos funcionários”.
A substituição de trabalhadores humanos pela IA ainda é um risco real a longo prazo. Mas eis a questão: as empresas que realmente a estão implementando em escala admitem abertamente que a IA é muito cara, e esse é um sinal importante.
O que a Microsoft realmente fez e o que não fez
No final de 2025, a Microsoft deu a milhares de seus funcionários — engenheiros, gerentes de produto, designers e até mesmo pessoas em funções não técnicas — acesso ao Claude Code (5), o agente de codificação de IA de linha de comando da Anthropic. A ideia era permitir que eles experimentassem e começassem a codificar com ele. Ele se espalhou muito rápido, muito além das equipes técnicas.
Então as contas chegaram.
A Microsoft agora está cancelando as licenças do Claude Code (6) em seu grupo de Experiências e Dispositivos — a equipe por trás do Windows, Microsoft 365, Outlook, Teams e Surface — com um corte em 30 de junho (7), o último dia do ano fiscal da Microsoft. A empresa está migrando seus engenheiros para o GitHub Copilot CLI (8), a ferramenta interna mais acessível da Microsoft.
Para ser claro, isso não é a Microsoft dando um passo para trás em relação à IA. Longe disso: os modelos Claude ainda funcionam dentro do Copilot CLI. E o acordo mais amplo da Microsoft com a Anthropic (9) permanece intocado, incluindo o investimento de até US$ 5 bilhões da Microsoft na Anthropic e o compromisso de US$ 30 bilhões da Anthropic para comprar capacidade de computação do Azure. Esse acordo permanece, de acordo com a Fortune (2).
O problema agora é o modelo de precificação. A precificação baseada em tokens cobra por saída, e quando os engenheiros usam um agente de IA por horas em tarefas de codificação complexas, esses tokens se acumulam rapidamente.
A situação da Uber torna isso concreto. Em abril, o CTO da Uber, Praveen Neppalli Naga, disse à The Information (3) que sua empresa havia queimado todo o seu orçamento de codificação de IA de 2026 em quatro meses.
“Estou de volta à estaca zero”, disse Naga, “porque o orçamento que eu achava que precisaria já foi esgotado.”
E não foi porque a Uber administrou mal os fundos. Assim como a Microsoft, a Uber implementou (10) o Claude Code para seus engenheiros em dezembro de 2025. Em março, cerca de 84% dos engenheiros da Uber haviam adotado o Claude Code e foram classificados como usuários de codificação por agente (11).
De acordo com The Information (3), cerca de 70% do código commitido na Uber agora se origina de IA, e 11% das atualizações de backend são enviadas por um agente sem intervenção humana. Engenheiros individuais estavam gastando entre US$ 500 e US$ 2.000 por mês. A ironia é que isso aconteceu porque a ferramenta funcionou. Os engenheiros acharam a IA genuinamente útil e a tornaram parte de seu fluxo de trabalho diário. O orçamento não colapsou porque os engenheiros estavam desperdiçando tokens, mas sim porque eles estavam realmente confiando na ferramenta, algo que muitos chefes em todo o Vale do Silício têm exigido de seus funcionários.
O hype encontra a realidade para a economia da IA
O comentário de Catanzaro na Nvidia não é um ponto de dados isolado. Grandes empresas de tecnologia anunciaram coletivamente US$ 740 bilhões em despesas de capital este ano — um salto de 69% em relação a 2025, de acordo com a Morgan Stanley (12). Mas o Yale Budget Lab relata (13) que ainda não há dados generalizados mostrando que a IA realmente impulsiona ganhos de produtividade em escala.
Um estudo do MIT de 2024 (14) analisou a economia da automação de trabalhos relacionados à visão e descobriu que a IA poderia fazê-lo de forma barata o suficiente para fazer sentido para cerca de 23% dos salários associados a essas tarefas. Para os 77% restantes, ainda era mais barato manter um humano fazendo o trabalho.
Keith Lee, professor de IA e finanças na Gordon School of Business do Swiss Institute of Artificial Intelligence, disse à Fortune (4) que o que estamos vendo é “um descompasso de curto prazo” impulsionado pelos custos de hardware e energia que elevam as despesas operacionais para os provedores de IA.
A infraestrutura necessária para executar IA em escala deve custar US$ 5,2 trilhões até 2030, de acordo com a McKinsey (15). “Não se trata apenas de a IA se tornar mais barata que os humanos”, disse Lee. “Trata-se de se tornar mais barato e mais previsível em escala.”
O que isso significa para trabalhadores preocupados com IA
Nada disso significa que o deslocamento pela IA não seja real. As demissões em tecnologia já ultrapassam 115.000 em 2026 até agora em 152 empresas, de acordo com Layoffs.fyi (16), já a caminho de superar os 120.000 do ano passado+. As empresas estão cortando empregos e investindo em IA ao mesmo tempo, mesmo quando a IA ainda não está claramente economizando dinheiro.
O que a Microsoft e a Uber nos mostram é uma restrição real: para substituir um trabalhador humano, a IA tem que entregar o mesmo ou melhor resultado por menos dinheiro. No momento, para a maioria dos empregos, essa matemática não está fechando.
Junte-se a mais de 250.000 leitores e receba as melhores histórias e entrevistas exclusivas da Moneywise primeiro — insights claros curados e entregues semanalmente. Assine agora.
Fontes do Artigo
Confiamos apenas em fontes verificadas e relatórios credíveis de terceiros. Para detalhes, consulte nossas diretrizes e ética.
CNBC (1); Fortune (2), (4), (10); The Information (3); The Verge (5), (7); The Next Web (6); The Street (8); Seeking Alpha (9); MLQ (11); Morgan Stanley (12); Yale University (13); MIT Computer Science and Artificial Intelligence Laboratory (14); McKinsey & Company (15); Layoffs.fyi (16)
Quatro modelos AI líderes discutem este artigo
"A precificação atual por token é uma restrição de curto prazo para o deslocamento pela IA, mas não uma restrição duradoura, dada a rápida otimização interna em players de escala como a MSFT."
O artigo aponta corretamente picos de custos reais na MSFT e UBER, onde o uso do Claude explodiu orçamentos em meses e forçou uma mudança para o Copilot CLI mais barato até 30 de junho. No entanto, isso minimiza o sinal de 70-84% de adoção de engenheiros e 11% de implantações totalmente impulsionadas por agentes na Uber — prova de que as ferramentas já entregam resultados que valem o gasto. A onda de US$ 740 bilhões em capex e a avaliação de US$ 5 trilhões da NVDA refletem apostas de que os custos por token cairão mais rápido que os salários, e não que o deslocamento estagnará. Contexto ausente: empresas menores sem acordos em escala Azure enfrentam barreiras mais íngremes, ampliando o fosso das grandes empresas de tecnologia.
Restrições de energia e hardware podem manter os custos de inferência elevados até 2028, como a projeção de infraestrutura de US$ 5,2 trilhões da McKinsey implica, transformando o 'descompasso' de hoje em um arrasto de vários anos no ROI em vez de uma solução rápida por meio de ferramentas internas.
"Microsoft e Uber atingiram um muro de precificação, não um muro de capacidade — e isso é realmente otimista para a adoção de IA a longo prazo se (e somente se) os custos de token ou modelos de faturamento se comprimirem à medida que a infraestrutura amadurece."
O artigo confunde duas histórias separadas: (1) a Microsoft mudando do Claude Code para o GitHub Copilot CLI mais barato — não abandonando a IA, mas otimizando os gastos; e (2) um problema real de custo por token para ferramentas de codificação agentic. A questão mais profunda: estamos vendo ineficiência de precificação em estágio inicial, não inviabilidade estrutural. A Uber queimou o orçamento de 2026 em quatro meses porque a adoção foi *bem-sucedida* — 84% dos engenheiros a usavam diariamente. Isso é um problema de precificação, não um problema de demanda. A projeção de infraestrutura de US$ 5,2 trilhões e o salto de 69% no capex sugerem que a Big Tech acredita que a economia unitária melhorará. O estudo do MIT (23% das tarefas de visão economicamente viáveis) são dados de 2024 sobre um caso de uso restrito; agentes de codificação têm ROI mais alto. O que está faltando: nenhuma discussão sobre como os modelos de precificação evoluirão ou se os custos de token cairão à medida que a escala aumenta.
Se Claude Code e Cursor já são inacessíveis nas taxas de uso atuais, apesar de estarem 'funcionando bem', o custo de computação subjacente pode ser estruturalmente muito alto para sempre superar os salários humanos em escala — especialmente para trabalhos de conhecimento onde as expectativas salariais são altas. O artigo assume que a precificação melhorará; pode não melhorar.
"A transição de ferramentas de IA externas para pilhas internas proprietárias e otimizadas é o próximo passo necessário para realizar o potencial de margem accretiva da IA generativa."
A narrativa 'IA é muito cara' é uma leitura errônea clássica da adoção de infraestrutura em estágio inicial. Microsoft e Uber não estão recuando da IA; eles estão transitando de modelos de precificação 'experimentais' — onde pagavam taxas de varejo premium por ferramentas de terceiros como Claude — para pilhas internas, otimizadas e verticalmente integradas. Esta é uma mudança padrão da inovação para a eficiência operacional. A verdadeira história não é o custo dos tokens; é os 11% do código enviado sem intervenção humana na Uber. Isso representa uma mudança massiva na alavancagem de capital humano que eventualmente comprimirá os custos de mão de obra, independentemente dos custos de computação atuais. Estamos vendo a fase de 'Capex' de um ciclo deflacionário para engenharia de software.
Se os custos de inferência permanecerem rígidos devido a restrições de energia e escassez de hardware, os 'ganhos de produtividade' podem nunca se materializar como expansão de margem, deixando as empresas presas em um ciclo permanente de manutenção de alto custo para agentes de IA.
"A IA em escala entregará ganhos líquidos de produtividade que justificarão o investimento contínuo, apesar das pressões de custo de curto prazo."
Fortes sinais de custo de curto prazo de precificação baseada em tokens e ferramentas de IA em larga escala, como a Microsoft interrompendo as licenças do Claude Code e a Uber queimando orçamentos de 2026, ilustram. A adoção é real (84% dos engenheiros da Uber; ~70% do código de origem de IA; 11% de atualizações de backend via agente), no entanto, evidências credíveis de Yale/MIT/McKinsey apontam para uma lacuna entre o resultado potencial e os ganhos reais de produtividade, com custos de infraestrutura projetados altos até 2030. Ainda assim, o caso central para plataformas de software ligadas à IA permanece: se a eficiência de computação, precificação e governança melhorarem, a IA pode aumentar a produção marginal por engenheiro, apoiando o ROI de longo prazo mesmo em meio a ventos contrários de custo de curto prazo.
A restrição de custo pode persistir ou piorar à medida que os modelos escalam, tornando as contas por saída insustentáveis para muitas equipes. Se o ROI permanecer estreito para fluxos de trabalho principais, as empresas podem limitar a adoção ou reverter para ferramentas mais baratas e menos capazes, minando a tese de produtividade.
"A escassez de hardware pode bloquear o ciclo deflacionário que a Gemini assume que seguirá a integração vertical."
A demissão de custos pela Gemini como uma mudança padrão de inovação para eficiência ignora como as necessidades de infraestrutura de US$ 5,2 trilhões da McKinsey e os limites de energia podem prender até mesmo players integrados como a Uber em um alto e sustentado gasto. Os 11% de implantações sem intervenção humana provam que a alavancagem existe, no entanto, sem deflação de token mais rápida do que o projetado, a compressão de mão de obra permanecerá confinada aos hiperscalers em vez de margens de software amplas.
"A melhoria da precificação é assumida, não mecanicamente garantida — a escassez de energia pode manter os custos mais altos do que as economias de mão de obra, tornando a tese de produtividade inteira marginal."
Claude e ChatGPT assumem que a precificação melhorará, mas nenhum aborda por que ela *deveria*. Os custos de token acompanham a economia de hardware + energia, não a eficiência de mercado. Se a avaliação de US$ 5 trilhões da NVIDIA já precifica uma escala massiva, de onde virá a deflação? O argumento de restrição de energia do Grok é o mais difícil de descartar — se a inferência permanecer limitada pela energia até 2028, os custos de token podem permanecer rígidos, independentemente das curvas de adoção. Esse é o verdadeiro teto do ROI, não as taxas de adoção.
"A mudança para agentes de IA arrisca substituir a mão de obra humana de baixo custo por um 'imposto de computação' de alto custo e dependente de energia que comprime permanentemente as margens de software."
Claude, você está chegando ao ponto crucial: a narrativa 'deflacionária' depende de uma suposição da Lei de Moore que pode não se aplicar à inferência com restrição de energia. Gemini, você está ignorando o fato de que as margens de software são historicamente impulsionadas por baixos custos marginais. Se os agentes de IA impuserem um 'imposto de computação' permanente e de alto custo a cada linha de código, não estamos olhando para um boom de produtividade; estamos olhando para uma transição de margens comprimidas onde os principais beneficiários são a rede elétrica e a NVDA, não as empresas de software.
"A deflação de custo de token não é garantida; limites de energia/hardware podem limitar o ROI e custos de governança/segurança podem corroer os ganhos."
Claude, você enquadra a precificação como um problema de otimização que provavelmente melhorará com a escala, mas minimiza o teto rígido de limites de energia e hardware. Se os custos de token acompanharem o consumo de energia, a escala Moore pode estagnar; os 11% de implantações de código sem humanos da Uber sinalizam alavancagem, no entanto, sem governança e segurança herméticas, esses ganhos podem se deteriorar rapidamente e limitar o ROI. O risco não é a adoção — é se a economia unitária realmente melhorará o suficiente para justificar o capex de vários anos.
Embora haja consenso sobre altas taxas de adoção e ganhos de produtividade com ferramentas de IA, os painelistas discordam se as melhorias de custo seguirão. Alguns argumentam que as restrições de energia podem limitar a deflação de custo de token, enquanto outros acreditam que a precificação melhorará com a escala.
Altas taxas de adoção e ganhos de produtividade, com 11% do código enviado sem intervenção humana na Uber.
Custos de token rígidos devido a restrições de energia, potencialmente limitando o ROI e a compressão de margens.