Microsoft recortó el uso de IA a sus ingenieros porque la factura se volvió demasiado grande: por qué la IA podría no quitarle el trabajo después de todo
Por Maksym Misichenko · Yahoo Finance ·
Por Maksym Misichenko · Yahoo Finance ·
Lo que los agentes de IA piensan sobre esta noticia
Si bien hay consenso sobre altas tasas de adopción y ganancias de productividad de las herramientas de IA, los panelistas discrepan sobre si seguirán las mejoras de costos. Algunos argumentan que las restricciones de energía pueden limitar la deflación de los costos de los tokens, mientras que otros creen que los precios mejorarán con la escala.
Riesgo: Costos de tokens fijos debido a restricciones de energía, lo que podría limitar el ROI y la compresión de márgenes.
Oportunidad: Altas tasas de adopción y ganancias de productividad, con el 11% del código enviado sin intervención humana en Uber.
Este análisis es generado por el pipeline StockScreener — cuatro LLM líderes (Claude, GPT, Gemini, Grok) reciben prompts idénticos con protecciones anti-alucinación integradas. Leer metodología →
Dos desarrollos sacudieron las cosas esta semana. Microsoft (NASDAQ: MSFT), la empresa que invirtió alrededor de $13 mil millones en OpenAI (1) y escribe hasta el 30% de su propio código utilizando IA generativa, supuestamente dijo a los ingenieros (2) en una división importante que dejaran de usar una herramienta de codificación de IA porque las facturas se volvieron demasiado grandes. Y el director de tecnología de Uber (NYSE: UBER) dijo que la empresa agotó su presupuesto completo de 2026 para Claude Code y Cursor en solo cuatro meses, según The Information (3).
Efectivamente, parece que las propias empresas de IA son plenamente conscientes de los costos. Bryan Catanzaro, vicepresidente de Investigación de Aprendizaje Profundo Aplicado en Nvidia (NASDAQ: NVDA), la empresa de más de $5 billones que fabrica los chips que impulsan gran parte de la industria de la IA, dijo a Axios (4) que "para mi equipo, el costo de la computación está muy por encima de los costos de los empleados".
El reemplazo de trabajadores humanos por IA sigue siendo un riesgo real a largo plazo. Pero he aquí el quid de la cuestión: las empresas que realmente la están implementando a escala admiten abiertamente que la IA es demasiado cara, y esa es una señal importante.
Lo que Microsoft hizo realmente, y lo que no
A fines de 2025, Microsoft dio acceso a Claude Code (5), el agente de codificación de IA de línea de comandos de Anthropic, a miles de sus empleados: ingenieros, gerentes de producto, diseñadores e incluso personas en roles no técnicos. La idea era permitirles experimentar y comenzar a codificar con él. Se extendió bastante rápido, mucho más allá de los equipos técnicos.
Luego llegaron las facturas.
Microsoft ahora está cancelando las licencias de Claude Code (6) en su grupo de Experiencias y Dispositivos, el equipo detrás de Windows, Microsoft 365, Outlook, Teams y Surface, con fecha límite del 30 de junio (7), el último día del año fiscal de Microsoft. La empresa está migrando a sus ingenieros a GitHub Copilot CLI (8), la herramienta interna más asequible de Microsoft.
Para que quede claro, esto no significa que Microsoft esté dando un paso atrás en la IA. Ni mucho menos: los modelos de Claude todavía funcionan dentro de Copilot CLI. Y el acuerdo más amplio de Microsoft con Anthropic (9) no se ve afectado, incluida la inversión de hasta $5 mil millones de Microsoft en Anthropic y el compromiso de Anthropic de comprar capacidad de cómputo de Azure por $30 mil millones. Ese acuerdo se mantiene, según Fortune (2).
El problema ahora es el modelo de precios. Los precios basados en tokens cobran por salida, y cuando los ingenieros usan un agente de IA durante horas en tareas de codificación complejas, esos tokens se acumulan rápidamente.
La situación de Uber lo concreta. En abril, el director de tecnología de Uber, Praveen Neppalli Naga, dijo a The Information (3) que su empresa había agotado su presupuesto completo de codificación de IA para 2026 en cuatro meses.
"Estoy de vuelta en el tablero de dibujo", dijo Naga, "porque el presupuesto que pensé que necesitaría ya se ha agotado".
Y no fue porque Uber administrara mal los fondos. Al igual que Microsoft, Uber implementó (10) Claude Code para sus ingenieros en diciembre de 2025. Para marzo, aproximadamente el 84% de los ingenieros de Uber habían adoptado Claude Code y se clasificaron como usuarios de codificación de agentes (11).
Según The Information (3), alrededor del 70% del código confirmado en Uber ahora se origina con IA, y el 11% de las actualizaciones del backend se envían mediante un agente sin intervención humana. Los ingenieros individuales gastaban entre $500 y $2,000 por mes. La ironía es que esto sucedió porque la herramienta funcionó. Los ingenieros encontraron que la IA era genuinamente útil y la convirtieron en parte de su flujo de trabajo diario. El presupuesto no colapsó porque los ingenieros estuvieran desperdiciando tokens, sino porque realmente estaban confiando en la herramienta, algo que muchos jefes en Silicon Valley habían estado exigiendo a sus empleados.
El bombo publicitario se encuentra con la realidad de la economía de la IA
El comentario de Catanzaro en Nvidia no es un dato aislado. Las grandes empresas tecnológicas han anunciado colectivamente $740 mil millones en gastos de capital este año, lo que representa un aumento del 69% con respecto a 2025, según Morgan Stanley (12). Pero Yale Budget Lab informa (13) que todavía no hay datos generalizados que demuestren que la IA realmente impulse las ganancias de productividad a escala.
Un estudio del MIT de 2024 (14) analizó la economía de la automatización del trabajo relacionado con la visión y encontró que la IA podría hacerlo lo suficientemente barato como para tener sentido para aproximadamente el 23% de los salarios asociados con esas tareas. Para el 77% restante, todavía era más barato que un humano realizara el trabajo.
Keith Lee, profesor de IA y finanzas en la Gordon School of Business del Instituto Suizo de Inteligencia Artificial, dijo a Fortune (4) que lo que estamos viendo es "una desalineación a corto plazo" impulsada por los costos de hardware y energía que aumentan los gastos operativos para los proveedores de IA.
Se proyecta que la infraestructura necesaria para ejecutar IA a escala costará $5.2 billones para 2030, según McKinsey (15). "No se trata solo de que la IA sea más barata que los humanos", dijo Lee. "Se trata de ser más barato y más predecible a escala".
Lo que esto significa para los trabajadores preocupados por la IA
Nada de esto significa que el desplazamiento por IA no sea real. Los despidos en tecnología ya superan los 115,000 en 2026 hasta ahora en 152 empresas, según Layoffs.fyi (16), y ya van camino de superar los 120,000 del año pasado. Las empresas están recortando empleos e invirtiendo en IA al mismo tiempo, incluso cuando la IA aún no está ahorrando dinero claramente.
Lo que Microsoft y Uber nos muestran es una restricción real: para reemplazar a un trabajador humano, la IA tiene que ofrecer el mismo o mejor resultado por menos dinero. En este momento, para la mayoría de los trabajos, las matemáticas no cuadran.
Únase a más de 250,000 lectores y reciba primero las mejores historias y entrevistas exclusivas de Moneywise: ideas claras seleccionadas y entregadas semanalmente. Suscríbase ahora.
Fuentes del artículo
Nos basamos únicamente en fuentes verificadas y reportajes creíbles de terceros. Para obtener detalles, consulte nuestra ética y directrices.
CNBC (1); Fortune (2), (4), (10); The Information (3); The Verge (5), (7); The Next Web (6); The Street (8); Seeking Alpha (9); MLQ (11); Morgan Stanley (12); Universidad de Yale (13); Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (14); McKinsey & Company (15); Layoffs.fyi (16)
Cuatro modelos AI líderes discuten este artículo
"El precio actual por token es una restricción a corto plazo para el desplazamiento por IA, pero no una duradera, dada la rápida optimización interna en jugadores a escala como MSFT."
El artículo señala correctamente picos de costos reales en MSFT y UBER, donde el uso de Claude agotó los presupuestos en meses y obligó a cambiar a Copilot CLI más barato antes del 30 de junio. Sin embargo, esto subestima la señal de adopción del 70-84% de ingenieros y el 11% de implementaciones totalmente impulsadas por agentes en Uber, prueba de que las herramientas ya entregan resultados que valen el gasto. La ola de gastos de capital de 740.000 millones de dólares y la valoración de 5 billones de dólares de NVDA reflejan apuestas de que los costos por token caerán más rápido que los salarios, no que el desplazamiento se detenga. Falta contexto: las empresas más pequeñas sin acuerdos a escala de Azure enfrentan barreras más altas, ampliando el foso de las grandes tecnológicas.
Las restricciones de energía y hardware podrían mantener elevados los costos de inferencia hasta 2028, como implica la proyección de infraestructura de 5,2 billones de dólares de McKinsey, convirtiendo el 'desajuste' actual en un lastre de varios años para el ROI en lugar de una solución rápida a través de herramientas internas.
"Microsoft y Uber se toparon con un muro de precios, no con un muro de capacidades, y eso es realmente alcista para la adopción de IA a largo plazo si (y solo si) los costos de los tokens o los modelos de facturación se comprimen a medida que la infraestructura madura."
El artículo confunde dos historias separadas: (1) Microsoft cambiando de Claude Code a Copilot CLI más barato, no abandonando la IA, sino optimizando el gasto; y (2) un problema real de costo por token para las herramientas de codificación de agentes. El problema más profundo: estamos viendo ineficiencias de precios en etapas tempranas, no inviabilidad estructural. Uber agotó el presupuesto de 2026 en cuatro meses porque la adopción fue *exitosa*: el 84% de los ingenieros lo usaban a diario. Eso es un problema de precios, no un problema de demanda. La proyección de infraestructura de 5,2 billones de dólares y el aumento del 69% en gastos de capital sugieren que las grandes tecnológicas creen que la economía unitaria mejorará. El estudio del MIT (23% de tareas de visión económicamente viables) son datos de 2024 sobre un caso de uso estrecho; los agentes de codificación tienen un ROI más alto. Lo que falta: ninguna discusión sobre cómo evolucionarán los modelos de precios o si los costos de los tokens disminuirán a medida que aumente la escala.
Si Claude Code y Cursor ya son inasequibles a las tasas de uso actuales a pesar de estar 'funcionando bien', el costo de cómputo subyacente puede ser estructuralmente demasiado alto para socavar los salarios humanos a escala, especialmente para el trabajo del conocimiento donde las expectativas salariales son altas. El artículo asume que los precios mejorarán; puede que no sea así.
"La transición de herramientas de IA externas a pilas internas propietarias y optimizadas es el próximo paso necesario para realizar el potencial de la IA generativa que aumenta los márgenes."
La narrativa de que 'la IA es demasiado cara' es una lectura errónea clásica de la adopción de infraestructura en etapas tempranas. Microsoft y Uber no se están retirando de la IA; están pasando de modelos de precios 'experimentales', donde pagaban tarifas minoristas premium por herramientas de terceros como Claude, a pilas internas, optimizadas y verticalmente integradas. Este es un cambio estándar de la innovación a la eficiencia operativa. La verdadera historia no es el costo de los tokens; es el 11% del código enviado sin intervención humana en Uber. Eso representa un cambio masivo en el apalancamiento del capital humano que eventualmente comprimirá los costos laborales, independientemente de los gastos generales de cómputo actuales. Estamos viendo la fase de 'gastos de capital' de un ciclo deflacionario para la ingeniería de software.
Si los costos de inferencia se mantienen elevados debido a las restricciones de energía y la escasez de hardware, las 'ganancias de productividad' podrían nunca materializarse como expansión de márgenes, dejando a las empresas atrapadas en un ciclo de mantenimiento permanente y de alto costo para los agentes de IA.
"La IA a escala generará ganancias de productividad neta que justificarán la inversión continua a pesar de las presiones de costos a corto plazo."
Fuertes señales de costos a corto plazo de los precios basados en tokens y las herramientas de IA a gran escala, como ilustran la suspensión de licencias de Claude Code por parte de Microsoft y el agotamiento de los presupuestos de 2026 por parte de Uber. La adopción es real (84% de ingenieros de Uber; ~70% de código de origen de IA; 11% de actualizaciones de backend por agente), sin embargo, la evidencia creíble de Yale/MIT/McKinsey apunta a una brecha entre la producción potencial y las ganancias de productividad reales, con costos de infraestructura proyectados altos hasta 2030. Aun así, el caso central para las plataformas de software vinculadas a la IA se mantiene: si la eficiencia de cómputo, los precios y la gobernanza mejoran, la IA puede aumentar la producción marginal por ingeniero, respaldando el ROI a más largo plazo incluso en medio de vientos en contra de costos a corto plazo.
La restricción de costos podría persistir o empeorar a medida que los modelos escalan, haciendo que las facturas por salida sean insostenibles para muchos equipos. Si el ROI sigue siendo limitado para los flujos de trabajo principales, las empresas pueden limitar la adopción o recurrir a herramientas más baratas y menos capaces, socavando la tesis de productividad.
"La escasez de hardware puede bloquear el ciclo deflacionario que Gemini asume que seguirá a la integración vertical."
El descarte de Gemini de los costos como un cambio estándar de innovación a eficiencia ignora cómo las necesidades de infraestructura de 5,2 billones de dólares de McKinsey y los límites de energía podrían atrapar incluso a jugadores integrados como Uber en un alto gasto sostenido. Los despliegues del 11% sin intervención humana demuestran que existe apalancamiento, sin embargo, sin una deflación de tokens más rápida de lo proyectado, la compresión laboral se limitará a los hiperescaladores en lugar de a los márgenes de software amplios.
"La mejora de los precios se asume, no se garantiza mecánicamente: la escasez de energía podría mantener los costos más altos que los ahorros laborales, haciendo que toda la tesis de productividad sea marginal."
Claude y ChatGPT asumen que los precios mejorarán, pero ninguno aborda por qué *deberían* hacerlo. Los costos de los tokens siguen la economía del hardware + energía, no la eficiencia del mercado. Si la valoración de 5 billones de dólares de NVIDIA ya incluye una escala masiva, ¿de dónde vendrá la deflación? El argumento de la restricción energética de Grok es el más difícil de descartar: si la inferencia sigue limitada por la potencia hasta 2028, los costos de los tokens pueden mantenerse fijos independientemente de las curvas de adopción. Ese es el verdadero techo del ROI, no las tasas de adopción.
"El cambio a agentes de IA corre el riesgo de reemplazar la mano de obra humana de bajo costo con un 'impuesto de cómputo' de alto costo y dependiente de la energía que comprime permanentemente los márgenes de software."
Claude, llegas al quid de la cuestión: la narrativa 'deflacionaria' se basa en una suposición de Ley de Moore que puede no aplicarse a la inferencia con restricciones de energía. Gemini, pasas por alto el hecho de que los márgenes de software históricamente se basan en bajos costos marginales. Si los agentes de IA fuerzan un 'impuesto de cómputo' permanente y de alto costo en cada línea de código, no estamos ante un auge de productividad; estamos ante una transición con márgenes comprimidos donde los principales beneficiarios son la red eléctrica y NVDA, no las empresas de software.
"La deflación de los costos de los tokens no está garantizada; los límites de energía/hardware pueden limitar el ROI y los costos de gobernanza/seguridad pueden erosionar las ganancias."
Claude, planteas los precios como un problema de optimización que probablemente mejorará con la escala, pero minimizas el techo duro de los límites de energía y hardware. Si los costos de los tokens siguen el consumo de energía, la escala de Moore puede estancarse; los despliegues de código sin humanos del 11% de Uber señalan apalancamiento, sin embargo, sin una gobernanza y seguridad herméticas, esas ganancias pueden erosionarse rápidamente y limitar el ROI. El riesgo no es la adopción, sino si la economía unitaria realmente mejora lo suficiente como para justificar gastos de capital de varios años.
Si bien hay consenso sobre altas tasas de adopción y ganancias de productividad de las herramientas de IA, los panelistas discrepan sobre si seguirán las mejoras de costos. Algunos argumentan que las restricciones de energía pueden limitar la deflación de los costos de los tokens, mientras que otros creen que los precios mejorarán con la escala.
Altas tasas de adopción y ganancias de productividad, con el 11% del código enviado sin intervención humana en Uber.
Costos de tokens fijos debido a restricciones de energía, lo que podría limitar el ROI y la compresión de márgenes.