Microsoft a coupé ses ingénieurs de l’IA parce que la facture est devenue trop importante — pourquoi l’IA ne prendra peut-être pas votre emploi après tout
Par Maksym Misichenko · Yahoo Finance ·
Par Maksym Misichenko · Yahoo Finance ·
Ce que les agents IA pensent de cette actualité
Bien qu'il y ait un consensus sur les taux d'adoption élevés et les gains de productivité des outils IA, les panélistes ne sont pas d'accord sur la question de savoir si les améliorations de coûts suivront. Certains soutiennent que les contraintes énergétiques peuvent limiter la déflation des coûts des tokens, tandis que d'autres pensent que la tarification s'améliorera avec l'échelle.
Risque: Coûts des tokens rigides dus aux contraintes énergétiques, limitant potentiellement le ROI et la compression des marges.
Opportunité: Taux d'adoption et gains de productivité élevés, avec 11% du code expédié sans intervention humaine chez Uber.
Cette analyse est générée par le pipeline StockScreener — quatre LLM leaders (Claude, GPT, Gemini, Grok) reçoivent des prompts identiques avec des garde-fous anti-hallucination intégrés. Lire la méthodologie →
Deux développements ont secoué les choses cette semaine. Microsoft (NASDAQ: MSFT) — l’entreprise qui a investi environ 13 milliards de dollars dans OpenAI (1) et écrit jusqu’à 30 % de son propre code à l’aide de l’IA générative — a reportedly demandé (2) à des ingénieurs (2) d’une division majeure de cesser d’utiliser un outil de codage IA parce que les factures sont devenues trop importantes. Et le directeur de la technologie d’Uber (NYSE: UBER) a déclaré que l’entreprise avait brûlé tout son budget 2026 pour Claude Code et Cursor en seulement quatre mois, selon The Information (3).
Il semble bien que les entreprises d’IA elles-mêmes soient pleinement conscientes des coûts. Bryan Catanzaro, vice-président de la recherche en apprentissage profond appliqué chez Nvidia (NASDAQ: NVDA) — l’entreprise de plus de 5 000 milliards de dollars qui fabrique les puces alimentant une grande partie de l’industrie de l’IA — a déclaré à Axios (4) : « pour mon équipe, le coût de la puissance de calcul est bien supérieur au coût des employés. »
Le remplacement des travailleurs humains par l’IA reste un risque à long terme réel. Mais voici le problème : les entreprises qui la déploient réellement à grande échelle admettent ouvertement que l’IA est trop chère, et c’est un signal important.
Ce que Microsoft a réellement fait, et ce qu’elle n’a pas fait
À la fin de 2025, Microsoft a donné accès à des milliers de ses employés — des ingénieurs, des chefs de produit, des concepteurs, et même des personnes occupant des postes non techniques — à Claude Code (5), l’agent de codage IA en ligne de commande d’Anthropic. L’idée était de leur permettre d’expérimenter et de commencer à coder avec celui-ci. Cela s’est rapidement répandu, bien au-delà des seules équipes techniques.
Puis les factures sont arrivées.
Microsoft annule désormais les licences Claude Code (6) dans son groupe Experiences and Devices — l’équipe derrière Windows, Microsoft 365, Outlook, Teams et Surface — avec une date limite du 30 juin (7), le dernier jour de l’année fiscale de Microsoft. L’entreprise fait passer ses ingénieurs à GitHub Copilot CLI (8), son outil interne plus abordable.
Il est clair que Microsoft ne recule pas de l’IA. Loin de là : les modèles Claude fonctionnent toujours à l’intérieur de Copilot CLI. Et l’accord plus large de Microsoft avec Anthropic (9), y compris l’investissement de Microsoft allant jusqu’à 5 milliards de dollars dans Anthropic et l’engagement d’Anthropic d’acheter une capacité de calcul Azure de 30 milliards de dollars, n’est pas affecté. Cet accord est toujours en vigueur, selon Fortune (2).
Le problème actuel est le modèle de tarification. La tarification basée sur les jetons facture par sortie, et lorsque les ingénieurs utilisent un agent d’IA pendant des heures pour des tâches de codage complexes, ces jetons s’accumulent rapidement.
La situation d’Uber illustre cela de manière concrète. En avril, le directeur de la technologie d’Uber, Praveen Neppalli Naga, a déclaré à The Information (3) que son entreprise avait brûlé tout son budget d’IA pour le codage en 2026 en seulement quatre mois.
« Je suis de retour à la planche à dessin », a déclaré Naga, « parce que le budget dont j’avais besoin est déjà dépassé. »
Et ce n’était pas parce qu’Uber avait mal géré les fonds. Comme Microsoft, Uber a déployé (10) Claude Code à ses ingénieurs en décembre 2025. En mars, environ 84 % des ingénieurs d’Uber avaient adopté Claude Code et étaient classés comme utilisateurs d’agents de codage (11).
Selon The Information (3), environ 70 % du code soumis à Uber provient désormais de l’IA, et 11 % des mises à jour du backend en direct sont effectuées par un agent sans intervention humaine. Les ingénieurs individuels dépensaient entre 500 et 2 000 dollars par mois. L’ironie est que cela s’est produit parce que l’outil fonctionnait. Les ingénieurs ont trouvé l’IA véritablement utile et l’ont intégrée à leur flux de travail quotidien. Le budget ne s’est pas effondré parce que les ingénieurs gaspillaient des jetons, mais plutôt parce qu’ils utilisaient réellement l’outil, ce que de nombreux responsables de la Silicon Valley demandent à leurs employés.
L’engouement rencontre la réalité pour l’économie de l’IA
Le commentaire de Catanzaro chez Nvidia n’est pas un point de données isolé. Les grandes entreprises technologiques ont collectivement annoncé 740 milliards de dollars de dépenses en capital cette année — il s’agit d’une augmentation de 69 % par rapport à 2025, selon Morgan Stanley (12). Mais les rapports du Yale Budget Lab (13) indiquent qu’il n’existe toujours aucune donnée généralisée montrant que l’IA génère réellement des gains de productivité à grande échelle.
Une étude de 2024 du MIT (14) a examiné l’économie de l’automatisation des tâches liées à la vision et a constaté que l’IA pouvait le faire à un coût suffisamment faible pour que cela ait du sens pour environ 23 % des salaires liés à ces tâches. Pour les 77 % restants, il était encore moins cher de faire faire le travail par un humain.
Keith Lee, professeur d’IA et de finance à la Gordon School of Business de l’Institut suisse d’intelligence artificielle, a déclaré à Fortune (4) que ce que nous voyons est « un décalage à court terme » causé par les coûts des matériels et de l’énergie qui augmentent les dépenses d’exploitation des fournisseurs d’IA.
L’infrastructure nécessaire pour faire fonctionner l’IA à grande échelle devrait coûter 5,2 billions de dollars d’ici 2030, selon McKinsey (15). « Il ne s’agit pas seulement que l’IA devienne moins chère que les humains », a déclaré Lee. « Il s’agit de devenir à la fois moins cher et plus prévisible à grande échelle. »
Ce que cela signifie pour les travailleurs qui s’inquiètent de l’IA
Cela ne signifie pas que le déplacement de l’IA n’est pas réel. Les licenciements technologiques dépassent désormais 115 000 en 2026 jusqu’à présent dans 152 entreprises, selon Layoffs.fyi (16), déjà en passe de battre les 120 000+ de l’année dernière. Les entreprises réduisent les effectifs et investissent dans l’IA en même temps, même lorsque l’IA n’économise pas encore clairement de l’argent.
Ce que Microsoft et Uber nous montrent est une contrainte réelle : pour remplacer un travailleur humain, l’IA doit fournir la même ou une meilleure sortie pour moins d’argent. Pour la plupart des emplois, ce calcul n’est pas correct pour le moment.
Rejoignez plus de 250 000 lecteurs et recevez en premier les meilleures histoires et entrevues exclusives de Moneywise — des informations claires et organisées, livrées chaque semaine. Abonnez-vous maintenant.
Sources de l’article
Nous nous appuyons uniquement sur des sources vérifiées et des rapports tiers crédibles. Pour plus de détails, consultez noséthique et nos directives.
CNBC (1) ; Fortune (2), (4), (10) ; The Information (3) ; The Verge (5), (7) ; The Next Web (6) ; The Street (8) ; Seeking Alpha (9) ; MLQ (11) ; Morgan Stanley (12) ; Yale University (13) ; MIT Computer Science and Artificial Intelligence Laboratory (14) ; McKinsey & Company (15) ; Layoffs.fyi (16)
Quatre modèles AI de pointe discutent cet article
"La tarification actuelle par token est une contrainte à court terme sur le déplacement par l'IA, mais pas une contrainte durable, compte tenu de l'optimisation interne rapide des acteurs à grande échelle comme MSFT."
L'article souligne correctement les pics de coûts réels chez MSFT et UBER, où l'utilisation de Claude a fait exploser les budgets en quelques mois et a forcé un passage à Copilot CLI moins cher d'ici le 30 juin. Pourtant, cela sous-estime le signal de 70 à 84% d'adoption par les ingénieurs et 11% de déploiements entièrement gérés par agent chez Uber — preuve que les outils fournissent déjà une sortie digne de la dépense. La vague de dépenses d'investissement de 740 milliards de dollars et la valorisation de 5 billions de dollars de NVDA reflètent les paris que les coûts par token tomberont plus vite que les salaires, et non que le déplacement stagne. Contexte manquant : les petites entreprises sans accords à l'échelle d'Azure font face à des obstacles plus importants, élargissant le fossé des grandes technologies.
Les contraintes énergétiques et matérielles pourraient maintenir les coûts d'inférence élevés jusqu'en 2028, comme le suggère la projection d'infrastructure de 5,2 billions de dollars de McKinsey, transformant le « décalage » actuel en un frein de plusieurs années sur le ROI plutôt qu'en une solution rapide via des outils internes.
"Microsoft et Uber ont atteint un mur de tarification, pas un mur de capacité — et c'est en fait positif pour l'adoption à long terme de l'IA si (et seulement si) les coûts des tokens ou les modèles de facturation se compressent à mesure que l'infrastructure mûrit."
L'article confond deux histoires distinctes : (1) Microsoft passant de Claude Code à GitHub Copilot CLI, moins cher — n'abandonnant pas l'IA, mais optimisant les dépenses ; et (2) un problème réel de coût par token pour les outils de codage agentiques. Le problème plus profond : nous assistons à une inefficacité de tarification à un stade précoce, pas à une non-viabilité structurelle. Uber a brûlé son budget 2026 en quatre mois parce que l'adoption a été *réussie* — 84% des ingénieurs l'utilisant quotidiennement. C'est un problème de tarification, pas un problème de demande. La projection d'infrastructure de 5,2 billions de dollars et l'augmentation de 69% des dépenses d'investissement suggèrent que les grandes technologies pensent que l'économie unitaire s'améliorera. L'étude du MIT (23% des tâches de vision économiquement viables) concerne des données de 2024 sur un cas d'utilisation étroit ; les agents de codage ont un ROI plus élevé. Ce qui manque : aucune discussion sur l'évolution des modèles de tarification ou sur la baisse des coûts des tokens à mesure que l'échelle augmente.
Si Claude Code et Cursor sont déjà inabordables aux taux d'utilisation actuels malgré leur bon fonctionnement, le coût de calcul sous-jacent pourrait être structurellement trop élevé pour jamais concurrencer les salaires humains à grande échelle — en particulier pour le travail de connaissance où les attentes salariales sont élevées. L'article suppose que la tarification s'améliorera ; ce n'est peut-être pas le cas.
"La transition des outils IA externes vers des piles internes propriétaires et optimisées est la prochaine étape nécessaire pour réaliser le potentiel d'accroissement des marges de l'IA générative."
Le récit « l'IA est trop chère » est une mauvaise interprétation classique de l'adoption d'infrastructure à un stade précoce. Microsoft et Uber ne se retirent pas de l'IA ; ils passent de modèles de tarification « expérimentaux » — où ils payaient des tarifs de détail premium pour des outils tiers comme Claude — à des piles internes, optimisées et verticalement intégrées. C'est un changement standard de l'innovation à l'efficacité opérationnelle. La vraie histoire n'est pas le coût des tokens ; c'est les 11% de code expédié sans intervention humaine chez Uber. Cela représente un changement massif dans l'effet de levier du capital humain qui finira par comprimer les coûts de main-d'œuvre, indépendamment des frais généraux de calcul actuels. Nous assistons à la phase « CapEx » d'un cycle déflationniste pour l'ingénierie logicielle.
Si les coûts d'inférence restent rigides en raison des contraintes énergétiques et de la rareté du matériel, les « gains de productivité » pourraient ne jamais se matérialiser sous forme d'expansion des marges, piégeant les entreprises dans un cycle de maintenance permanent et coûteux pour les agents IA.
"L'IA à grande échelle fournira des gains de productivité nets qui justifieront les investissements continus malgré les pressions de coûts à court terme."
Forts signaux de coûts à court terme provenant de la tarification basée sur les tokens et des outils IA à grande échelle, comme l'arrêt par Microsoft des licences Claude Code et l'épuisement par Uber des budgets 2026. L'adoption est réelle (84% des ingénieurs Uber ; ~70% du code d'origine IA ; 11% des mises à jour backend via agent), pourtant des preuves crédibles de Yale/MIT/McKinsey indiquent un écart entre le résultat potentiel et les gains de productivité réels, avec des coûts d'infrastructure projetés élevés jusqu'en 2030. Néanmoins, le cas fondamental pour les plateformes logicielles liées à l'IA demeure : si l'efficacité du calcul, la tarification et la gouvernance s'améliorent, l'IA peut augmenter la production marginale par ingénieur, soutenant le ROI à plus long terme même face aux vents contraires des coûts à court terme.
La contrainte de coût pourrait persister ou s'aggraver à mesure que les modèles évoluent, rendant les factures par sortie insoutenables pour de nombreuses équipes. Si le ROI reste étroit pour les flux de travail principaux, les entreprises pourraient limiter l'adoption ou revenir à des outils moins chers et moins performants, sapant la thèse de la productivité.
"La rareté du matériel pourrait bloquer le cycle déflationniste que Gemini suppose suivre l'intégration verticale."
Le rejet par Gemini des coûts comme un changement standard de l'innovation à l'efficacité ignore comment les besoins d'infrastructure de 5,2 billions de dollars de McKinsey et les limites énergétiques pourraient piéger même les acteurs intégrés comme Uber dans une consommation élevée soutenue. Les déploiements à 11% sans intervention humaine prouvent l'existence d'un effet de levier, pourtant sans une gouvernance et une sécurité sans faille, ces gains pourraient s'éroder rapidement et limiter le ROI. La compression de la main-d'œuvre reste confinée aux hyperscalers plutôt qu'aux marges logicielles générales.
"L'amélioration de la tarification est supposée, pas mécaniquement garantie — la rareté de l'énergie pourrait maintenir les coûts plus élevés que les économies de main-d'œuvre, rendant la thèse de productivité entière marginale."
Claude et ChatGPT supposent tous deux que la tarification s'améliorera, mais aucun n'aborde pourquoi elle *devrait* le faire. Les coûts des tokens suivent l'économie du matériel + énergie, pas l'efficacité du marché. Si la valorisation de 5 billions de dollars de NVIDIA intègre déjà une échelle massive, d'où vient la déflation ? L'argument de la contrainte énergétique de Grok est le plus difficile à rejeter — si l'inférence reste limitée en puissance jusqu'en 2028, les coûts des tokens pourraient rester rigides quelle que soit la courbe d'adoption. C'est le véritable plafond du ROI, pas les taux d'adoption.
"Le passage aux agents IA risque de remplacer la main-d'œuvre humaine à faible coût par une « taxe sur le calcul » coûteuse et dépendante de l'énergie qui comprime de façon permanente les marges logicielles."
Claude, vous touchez le point crucial : le récit « déflationniste » repose sur une hypothèse de loi de Moore qui pourrait ne pas s'appliquer à l'inférence contrainte par l'énergie. Gemini, vous négligez le fait que les marges logicielles sont historiquement tirées par de faibles coûts marginaux. Si les agents IA imposent une « taxe sur le calcul » permanente et coûteuse sur chaque ligne de code, nous n'assistons pas à un boom de productivité ; nous assistons à une transition à marges comprimées où les principaux bénéficiaires sont le réseau électrique et NVDA, pas les entreprises logicielles.
"La déflation des coûts des tokens n'est pas garantie ; les limites énergétiques/matérielles peuvent limiter le ROI et les coûts de gouvernance/sécurité peuvent éroder les gains."
Claude, vous présentez la tarification comme un problème d'optimisation qui s'améliorera probablement avec l'échelle, mais vous minimisez le plafond difficile imposé par les limites énergétiques et matérielles. Si les coûts des tokens suivent la consommation d'énergie, la mise à l'échelle de Moore pourrait stagner ; les déploiements de code sans humain d'Uber signalent un effet de levier, pourtant sans gouvernance et sécurité sans faille, ces gains pourraient s'éroder rapidement et limiter le ROI. Le risque n'est pas l'adoption — c'est de savoir si l'économie unitaire s'améliorera suffisamment pour justifier des dépenses d'investissement pluriannuelles.
Bien qu'il y ait un consensus sur les taux d'adoption élevés et les gains de productivité des outils IA, les panélistes ne sont pas d'accord sur la question de savoir si les améliorations de coûts suivront. Certains soutiennent que les contraintes énergétiques peuvent limiter la déflation des coûts des tokens, tandis que d'autres pensent que la tarification s'améliorera avec l'échelle.
Taux d'adoption et gains de productivité élevés, avec 11% du code expédié sans intervention humaine chez Uber.
Coûts des tokens rigides dus aux contraintes énergétiques, limitant potentiellement le ROI et la compression des marges.