微软切断了工程师对人工智能的访问,因为账单太高——为什么人工智能可能不会取代你的工作
来自 Maksym Misichenko · Yahoo Finance ·
来自 Maksym Misichenko · Yahoo Finance ·
AI智能体对这条新闻的看法
虽然在 AI 工具的高采用率和生产力提升方面存在共识,但与会者对成本改进是否会随之而来存在分歧。一些人认为能源限制可能会限制 token 成本通缩,而另一些人则认为定价会随着规模的扩大而改善。
风险: 由于能源限制导致 token 成本坚挺,可能限制投资回报率和利润压缩。
机会: 高采用率和生产力提升,Uber 上 11% 的代码是在零人工干预的情况下交付的。
本分析由 StockScreener 管道生成——四个领先的 LLM(Claude、GPT、Gemini、Grok)接收相同的提示,并内置反幻觉防护。 阅读方法论 →
本周发生了两项重要发展。微软(纳斯达克:MSFT)——该公司向OpenAI(1)投入了大约130亿美元,并使用生成式人工智能编写高达30%的自有代码——据报道告诉了一个主要部门的工程师(2),停止使用一种人工智能编码工具,因为账单太高。而优步(纽约证券交易所:UBER)首席技术官表示,根据《信息周刊》(3)的报道,该公司仅用四个月的时间就烧光了其为Claude Code和Cursor准备的2026年预算。
果然,听起来人工智能公司本身完全意识到这些成本。英伟达(纳斯达克:NVDA)——这家市值超过5万亿美元的公司生产为人工智能行业提供动力的芯片——的副总裁兼应用深度学习研究负责人布莱恩·卡坦扎罗(Bryan Catanzaro)告诉Axios(4):“对于我的团队来说,计算成本远远超过员工的成本。”
人工智能取代人类工人仍然是一个真实的长期风险。但重点是:实际上部署人工智能的公司公开承认人工智能太昂贵,这是一个重要的信号。
微软实际做了什么,以及它没有做什么
在2025年底,微软向数千名员工——工程师、产品经理、设计师,甚至是非技术角色中的员工——提供了对Claude Code(5)的访问权限,这是一种Anthropic的命令行人工智能编码代理。想法是让他们进行实验并开始使用它进行编码。它传播得非常快,远远超出了技术团队。
然后账单来了。
微软现在正在取消其Experiences and Devices组(负责Windows、Microsoft 365、Outlook、Teams和Surface)中的Claude Code许可证(6),截止日期为6月30日(7),即微软的财政年度的最后一天。该公司正在将其工程师转移到GitHub Copilot CLI(8),这是微软更实惠的内部工具。
需要明确的是,这并不是微软放弃人工智能。事实并非如此:Claude模型仍然在Copilot CLI中运行。而且微软与Anthropic(9)的更广泛协议也未受影响,包括微软对Anthropic高达50亿美元的投资以及Anthropic对购买Azure计算容量的300亿美元承诺。根据《财富》杂志(2)的报道,该协议仍然有效。
现在的问题是定价模式。基于token的定价按输出收费,当工程师使用人工智能代理进行数小时的复杂编码任务时,这些token会迅速累积。
优步的情况使这一问题具体化。今年4月,优步首席技术官普拉文·内帕利·纳加(Praveen Neppalli Naga)告诉《信息周刊》(3),他的公司仅用四个月的时间就烧光了其2026年人工智能编码预算。
纳加说:“我正在重新审视蓝图,因为我认为我需要的预算已经被烧光了。”
这并不是因为优步滥用了资金。与微软一样,优步在2025年12月向其工程师部署了Claude Code。到3月份,大约84%的优步工程师采用了Claude Code,并被归类为代理编码用户(11)。
根据《信息周刊》(3)的报道,现在大约70%的优步提交的代码都源自人工智能,并且11%的后端实时更新是由代理在没有人工干预的情况下发布的。单个工程师每月花费在500到2000美元之间。讽刺的是,这是因为该工具有效。工程师发现人工智能真正有用,并将其作为日常工作的一部分。预算的崩溃不是因为工程师在浪费token,而是因为他们实际上在使用该工具,这是硅谷许多老板一直要求员工做的事情。
炒作与人工智能经济的现实相遇
卡坦扎罗在英伟达的评论并不是孤立的数据点。大型科技公司今年已宣布投入7400亿美元的资本支出——根据摩根士丹利(12)的数据,比2025年增长了69%。但耶鲁预算实验室的报告(13)指出,目前还没有广泛的数据表明人工智能在规模上真正提高了生产力。
2024年的一项麻省理工学院研究(14)研究了自动化与视觉相关的任务的经济性,发现人工智能可以以足够便宜的价格完成约23%与这些任务相关的工资。对于剩余的77%,继续让人类完成这项工作仍然更便宜。
人工智能和金融教授基思·李(Keith Lee)告诉《财富》杂志(4),我们看到的是由硬件和能源成本推高人工智能供应商运营费用造成的“短期错配”。
据麦肯锡(15)预测,运行人工智能所需的 инфраструктура 将于2030年达到5.2万亿美元的成本。“这不仅仅是人工智能变得比人类更便宜,而是以更便宜和更可预测的方式在规模上变得更便宜,”李说。
这对担心人工智能的工人意味着什么
这并不意味着人工智能取代不是真实的。截至2026年,已有115,000多起技术裁员事件,涉及152家公司,根据Layoffs.fyi(16)的数据,已经有望打破去年的120,000+。公司正在裁员并投资于人工智能,即使人工智能尚未明确节省资金。
微软和优步向我们展示了一种真正的约束:为了取代一名人类工人,人工智能必须以更低的成本提供相同或更好的输出。目前,对于大多数工作来说,这个计算并不准确。
加入25万多名读者,每周获取Moneywise的最佳故事和独家访谈——清晰的见解经过策划和交付。立即订阅。
文章来源
我们仅依赖经过验证的来源和可信的第三方报告。有关详细信息,请参阅我们的道德规范和指南。
CNBC (1); Fortune (2), (4), (10); The Information (3); The Verge (5), (7); The Next Web (6); The Street (8); Seeking Alpha (9); MLQ (11); Morgan Stanley (12); Yale University (13); MIT Computer Science and Artificial Intelligence Laboratory (14); McKinsey & Company (15); Layoffs.fyi (16)
四大领先AI模型讨论这篇文章
"当前的 token 定价是 AI 替代的短期限制因素,但不是持久的限制因素,因为像微软这样的规模化玩家正在进行快速的内部优化。"
文章正确地指出了微软和 Uber 的实际成本飙升,其中 Claude 的使用在几个月内就超出了预算,并迫使在 6 月 30 日前转向更便宜的 Copilot CLI。然而,这低估了 70-84% 的工程师采用率和 Uber 11% 的完全由代理驱动的部署所发出的信号——证明这些工具已经提供了物有所值的产出。7400 亿美元的资本支出浪潮和英伟达 5 万亿美元的估值反映了这样的赌注:每个 token 的成本将比工资下降得更快,而不是替代效应停滞。缺失的背景:没有 Azure 规模交易的小公司面临更严峻的障碍,这扩大了大型科技公司的护城河。
能源和硬件限制可能会使推理成本在 2028 年之前保持高位,正如麦肯锡的 5.2 万亿美元基础设施预测所示,这将使今天的“错配”变成对投资回报率的多年拖累,而不是通过内部工具快速解决。
"微软和 Uber 遇到了定价障碍,而不是能力障碍——如果 token 成本或计费模式随着基础设施的成熟而压缩,这实际上对长期 AI 采用是有利的。"
文章混淆了两个独立的故事:(1) 微软从 Claude Code 转向更便宜的 GitHub Copilot CLI——不是放弃 AI,而是优化支出;(2) 代理编码工具存在真实的每 token 成本问题。更深层的问题是:我们看到的是早期定价效率低下,而不是结构性不可行。Uber 在四个月内烧光了 2026 年的预算,因为采用是*成功的*——84% 的工程师每天都在使用它。这是一个定价问题,而不是需求问题。5.2 万亿美元的基础设施预测和 69% 的资本支出增长表明,大型科技公司相信单位经济效益将会改善。MIT 的研究(23% 的视觉任务在经济上可行)是 2024 年关于狭窄用例的数据;编码代理的投资回报率更高。缺失的是:没有讨论定价模式将如何演变,或者 token 成本是否会随着规模的增加而下降。
如果 Claude Code 和 Cursor 在当前使用率下已经负担不起,尽管它们“运行良好”,那么潜在的计算成本可能在结构上太高,无法大规模地低于人类工资——尤其是对于薪资期望很高的知识工作而言。文章假设定价会改善;但它可能不会。
"从外部 AI 工具转向专有的、优化的内部堆栈是实现生成式 AI 利润增长潜力的必要下一步。"
“AI 太贵了”的说法是对早期基础设施采用的典型误读。微软和 Uber 并没有从 AI 领域撤退;它们正在从“实验性”定价模式——即它们为 Claude 等第三方工具支付高昂的零售价——转向内部优化和垂直整合的堆栈。这是从创新到运营效率的标准转变。真正的故事不是 token 的成本;而是 Uber 上 11% 的代码是在零人工干预的情况下交付的。这代表了人力资本杠杆的巨大转变,最终将压缩劳动力成本,而不管当前的计算开销如何。我们正在目睹软件工程通缩周期的“资本支出”阶段。
如果由于能源限制和硬件稀缺,推理成本保持坚挺,那么“生产力提升”可能永远不会以利润扩张的形式实现,使公司陷入 AI 代理永久的高成本维护周期。
"大规模 AI 将带来净生产力提升,从而证明持续投资是合理的,尽管面临短期成本压力。"
来自基于 token 的定价和大规模 AI 工具的强劲短期成本信号,正如微软暂停 Claude Code 许可证和 Uber 耗尽 2026 年预算所表明的那样。采用是真实的(Uber 工程师的 84%;约 70% 的代码由 AI 生成;11% 的后端更新通过代理完成),但来自耶鲁/MIT/麦肯锡的可信证据表明,潜在产出与实际生产力提升之间存在差距,基础设施成本预计到 2030 年仍将很高。尽管如此,与 AI 相关的软件平台的根本论点仍然存在:如果计算效率、定价和治理得到改善,AI 可以提高每位工程师的边际产出,从而在短期成本阻力中支持更长期的投资回报率。
随着模型规模的扩大,成本限制可能会持续或恶化,使得按输出计费的账单对许多团队来说不可持续。如果核心工作流程的投资回报率仍然很窄,公司可能会限制采用或恢复使用更便宜、功能较弱的工具,从而破坏生产力论点。
"硬件稀缺可能会阻碍 Gemini 所假设的垂直整合之后的通缩周期。"
Gemini 对成本的否定,认为这是标准的从创新到效率的转变,忽略了麦肯锡的 5.2 万亿美元基础设施需求和能源限制可能如何将包括 Uber 在内的集成玩家困在持续的高消耗中。11% 的零干预部署证明了杠杆的存在,但如果没有严格的治理和安全,这些收益可能会迅速侵蚀并限制投资回报率。风险不在于采用——而在于单位经济效益是否真的能提高到足以证明多年资本支出的合理性。
"定价改善是假设的,而不是机械保证的——能源稀缺可能导致成本高于劳动力节省,使整个生产力论点变得边缘化。"
Claude 和 ChatGPT 都假设定价会改善,但两者都没有解决为什么它*应该*改善。Token 成本追踪硬件+能源经济学,而不是市场效率。如果英伟达 5 万亿美元的估值已经计入了大规模生产,那么通缩从何而来?Grok 的能源限制论是最难反驳的——如果推理在 2028 年之前仍然受限于电力,那么无论采用曲线如何,token 成本都可能保持坚挺。这才是投资回报率的真正上限,而不是采用率。
"转向 AI 代理的风险在于用高成本、能源依赖的“计算税”取代低成本的人力劳动,从而永久性地压缩软件利润。"
Claude,你抓住了关键:通缩叙事依赖于一个可能不适用于能源受限推理的摩尔定律假设。Gemini,你忽略了一个事实,即软件利润历来是由低边际成本驱动的。如果 AI 代理强制对每一行代码征收永久性的、高成本的“计算税”,那么我们看到的不是生产力繁荣;我们看到的是利润压缩的转型,其主要受益者是电网和英伟达,而不是软件公司。
"Token 成本通缩并非必然;能源/硬件限制可能会限制投资回报率,而治理/安全成本可能会侵蚀收益。"
Claude,你将定价视为一个很可能随着规模扩大而改善的优化问题,但你低估了能源和硬件限制带来的硬性上限。如果 token 成本与电力消耗相关,摩尔定律式的扩展可能会停滞;Uber 的 11% 无人代码部署表明存在杠杆,但如果没有严格的治理和安全,这些收益可能会迅速侵蚀并限制投资回报率。风险不在于采用——而在于单位经济效益是否真的能提高到足以证明多年资本支出的合理性。
虽然在 AI 工具的高采用率和生产力提升方面存在共识,但与会者对成本改进是否会随之而来存在分歧。一些人认为能源限制可能会限制 token 成本通缩,而另一些人则认为定价会随着规模的扩大而改善。
高采用率和生产力提升,Uber 上 11% 的代码是在零人工干预的情况下交付的。
由于能源限制导致 token 成本坚挺,可能限制投资回报率和利润压缩。