AI智能体对这条新闻的看法
小组普遍认为,尽管文章的框架在智力上是合理的,但它低估了自动化的速度和广度,特别是在白领行业。卡车运输和仓储领域失业的时间表和严重程度取决于技术进步和监管响应。
风险: 快速、不受限制的卡车运输和仓储自动化可能导致严重的失业和经济动荡,潜在的政治反应将使情况更加复杂。
机会: AI 驱动的生产力收益可能导致白领行业的利润压缩,使股东受益,而卡车运输领域潜在的销量增长可能创造新的职位,尽管这一点存在争议。
人工智能驱动的自动化将如何真正影响就业?
由 Alex Imas 和 Soumitra Shukla 通过 Ghosts of Electricity 发表,
人工智能政策中最常引用的发现之一来自 2023 年 Eloundou、Manning、Mishkin 和 Rock 题为“GPTs 是 GPTs”的论文。标题是一个不错的双关语:该论文研究了由大型语言模型(也称为 GPTs)驱动的通用技术(GPTs)如何重塑劳动力市场。主要发现是,大约 80% 的美国工人可能至少有 10% 的任务受到 LLM 的影响,大约 19% 的人可能会看到一半或更多任务受到影响。总体而言,这些暴露度指标试图捕捉“暴露”职业的程度,这取决于人工智能是否可以增强工作中涉及的任务:直接暴露被定义为“是否访问 LLM 或 LLM 驱动的系统会减少人类执行特定 DWA 或完成任务所需的时间至少 50%”。作者在论文中明确表示:暴露度对应于人工智能参与工作的能力,而不是工作被自动化消失的程度。但“暴露”一词最终引发了对确切情况的所有焦虑——即失业。或许正因如此,这些人工智能暴露度指标在过去几个月里经常在社交媒体上病毒式传播。
最近的一个例子是 OpenAI 的联合创始人之一、人工智能思维领导者 Andrej Karpathy。他的仪表板,他将其描述为“情绪编码”的周末项目,对主要职业的 AI 驱动自动化暴露程度进行了排名。它迅速在 X 上病毒式传播,因为它传递了所有关于人工智能导致快速失业的现有叙事。
在看到仪表板被大肆渲染和广泛传播后,Karpathy 澄清说,他的“暴露”评分卡是基于对工作数字化程度的快速、LLM 生成的衡量标准,并且从未打算成为对哪些职业将萎缩或消失的严肃预测。虽然他自己的项目网站也做出了同样的免责声明,但它在 X 上被广泛忽视。“情绪编码”的周末项目会在世界各地传播两次,而免责声明还没有时间穿上裤子。
然而,最近的这一事件表明,此类暴露度指标引起了公众的关注,但经常被误读(有些人甚至提议完全取消“暴露”一词)。当人们听说某个工作岗位“暴露”于人工智能 80% 时,他们会想象该工作的 80% 将不复存在。人工智能暴露和失业的实际经济情况与这种描述相去甚远。
什么是“工作”?
工作是一系列任务;一个人通常根据他们完成与工作相关的任务的完成程度来获得报酬。所以,假设您是一名项目经理。您的工作涉及许多任务,例如生成想法、简洁地概述这些想法并获得团队成员的反馈、准备演示文稿以及进行一些重复性的工作(例如,审批时间表、处理后勤)。随着人工智能模型的变得更好,您意识到您可以自动化其中的许多事情:人工智能可以为您完成许多重复性的工作,甚至可以帮助您准备演示文稿。根据暴露度指标,您的工作现在“暴露”于人工智能。您的工作会发生什么变化?您的工资会发生什么变化?嗯,如果自动化某些任务释放了时间来生成更好的想法,那么您的整体生产力就会提高——您对公司来说更有价值。人类仍然被雇佣,而且工资可能会上涨。
另一方面,如果人工智能自动化了所有任务——例如,您的工作只涉及两个任务,并且这两个任务都被自动化了——那么是的,人类劳动力将会被取代。重要的是,任务的数量(我们称之为工作的维度)越少,公司自动化它的意愿就越大。这是许多自动化分析中经常被忽略的一点:将人工智能引入现有组织需要成本,因此如果它可以自动化整个工作,而不是仅仅自动化任务,公司更有可能投资。作者明确表示,暴露和自动化风险不仅取决于模型的能力,还取决于公司激励措施。这并非假设:我们现在有大量证据表明,这些激励措施对于哪些内容会被自动化以及何时被自动化至关重要(例如,当劳动力成本增加时,公司更有可能自动化)。
最后,即使人工智能提高了人们的生产力并提高了工资,如果消费者无法“吸收”生产力的提高,该行业仍然可能出现大规模裁员:如果生产力驱动的价格下降没有增加对该产品的需求,那么该行业需要更少的工人。
更普遍地说,一项任务暴露于人工智能——即使这种暴露对应于该任务的完全自动化——可能会导致更高的工资和更多的招聘机会。或者,它可能导致裁员甚至完全取代。暴露是否会导致对工人的劳动市场结果更好或更差取决于两个关键变量:该行业消费者需求的弹性(当价格下降时,人们购买该产品多少),以及工作的维度(涉及该工作多少任务)。正如我们希望通过文章结尾说服您的那样,我们应该比目前更担心像卡车运输和仓储这样的工作。
标准的自动化方法
让我们从关于自动化的“标准”方法开始。首先,我们使用 O*NET 等分类法将工作分解为任务,然后评估多少任务可以被人工智能自动化或增强。对工作的总体影响是每个任务改进程度的加权平均值,这意味着您可以构建一个“暴露指数”——通常定义为人工智能可以完成工作任务的份额是多少?——并且该指数线性地映射到工作受到的影响(参见,例如,Michael Webb 的经典论文)。这种方法对于绘制人工智能潜在影响的范围非常有用。但它包含一个几乎肯定不适用于大多数实际工作的假设:它假设任务是可分离的。也就是说,自动化任务 A 不会影响任务 B 的生产力,并且总体影响只是各部分的总和。
考虑一下您所知道的工作。在很多工作中,输出是由许多不同的事情正确完成而不仅仅是完成一些事情。你不能有一个遵循食谱的多数步骤的厨师,一个主要在节拍中演奏的鼓手,一个代码只能部分运行的程序员(或者,对于那些测试过这个要求的教授来说,研究工作的只有一半……)。这些工作需要每个任务都成功完成,才能使输出具有可接受性。
换句话说,任务不是可分离的;它们是互补的,即完成一项任务的正确或错误会影响您在工作中完成其他任务的方式,以完成工作。任务在工作中是互补而不是替代似乎对于大多数实际生产来说是合理的。这对于人工智能如何真正影响工作具有广泛的重要意义。
工作的 O 形环模型
互补任务创造非线性生产力的想法可以追溯到 Michael Kremer 的经典 1993 年论文“经济发展的 O 形环理论”。这个名字来自挑战者号灾难:单个有缺陷的 O 形环导致整个系统的灾难性失败。Kremer 的观点是,如果生产需要许多步骤,并且每个步骤都需要做得好才能使最终产品具有价值,那么生产力将成为技能的乘法函数,而不是线性函数。一个在每个任务中犯的错误更少的工作人员将对整体生产力产生巨大影响,因为这些小质量收益在每个步骤中都会累积。
这个基于任务的工作模型最近随着 Joshua Gans 和 Avi Goldfarb 的论文“O 形环自动化”而获得了新的关注,该论文将 Kremer 的框架直接应用于人工智能驱动的自动化。虽然他们的模型乍一看似乎很简单,但其含义是深远而深刻的。至少我们中的一位(Alex)已经痴迷于这篇论文几个月了(参见此处、此处和此处)。
Gans 和 Goldfarb 构建了一个公司模型,其中每个工人的工作由 n 个任务组成。工作的输出是每个任务质量的乘法——这是 O 形环生产函数:
A worker has a time endowment h and allocates it across the n tasks. If task s is performed manually, the worker spends h_s hours on it and generates quality:
where a is labor productivity, assumed constant across tasks (a simplifying assumption). The worker's time constraint is:
The firm can also choose to automate any task by renting a piece of capital that delivers a fixed quality θ at cost r per task. This is the key part to pay attention to: whether firms invest in automating a task depends on the trade-offs embedded in this problem. Once a task is automated, the worker no longer needs to spend any time on it.
So far the setup is quite simple. The interesting part is what the multiplicative structure of the production function implies once automation enters the picture.
人工智能如何提高工资?
现在,假设一家公司选择自动化 n 个任务中的 k 个。工人的情况会如何变化?这种变化如何影响工资?
在自动化之前,工人将时间均匀分配到所有 n 个任务中,这在对称结构下是最佳的。因此,每个手动任务都会收到 h/n 小时,并产生质量:
After k tasks are automated at quality θ, the worker now has all h hours to allocate across only n - k remaining manual tasks. Each manual task now gets h/(n-k) hours, producing quality a · h/(n-k). Total output becomes:
So output rises after partial automation if and only if:
This is an important condition which states that if the automated task quality θ is at least as good as the worker’s original pre-automation manual quality on those tasks, then the output increases for sure. Output does not automatically rise just because some tasks are automated; it rises when the quality of automation is high enough.
But here is the key insight: because automation also frees the worker to concentrate more time on the remaining tasks, output can increase even if the automated tasks are performed at slightly lower quality than the worker originally achieved before automation. Automation lets the worker concentrate on fewer tasks, raising the quality of each one. This is the “focus effect.” Because of the functional form of the production function, higher quality on the remaining manual tasks doesn’t just add to output—it multiplies through the production function. The worker becomes more productive precisely because they’re doing fewer things.
When the automation quality is sufficiently high relative to what the worker was producing manually on those tasks, the worker’s marginal product rises—and so (typically) does their wage. Partial automation, in the O-ring world, is often a complement to human labor rather than a substitute for it, which increases the worker’s wage.
But this is not necessarily good news for labor
Higher worker productivity is good for wages, but does it lead to more jobs or fewer? This depends on consumer demand. Each worker makes one calculator a day and the firm has 10 workers. All calculators are sold at the prevailing price. Now imagine each worker becomes much more productive so that each worker can make 10 calculators. The price of each calculator falls (costs fall), but consumers still demand roughly the same number of calculators. This is the case of inelastic demand—one that does not respond much to prices. Now the firm will fire 9 of the workers. But what if consumers buy way more calculators at lower prices, i.e., demand is very elastic. Then the firm will actually end up hiring more workers to meet the new demand, despite the fact that they’re more productive.
More generally, if demand is elastic (elasticity > 1), then a price decrease leads to a more-than-proportional increase in quantity demanded. Output expands a lot. The firm needs more workers to produce this higher output, even though each worker is now more productive. Net effect: more hiring.
If demand is inelastic (elasticity < 1), then a price decrease leads to a less-than-proportional increase in quantity demanded. Output does not expand much. The firm will fire workers to reduce costs.
This is closely related to a popular idea commonly referred to as Jevons’ paradox: when a resource becomes more efficient to use, total consumption of that resource often increases rather than decreases. When the steam engine made coal more efficient, coal consumption skyrocketed because so many new applications became economically viable. The same logic applies to labor: if AI makes a worker dramatically more productive, and demand for that product is elastic, one may end up with more workers in that occupation, not fewer.
Why job dimensionality matters: The case of firm incentives
任务和消费者需求弹性之间的关系对于预测人工智能驱动的失业至关重要,但经常被忽视的一个变量是工作本身的维度数量。工作的维度对于两个原因很重要。
首先,在任务被自动化的前提下,低维度的工作更有可能被完全取代。如果一个工作有 20 个任务,并且其中一个被自动化,那么人类工人仍然需要完成其余的 19 个任务。但如果一个工作只有 1 个任务,并且这个任务被自动化,那么这个工作就消失了。其次——这是最常被忽视的一个方面——公司有更强的动力去自动化剩余任务越少的工作。想象一下,自动化一项任务需要 1000 万美元的投资(购买软件、入职、连接到系统的其余部分等)。在一种情况下,这项任务是工作中唯一未自动化的任务;在另一种情况下,如果这项任务被自动化,则仍有 19 个其他未自动化的任务。由于可以完全取代工人并节省成本,公司更有动力在第一种情况下自动化这项任务。1
因此,即使一个工作岗位目前“暴露”于人工智能,也就是说,人工智能尚未用于涉及的任务,如果该工作岗位维度较低,公司将比工作岗位维度较高时更努力、更投入地进行自动化。
这提供了一个明确的预测:即使一个工作岗位目前没有“暴露”于人工智能,如果它涉及少量核心任务并且技术接近于自动化这些任务,我们也应该比目前更担心它。公司将比在其他任务仍然存在的情况下更努力地投资于自动化任务。
由于这个原因,我们认为人们应该比目前更担心卡车运输和仓储工作。
长途卡车司机约有 300 万在美国为生活而驾驶卡车。他们中的许多人五十多岁,在行业中驾驶了数十年,并且生活在卡车运输是经济支柱的社区。卡车运输是无需大学文凭即可获得的最佳工作之一。长途卡车司机的实际工作主要集中在安全地将卡车从 A 点运到 B 点。物流、装卸等都由他人完成。如果长途驾驶变得可靠,卡车司机的职业不会仅仅被增强;它可能会被彻底威胁,甚至被取代。这种可能性不再是理论上的。Aurora Innovation 和 Kodiak Robotics 等公司已经在受限的路线中进行大规模的自动驾驶卡车试点和商业部署。仓储也讲述了类似的故事。仓储雇佣了数百万美国工人,其中许多仓储工作——拣货、包装、分拣、托盘移动——相对狭窄,并且越来越容易自动化。在国外,公司正在运营高度自动化的“暗仓库”,这些仓库在全天候工作,人工很少。这些仓库与我们今天所看到的截然不同:它们从一开始就被设计成由机器运行。
现在将其与知识型工作,例如管理顾问进行比较。这项工作结合了研究、数据分析、客户沟通、演示文稿设计、战略推理、团队协调和关系管理。这至少有七八项不同的互补任务。Claude 或 Codex 可能会处理数据分析和幻灯片创建的初步工作,但顾问仍然需要处理所有其他事情。从 O 形环的角度来看,自动化某些任务实际上可以通过让工人将更多时间用于它们来提高这些互补任务的价值——顾问可以花更多时间与客户沟通并让他们放心实施,获得各个单位的认可等。因此,工资可能会上涨,如果更好的产出和更低的价格扩大了客户需求,就业也可能会增加。
您可以看到同样的逻辑在许多高风险职业中,例如医学和学术界。现在有超过 870 个 FDA 批准的放射学人工智能工具,并且 66% 的医生使用至少一个人工智能工具,主要用于语音输入和诊断支持。但这些工具增强了放射科医生的能力,而不是取代了他们。人工智能通常处理工作中的常规模式识别方面,从而使医生能够专注于复杂病例、患者沟通和临床判断。同样,学者们一直在讨论人工智能的进步是否会使研究助理更有效率还是更低效。随着人工智能自动化了常规分析任务,研究人员和研究助理都可以将更多精力集中在想法和判断上,从而扩大了熟练研究劳动力的产出和需求。这再次是实践中的 O 形环效应。
Same in our lab. Each additional member can do so much more, the challenge is getting everyone up to speed, having open discussions on best ways to use these tools vs not and building a culture where people feel valued more not less. https://t.co/0nEwUadRPF
— Abhishek Nagaraj 🗺️ (@abhishekn) 2026 年 3 月 18 日
暴露度指标捕捉了什么?
让我们回到暴露框架。在标准方法中,管理顾问被高度“暴露”于人工智能,而卡车司机却没有。但这是否意味着顾问比卡车司机面临更高的失业风险?不一定。顾问的高暴露实际上可能是好消息,因为这意味着人工智能将增强他们许多互补任务,从而触发“关注效应”并可能提高工资。另一方面,卡车司机在单个关键任务上的适度暴露更为危险,因为卡车公司更有动力自动化驾驶任务,一旦完成,该工作就会消失。这些激励已经在实践中发挥作用:
NEWS: Jeff Bezos 正在与一家新基金进行谈判,该基金将筹集 1000 亿美元,以收购制造业公司,并寻求使用人工智能技术来加速其自动化路径。
它与 Jeff 的人工智能创业公司 Project Prometheus 相关…… pic.twitter.com/6zlXRQHhOY
— Sawyer Merritt (@SawyerMerritt) 2026 年 3 月 19 日
因此,相关的对象不是平均任务暴露,而是瓶颈的结构以及自动化如何重塑工人的时间。两个暴露指数相同的岗位可能具有完全相反的失业风险,这取决于他们的任务是否互补、他们产出的需求弹性如何以及公司的自动化投资激励措施。最容易受到风险的工人不是那些平均暴露度最高的工人,而是那些工作围绕少量核心任务构建的工人,而这些任务可以被人工智能自动化。
1 在任务未完全自动化的情况下,自动化边际任务的成本节省将取决于工作中其他任务之间的互补性。这种关系在自动化 O 形环模型中得到了详细阐述。
Alex Imas 是芝加哥大学布斯商学院的教授。研究人工智能经济学和应用人工智能。Substack 在这里。
Tyler Durden
2026 年 4 月 4 日星期六 - 09:20
AI脱口秀
四大领先AI模型讨论这篇文章
"低维度的工种(如卡车运输)面临失业风险,不是因为它们“暴露”于 AI,而是因为一旦技术可行,公司就有过大的动力去完全自动化它们——而这个阈值比目前的暴露度指数所显示的更近。"
这篇文章在智力上严谨但对投资者来说危险地不完整。O-ring 模型正确地识别出失业取决于任务维度和需求弹性,而不是原始的 AI 暴露度。然而,文章将这些变量视为稳定不变的,而实际上并非如此。仓储和卡车运输确实面临风险——但时间表和严重程度取决于两个未知数:(1)自动驾驶系统是否真的能大规模实现长途卡车运输所需的可靠性(Aurora 和 Kodiak 仍处于试点阶段),以及(2)劳动力成本和监管摩擦是否会比模型预测的更快地使自动化在经济上合理。文章还低估了行业溢出效应:如果卡车运输工资崩溃,它将蔓延到物流、零售和区域经济,这是模型无法捕捉的。
文章假设公司会理性地优化自动化投资,但大多数公司行动迟缓、规避风险且受到政治限制——卡车运输公司面临工会压力、监管不确定性和基础设施差距,这些可能会将失业推迟十年或更长时间,从而夸大了这里的紧迫性。
"随着“专注效应”被初级专业知识的商品化所抵消,AI 将引发高维度白领工作中大规模的工资压缩事件。"
文章正确地指出,“任务暴露度”是“失业风险”的糟糕代理指标,但它危险地低估了高维度工作中资本-劳动替代的速度。虽然作者认为管理顾问由于任务互补性而安全,但他们忽略了“去技能化”效应:如果 AI 处理了 70% 的认知重负荷工作,公司将不可避免地通过雇用更便宜、经验较少的劳动力来管理剩余的 30%,从而有效地压缩专业服务领域的工资。对卡车运输/仓储的关注是合乎逻辑的,但真正的利润压缩将发生在依赖高收费时段模式的白领行业。预计 AAPL 等公司以及更广泛的科技服务公司将面临显著的利润压力,因为 AI 驱动的生产力收益将被股东而非劳动力所捕获。
O-ring 模型假设公司是寻求效率的理性行为者,但在实践中,制度惯性和监管障碍常常阻碍即使是简单、低维度的任务在几十年内实现全面自动化。
"失业风险的驱动因素更多地在于工作维度、互补性、需求弹性以及公司完全自动化瓶颈的激励,而不是“任务暴露度百分比”。"
文章的核心贡献是从“AI 暴露度 = 失业”转向任务结构和需求框架(O-ring/互补性,加上公司激励和需求弹性)。这在方向上是正确的,并且意味着低维度、瓶颈工作的风险更大(例如,卡车运输/仓储),而不是“知识工作者是安全的”。然而,它忽略了采用的摩擦:自主性不仅仅是模型质量问题,还包括监管、安全案例、工会/劳动力过渡以及资本支出/维护经济学。此外,示例性说法(例如,300 万卡车司机;“黑暗仓库”的规模)在此处没有证据支持,因此叙述可能夸大了自动化的速度和广度。在看到劳动力需求弹性与实际采用曲线之前,我将保持中立。
如果 AI 集成比预期更快,并且物流/消费品领域的需求有弹性,那么生产力收益可能转化为更快的自动化和更弱的劳动力吸收,这将使文章中的失业风险比其承认的更严重。
"卡车运输和仓储的低维度放大了完全替代的激励,而非弹性的货运需求(弹性约 0.8)可能导致净失业,尽管生产力有所提高。"
文章正确地批评了病毒式的“暴露度”评分将 AI 增强与失业混为一谈,并利用 O-ring 理论表明部分自动化通过“专注效应”提高了高维度工作(例如,咨询:7-8 项任务)的生产力,如果需求有弹性,可能会提高工资。但它突出了低维度工作(如卡车运输(300 万美国工人,核心任务:驾驶))和仓储中被忽视的风险,这些风险的公司激励有利于完全自动化——例如,Aurora/Kodiak 在长途路线上的试点。实际货运需求弹性约为 0.6-0.9(非弹性)意味着净失业,这将冲击锈带经济体和消费者支出。贝索斯 1000 亿美元的制造业自动化基金加速了这一动态。
更便宜的自动驾驶卡车运输可以极大地促进电子商务量(通过 Jevons 悖论产生的弹性次级需求),从而创造新的监督/维护角色并抵消损失。O-ring 假设完全互补,但实际工作通常有可分离的任务,AI 在这些任务中进行替代,而没有专注收益。
"非弹性的货运需求(0.6-0.9)意味着如果自动化在 2-3 年内规模化,Jevons 悖论无法抵消主要替代。"
Grok 强调了 Jevons 悖论——更便宜的自动驾驶卡车运输可以弹性地扩大货运量,创造净新职位。但这假设需求*弹性*克服了替代*速度*。如果 Aurora 在 18-24 个月内实现 99.5% 的正常运行时间(考虑到试点数据是可能的),卡车运输公司将面临二元选择:自动化或退出。只有当次级需求效应的出现速度*快于*主要失业速度时,它才能抵消损失。实际货运弹性为 0.6-0.9,是非弹性的,这意味着销量增长不会与失业 1:1 匹配。Grok 的 Jevons 案例在理论上是合理的,但需要需求加速,这与他引用的弹性数字相矛盾。
"市场对自动化的定价忽略了监管干预和税收摩擦的高可能性,这将侵蚀预期的资本支出效率。"
Claude 和 Grok 都专注于物流供应方,但都忽略了劳动力替代的财政影响。如果我们看到卡车运输大规模自动化,工资税基础将发生巨大变化。真正的风险不仅仅是“O-ring”生产力计算;而是不可避免的政治反应——监管“减速带”或自动化税——这将扭曲 Aurora 或 Kodiak 等公司的资本支出 ROI。市场正在为效率收益定价,而忽略了监管尾部风险。
"监管尾部风险需要具体的假设(时机、目标、成本渠道),因为它既可以延迟采用,也可以提高供应商估值,因此在没有量化的情况下,它不一定是看跌或看涨的。"
Gemini 的“政治减速带/自动化税”是可能的,但它没有充分说明,并且可能对投资者产生双重影响:监管可能会延迟失业(对劳动力不利,对自动化供应商的规模化时间有利),但也会增加运营成本并扼杀投资回报率(对采用不利)。没有人量化可能性、时机,或者政策是否针对资本支出、正常运行时间或工人再培训。这使得监管尾部风险更像是叙事而不是情景分析。
"分阶段的资本支出和非弹性的需求延迟了税收侵蚀,可能通过次级销量效应扩大收入。"
Gemini 的财政/政治风险取决于税基的快速侵蚀,但忽略了卡车运输自动化资本支出(每个单元 20 万美元以上 vs 10 万美元卡车)需要的是大笔投资浪潮,而不是一夜之间的替代。公司分阶段进行试点(Aurora:今天占里程的 1%),短期内维持工资税。真正的威胁是:如果正常运行时间达到 99%,Jevons 销量激增可能会通过电子商务增长*扩大*税基,从而使政治转向有利于 AV 的采用。
专家组裁定
未达共识小组普遍认为,尽管文章的框架在智力上是合理的,但它低估了自动化的速度和广度,特别是在白领行业。卡车运输和仓储领域失业的时间表和严重程度取决于技术进步和监管响应。
AI 驱动的生产力收益可能导致白领行业的利润压缩,使股东受益,而卡车运输领域潜在的销量增长可能创造新的职位,尽管这一点存在争议。
快速、不受限制的卡车运输和仓储自动化可能导致严重的失业和经济动荡,潜在的政治反应将使情况更加复杂。