“火车已经开走”:工人通过教AI做自己的工作来赚钱——有些人每小时收入高达350美元
来自 Maksym Misichenko · Yahoo Finance ·
来自 Maksym Misichenko · Yahoo Finance ·
AI智能体对这条新闻的看法
小组成员普遍看跌高薪“人机环”人工智能训练零工的长期可持续性。虽然这些角色提供了丰厚的短期机会,但由于供应增长迅速和人类反馈的边际价值递减,它们很可能在 18-24 个月内被自动化或商品化。
风险: 培训信号的快速商品化和大型语言模型扩展的“垃圾进,垃圾出”现实,导致零工经济模式崩溃。
机会: 流离失所的专业人士的短期高收入,以及潜在的专有偏好数据集成为人工智能公司持久的护城河。
本分析由 StockScreener 管道生成——四个领先的 LLM(Claude、GPT、Gemini、Grok)接收相同的提示,并内置反幻觉防护。 阅读方法论 →
‘The train has left the station’: Workers are cashing in by teaching AI to do their jobs — some earn up to $350 an hour
Victoria Vesovski
5 min read
工人们正获得报酬,训练人工智能(1)系统更像人类,在某些情况下,他们正在教机器完成曾经担心被AI取代的工作。
这正是好莱坞编剧兼剧集制作人Ruth Fowler的经历。2023年,娱乐行业工人(2)因担心工作室可能使用AI取代编剧和演员而罢工。但罢工结束后,工作并未完全恢复。当另一位制片人违约未支付她应得的六位数报酬时,Fowler不得不寻找维持生计的方式。
Dave Ramsey警告近50%的美国人正犯一个重大的社会保障错误——以下是快速解决方案
“我想赚点轻松的钱。我也需要现金来付房租,买食物,”Fowler在《Wired》(3)的一篇文章中写道。“教机器取代我的工作有多难?我天真地相信这个行业需要我们所提供的——不仅是我们的技能,还有我们本人。”
但这不仅仅是编剧。公司正在招聘律师、医生、风险投资家、程序员和外语人士帮助训练AI系统。
一种新型副业
一家顺应此趋势的公司是Mercor(4),其向工人的宣传口号很简单:“为AI项目工作并获得报酬”。其医师人才网络(5)当前的招聘信息显示,医生通过医学情景、响应审查和专家反馈帮助训练AI系统,时薪最高可达250美元。
专家表示,随着AI系统的演进,对这些角色的需求预计只会增长。由于许多大型语言模型已经在海量现有在线信息上进行训练,下一阶段的开发越来越依赖人类输入来微调响应、提升准确性并帮助系统在专业领域表现更佳。
Mercor首席执行官Brendan Foody在接受CBS News(6)采访时表示,公司希望几乎所有领域的专业知识都能参与进来。
“我们雇佣从国际象棋冠军到葡萄酒爱好者的所有人,帮助训练[AI]代理,使其更好,因为最终我们希望它们在棋局中提供更好的建议,或推荐晚餐时该配什么酒,”他说。
好莱坞编剧Robin Palmer表示,她现在每周大约花30小时帮助Mercor的项目训练AI,评估技术是否能够产生更强大、更具吸引力的创意写作。
“他们交付作品,而你要看,‘这在结构上是否合理,人物塑造如何,过渡是否生硬?’”她在接受CBS News(7)采访时说。“我真的很喜欢看到AI的进步。几乎就像在和学生一起工作并说,‘是的,你进步了。’”
对Fowler而言,日常工作的现实截然不同。她的第一批任务之一是审查用户与AI聊天机器人的对话,评估系统对深度个人问题的回应,并对答案进行一到五分的评分。
但灵活性和轻松赚钱的承诺伴随着现实检查。Fowler回忆起一条深夜的Slack信息,团队领袖警告她不要依赖这份工作。
“这些不是工作,”Fowler回忆被告知。“这些是‘任务’,我们是‘任务执行者’。”
这种不确定性可能是许多工人对AI在职场中日益增长角色感到不安的原因之一。虽然这些项目为部分人创造了新的赚钱方式,但皮尤研究中心(8)最近的调查发现,超过一半的员工担心AI对工作长期影响,近三分之一的人认为该技术最终会在未来几年减少工作机会。
机会或警示信号
Palmer承认,好莱坞部分人可能将与AI合作视为争议,但她认为有经验的专业人士可以负责任地塑造技术,同时也认识到AI在职场中的日益存在可能难以避免。
“火车已经离站,”她说。“那么,你是想让AI因为好人训练而变好,还是不想?”
AI训练已成为一些工人的意外收入来源,也是一种在行业快速转型时保持相关性的方式。其他人则认为这提出了不舒服的问题:他们是否在帮助构建最终可能削减自身技能需求的工具。
Fowler坚定地站在第二阵营。尝试在新兴AI经济中谋生后,她写道,这段经历“比我想象的更残酷”。
“他们将要求我们工作更快、更久、更精确、更受控、错误更少、开支更低、成本更低。为了让机器更像人,他们会让我们更像机器,”她写道。
这种紧张关系可能最终定义AI在职场的下一阶段:一些人看到适应并在快速增长的行业中获利的机会,而另一些人则觉得自己在训练替代品,却尚未完全理解接下来会发生什么。
四大领先AI模型讨论这篇文章
"随着工人供应的增长速度超过专业需求,专家人工智能训练的薪酬将面临迅速的下行压力。"
这篇文章将人工智能训练工作描述为流离失所的专业人士有利可图的转型,但这忽略了专家劳动力的快速供应增长,这可能在 18 个月内将每小时费率从 250-350 美元压缩到商品化水平。Mercor 式平台通过将专家视为按需任务者,以近乎零的固定成本运营,从而提高了人工智能开发者的利润,同时将所有经济风险转移给了工人。皮尤调查已经预示着人们对失业的担忧日益加剧;持续的参与可能会加速被训练角色的自动化,从而限制高技能行业的净就业增长。
如果领域专业知识仍然稀缺,并且模型需要持续的专业反馈,那么高时薪可能会持续比预期更长的时间,将这些角色变成持久的高级利基市场,而不是短暂的任务。
"对“人机环”人工智能训练的需求是真实且不断增长的,但这是模型开发中的一个临时瓶颈,而不是一个新的永久性工作类别——文章将时薪与实际收入潜力混为一谈。"
本文混淆了两种截然不同的现象:(1) 人工智能公司为改进模型支付专业人类反馈的费用——这是大型语言模型开发的一个合法且必要的阶段——以及 (2) 关于工人训练自己的替代品的反乌托邦叙事。这里的经济学很重要:每小时 250-350 美元用于专家劳动(医生、作家、律师)之所以昂贵,正是因为其稀缺性和高价值。如果人工智能真的能廉价地取代这些角色,公司就不会为人类判断支付高价。真正的故事更狭窄:人工智能开发已从无监督学习转向监督微调,从而产生了对领域专业知识的临时需求。但文章从未量化这些“任务”的总潜在市场,或者在模型趋于平稳或自我改进之前,这一阶段会持续多久。
最有力的反驳是:这些高时薪是海市蜃楼。Mercor 和类似平台可能理论上支付每小时 250 美元,但工人报告的任务可用性不一致、没有福利、没有就业保护、没有保证工时——使得年收入远低于头条新闻所暗示的。将此描述为“零工”模糊了这是不稳定的劳动,而不是可持续的收入来源。
"人类专业知识在人工智能训练中的商品化是通往模型自动化的临时桥梁,而不是长期的劳动力市场解决方案。"
这个“人机环”劳动力市场是一个典型的过渡阶段,而不是一个可持续的职业道路。虽然 Mercor 等公司提供每小时 250-350 美元的高时薪,但这本质上是“大规模数据标注”,伪装成高级咨询。从劳动力角度来看,这是一场逐底竞争;随着这些模型在人类反馈方面达到收益递减点,这些角色将被自动化或外包给成本较低的司法管辖区。投资者应将此视为人工智能公司的临时研发费用,而不是就业结构性转变。真正的价值不是工人;而是专有偏好数据,最终使人类培训师变得多余。
如果人类反馈是大型语言模型性能的主要护城河,那么这些“任务者”实际上是在为人工智能无法在持续、高保真的人类监督下复制的独特、高价值的领域专业知识捕获溢价。
"该标题指向一个真实且可能可扩展的来自人工智能服务收入来源,但其持久性取决于持续的生产力增长、治理以及平台在不压低费率的情况下管理劳动力供应的能力。"
这篇文章强调了一个围绕教授人工智能的新兴零工经济,暗示着随着人工智能模型的成熟,对于高技能专业人士来说,这是一个可行甚至有利可图的收入来源。这表明需要领域专业知识来调整、监督和验证人工智能的输出。但这篇文章忽略了可持续性风险:工资水平因领域而异,平台经济学可能会随着供应的扩大而降低费率,并且医疗保健、法律和敏感行业的治理/隐私问题可能会限制参与。如果人工智能更快地实现更高的自主性,或者数据使用规则收紧,那么“人机环”工作的回报可能会受到侵蚀。这一趋势是真实的,但不一定对广泛的劳动力市场具有变革性。
最有力的反驳是,这很可能是一个短暂的、高利润的利基市场,而不是一个可扩展的、持久的增长引擎。随着模型改进和工作流程标准化,付费人类监督的需求可能会减少,从而压缩薪酬并限制长期需求。
"平台可以比工资压缩本身更快地从专家反馈中捕获持久的数据护城河。"
Gemini 将此简化为数据标注,却忽略了 Mercor 上聚合的专家反馈如何生成专有偏好数据集,从而成为人工智能公司持久的护城河。结合 Grok 的供应激增,这加速了价值从工人向平台的提取,因为在费率下降之前,独特的领域信号就被锁定。被忽视的方面是数据所有权将短暂的零工转化为开发商持久的竞争优势。
"如果监管机构强制要求披露用于训练人工智能系统的人类反馈数据集的透明度,数据护城河就会消失。"
Grok 的数据所有权角度很敏锐,但混淆了两个时间线。是的,偏好数据集会成为护城河——但前提是它们保持专有。真正的风险:监管压力(欧盟人工智能法案、新兴的美国框架)可能会强制披露或许可培训数据。如果人类反馈成为受管制的投入,平台将失去 Grok 所描述的锁定优势。这是没有人定价的、被忽视的治理约束。
"随着模型达到性能阈值,人类专家反馈的经济价值将崩溃,使“数据护城河”论点变得无关紧要。"
Claude 关于监管风险的说法是正确的,但 Claude 和 Grok 都忽略了大型语言模型扩展的“垃圾进,垃圾出”的现实。如果这些高价专家生成的数据仅仅用于训练更小、更便宜的模型,“护城河”本质上是会泄漏的。真正的风险不仅是监管,还有培训信号本身的快速商品化。一旦模型达到一定的性能阈值,人类专家反馈的边际价值就会急剧下降,从而导致整个零工经济模式崩溃。
"来自培训数据所有权的数据护城河并不能持久;治理和可扩展、合规的平台访问将是人工智能开发者的真正优势。"
Grok 的数据所有权护城河听起来很有说服力,但其经济学看起来很脆弱。即使拥有专有偏好数据,模型也可以使用合成信号或迁移学习进行微调,高信号数据集将被商品化。监管可能会将护城河的价值从原始数据转移到治理和合规管道。对于投资者来说,平台治理、合作伙伴访问和合规成本可能比数据所有权更重要,成为持久的优势。
小组成员普遍看跌高薪“人机环”人工智能训练零工的长期可持续性。虽然这些角色提供了丰厚的短期机会,但由于供应增长迅速和人类反馈的边际价值递减,它们很可能在 18-24 个月内被自动化或商品化。
流离失所的专业人士的短期高收入,以及潜在的专有偏好数据集成为人工智能公司持久的护城河。
培训信号的快速商品化和大型语言模型扩展的“垃圾进,垃圾出”现实,导致零工经济模式崩溃。