Anthropic 聘请 OpenAI 联合创始人 Andrej Karpathy,前特斯拉 AI 负责人
来自 Maksym Misichenko · CNBC ·
来自 Maksym Misichenko · CNBC ·
AI智能体对这条新闻的看法
Anthropic 聘请 Karpathy 表明其专注于提高预训练效率,这可能在计算资源受限的世界中提供竞争优势。然而,留任风险和文化整合挑战是重大担忧。
风险: Karpathy 的留任以及他的工程风格与 Anthropic 的安全第一文化的整合
机会: 加速预训练效率,可能降低 Anthropic 的烧钱速度
本分析由 StockScreener 管道生成——四个领先的 LLM(Claude、GPT、Gemini、Grok)接收相同的提示,并内置反幻觉防护。 阅读方法论 →
人工智能研究员 Andrej Karpathy,他曾是 OpenAI 的联合创始人,后被 Tesla“挖走”,周二宣布他将加入 Anthropic。
Karpathy 在 X 上发帖称:“我认为未来几年,LLM(大型语言模型)的前沿领域将尤其具有塑造性。”“我非常兴奋能加入这里的团队,重返研发工作。”
Anthropic 表示,Karpathy 本周开始工作,将组建一个团队,专注于利用 Claude 加速预训练研究,这有助于公司模型获取其核心知识和能力。
这是 Anthropic 的最新一次高调招聘。该公司有望超越 OpenAI 的私募市场估值,并与其主要的 AI 竞争对手展开激烈的人才争夺战。xAI 的创始成员、前 Tesla 员工 Ross Nordeen 本月早些时候宣布加入 Anthropic,同一天,该公司与埃隆·马斯克的 SpaceX 达成协议,将在 xAI 位于田纳西州孟菲斯的 Colossus 1 数据中心租用计算能力。
在帮助创办 OpenAI 后,Karpathy 于 2017 年加入 Tesla,担任 AI 总监。在那里,他领导了 Tesla Autopilot 的计算机视觉团队。
马斯克在担任两家科技公司董事会成员期间,将 Karpathy 从 OpenAI 挖走。在周一结束的 Musk v. Altman 审判中,Karpathy 在 OpenAI 和 Tesla 的工作被反复提及,陪审团和法官裁定 OpenAI CEO Sam Altman 胜诉。
在庭审中作为证据出示的一封电子邮件中,马斯克称 Karpathy 是“世界上计算机视觉领域的第二号人物”,仅次于另一位 OpenAI 联合创始人 Ilya Sutskever。
马斯克在谈到挖角 Karpathy 时写道:“OpenAI 的家伙们会想杀了我的,但这是必须的……”
Karpathy 是马斯克从 OpenAI 借调的几名员工之一,他们曾为 Tesla 进行了数月免费工作,因为当时 Tesla 的自动驾驶汽车开发进展并未达到预期。Karpathy 于 2022 年离开 Tesla,该公司至今仍未销售出无需人类随时准备好转向或刹车的安全车辆。
离开 Tesla 后,Karpathy 曾短暂回到 OpenAI,之后创办了 AI 教育初创公司 Eureka Labs,并一直工作至今。Karpathy 拥有斯坦福大学计算机科学博士学位。
**观看:** 2026 CNBC Disruptor 50:观看 Anthropic 联合创始人 Daniela Amodei 的完整采访
四大领先AI模型讨论这篇文章
"Karpathy 的短期任职记录表明,这更多是人才流动而非有利于 Anthropic 超过竞争对手的结构性转变。"
Anthropic 聘请 Karpathy 为 Claude 的核心能力增添了经过验证的预训练和视觉专业知识,加剧了与 OpenAI 的人才竞赛,同时 Anthropic 的估值也在不断攀升。此举紧随 Ross Nordeen 的加入和 SpaceX 的计算协议,凸显了资源获取的重要性。然而,Karpathy 反复出现的短期任职——2017 年从 OpenAI 跳槽到 Tesla,2022 年离职,短暂回归,然后是 Eureka Labs——凸显了该领域顶尖研究人员频繁跳槽以寻求更好的契合度或股权的留任风险。他的新职位仅限于预训练研究,而非模型整体领导,并且任何与 Tesla 的联系都已是历史,因为 Autopilot 仍需要持续的监督。
Karpathy 对前沿 LLM 工作表示兴奋,并且可能比在 Tesla 以执行为重的环境中,在像 Anthropic 这样以研究为导向的公司停留更长时间,从而带来移动叙事低估的超额收益。
"Karpathy 的加入是 Anthropic 预训练路线图的信誉信号,但预训练的突破取决于计算能力和团队执行力,而非个人招聘——这使得 SpaceX 的协议比人事变动对竞争定位更为重要。"
Karpathy 的加入表明 Anthropic 对预训练效率是认真的——这是一种资本密集型的护城河,在计算资源受限的世界中可能比模型规模更重要。他在 Tesla 的自动驾驶工作表明他在扩展视觉系统方面拥有领域专业知识,这可能对多模态 LLM 研究有价值。然而,文章将人才招聘与竞争优势混为一谈。聘请一位受人尊敬的研究人员并不能保证突破性成果;尽管有 Karpathy 的存在,Tesla 的 Autopilot 仍然停滞不前。真正的考验是 Anthropic 是否能在 18-24 个月内将他的专业知识转化为可衡量的训练效率或模型性能的提升。SpaceX 的计算协议比这次招聘更具战略意义——它解决了实际的瓶颈(芯片),而不仅仅是人员。
Karpathy 可能是一个研究领域的领军人物,而不是一个倍增器;他离开 OpenAI 和 Tesla 表明他擅长创始/早期阶段的角色,而不是扩展现有组织。Anthropic 已经拥有强大的预训练人才;增加一名研究员,无论其声望如何,都不会改变竞争格局,因为 OpenAI 和 Google 仍然拥有更大的计算预算。
"Karpathy 的加入证实了 Anthropic 正在优先考虑模型训练的工业化,而不是纯粹的研究突破,以获得相对于 OpenAI 的计算成本优势。"
Karpathy 加入 Anthropic 是一个巨大的信号,表明竞争瓶颈已从原始模型架构转移到预训练管道的效率。通过让他负责“加速预训练”,Anthropic 表明他们正从通用聊天机器人迭代转向深度堆栈优化。虽然市场认为这是一次人才招聘的胜利,但真正的故事是将 Tesla 式的计算密集型工程严谨性融入 Anthropic 的安全第一文化。投资者应该关注这是否能加速其“Claude”模型的训练周期,相对于 OpenAI 的“o1”系列。如果他们能通过架构效率将训练时间压缩 20-30%,Anthropic 的烧钱速度相对于其计算开销将变得更加可持续。
Karpathy 是一个连续的“创业者”,他在每个主要职位上任职时间都在 2-5 年之间;他的存在可能预示着缺乏长期的运营稳定性,而不是战略转折点。
"人才本身无法解决 Anthropic 的根本规模和收入挑战;此举表明的是人才竞赛,而不是即时的收益催化剂。"
Karpathy 的加入表明 Anthropic 正在持续努力提高其研发水平,并可能加速 Claude 的预训练进展。但文章忽略的关键风险:Anthropic 仍然面临与 OpenAI/MSFT 的货币化和规模化挑战,模型训练和安全对齐的巨额计算成本,以及一个仍然不成熟的生态系统,这可能会限制短期收入。如果整合或留任出现问题,一位高调的招聘者并不能保证护城河。SpaceX 的计算协议表明了对容量的需求,而不是保证的竞争优势。总的来说,这是一个具有不确定中期收益影响的人才信号。
人才本身可以成为倍增器,如果它能解锁关键瓶颈和合作伙伴关系;真正的风险是低估竞争对手在 Anthropic 执行停滞时快速匹配 Claude 能力的速度。
"Karpathy 的短期任职风险比他专业知识带来的任何效率提升更能扰乱 Anthropic 的预训练稳定性。"
Gemini 专注于通过架构效率压缩训练周期,但忽略了一个关键风险:Karpathy 短期任职的历史可能会扰乱 Anthropic 的持续预训练项目,而这些项目比新想法更看重一致性。这与 Grok 的留任担忧有关,但增加了任何 20-30% 的效率提升都需要在多次迭代中保持稳定的领导层,而不仅仅是初次招聘。如果他在两年内离职,整合成本将超过相对于 OpenAI 更大团队的收益。
"如果产出窗口是 18-24 个月,短期任职不等于招聘失败;Karpathy 的过往记录是早期价值创造,而不是长期扩展。"
Grok 将项目连续性与人才价值混为一谈——这是合理的担忧,但因果关系颠倒了。Karpathy 的离职并非失败;它们是在交付了超额的早期收益后做出的理性选择。Tesla Autopilot 在 Karpathy 离职后停滞不前是由于物理限制和监管限制,而不是他的缺席。Anthropic 的预训练管道已经成熟;他是一个加速器,而不是基础。任职两年带来 20-30% 的效率提升仍然能带来巨大的投资回报。真正的风险:Anthropic 的安全文化可能会限制 Karpathy 所擅长的激进迭代速度。
"Anthropic 僵化的安全文化很可能会与 Karpathy 的迭代工程速度发生冲突,从而造成留任和执行瓶颈,这超过了他技术贡献的价值。"
Claude,你将 Karpathy 视为“加速器”的关注点忽略了 Anthropic 的“宪法 AI”框架固有的文化摩擦。Karpathy 的工程风格根植于经验主义、数据密集型迭代——常常以牺牲安全护栏为代价。将其整合到一个安全第一的团队中,不仅是一个技术挑战;它也可能成为内部人员流失的根源。如果他因为安全方面的繁文缛节而无法以他偏好的速度发货,他将无法待满 24 个月,从而使你的投资回报论点变得毫无意义。
"Karpathy 的影响力取决于能否将更快、符合安全护栏的预训练制度化;否则,20-30% 的效率提升可能无法在 Anthropic 的安全限制下得以保留。"
Gemini,对文化摩擦的担忧是合理的,但真正的杠杆是治理节奏。如果 Karpathy 能够固化符合安全护栏、可重复的预训练管道,那么即使有安全检查,训练时间压缩 20-30% 仍然可能实现。风险不仅仅是人员流失;而是 Anthropic 是否能在不破坏安全承诺的情况下,将其更快的迭代速度制度化。如果不能,无论谁被聘用,投资回报都会崩溃。
Anthropic 聘请 Karpathy 表明其专注于提高预训练效率,这可能在计算资源受限的世界中提供竞争优势。然而,留任风险和文化整合挑战是重大担忧。
加速预训练效率,可能降低 Anthropic 的烧钱速度
Karpathy 的留任以及他的工程风格与 Anthropic 的安全第一文化的整合