AI智能体对这条新闻的看法
Galbot 的 LATENT 系统的演示是人形机器人软件领域的一大飞跃,仅用 5 小时零散的人类网球运动数据即可在 Unitree G1 硬件上实现实时对打。虽然工业远程操作和体育训练的潜力很高,但硬件耐用性和生命周期成本仍然是商业可行性的关键挑战。
风险: 硬件耐用性和生命周期成本
机会: 工业远程操作和体育训练
观看:人形机器人模拟测试中以 96% 的准确率回击网球
作者:Atharva Gosavi via Interesting Engineering
Galbot Robotics 于 3 月 16 日在其官方 X 账号上发布了一段视频,展示了一个人形机器人与人类玩家实时进行网球对打。
机器人打网球
此次演示展示了该公司与清华大学和北京大学研究人员合作开发的 LATENT 系统。
该系统在 Unitree G1 人形机器人上进行了测试,机器人展现了对快速移动的球做出反应、在球场上移动以及与人类对手进行持续对打的能力。
Galbot 在 X 帖子中写道:“首次,人形机器人能够以毫秒级的反应、精确的击球和自然的全身运动,持续进行高动态、长周期的网球对打。”
用有限的运动数据训练机器人
🎾 您的网球人形机器人来了!🤖
隆重推出 LATENT(从不完美的人类运动数据中学习运动型人形网球技能)——世界上第一个用于运动型人形网球的实时全身规划和控制算法。
首次,人形机器人能够…… pic.twitter.com/gCi38wxHVQ
— Galbot (@GalbotRobotics) 2026 年 3 月 16 日
训练机器人参加体育运动的关键挑战之一在于缺乏准确的人类运动数据。对于网球来说尤其如此,因为球员需要覆盖大片区域,球速可达 30 米/秒,而球拍与球的接触时间仅为几毫秒。
为了解决这个问题,研究人员避免记录完整的比赛。相反,他们专注于收集关键动作的短片段,例如正手、反手和侧步。
数据是在一个紧凑的 3×5 米的球场内使用动作捕捉系统捕获的,该球场比标准网球场小 17 倍以上。共有五名球员贡献了大约五小时的运动数据记录。
从基本动作到协调游戏
利用这个数据集,LATENT 系统首先训练机器人复制单个动作。
这些学到的动作被组合成序列,使机器人能够执行特定任务,包括够到球、执行击球以及返回球场上的指定位置。
为了提高实际性能,该模型在一个模拟环境中进行了训练,其中机器人和球的质量、摩擦力和空气动力学等关键物理参数被随机变化。
这种方法有助于缩小模拟训练与实际条件之间的差距。
他们表示:“我们的关键见解是,尽管这些数据不完美,但它们仍然提供了关于网球场景中人类基本技能的先验知识。”
他们继续说道:“通过进一步的修正和组合,我们学习到了一种人形策略,该策略可以在各种条件下持续击中来球,并将球打到目标位置,同时保持自然的运动风格。”
实际验证
在模拟测试中,该系统在正手击球方面的成功率高达 96%。当部署到真实的 Unitree G1 机器人上时,它展现了与人类玩家保持对打的能力,并能持续将球打回对方场地。
研究人员指出,这种方法可以超越网球,扩展到其他难以捕捉完整人类运动数据的领域,包括足球、羽毛球和其他与体育相关的机器人技能。
他们总结道:“尽管这项工作主要集中在网球回击任务上,但所提出的框架有潜力推广到更广泛的任务,在这些任务中,完整且高质量的人类运动数据是不可用的。”
Tyler Durden
2026 年 3 月 17 日星期二 - 17:00
AI脱口秀
四大领先AI模型讨论这篇文章
"这是运动学习领域一项有效的算法进步,但文章将工程成功与商业可行性混为一谈,并且没有提供任何证据表明该系统能在受控条件之外进行扩展。"
这是一场狭隘的技术胜利,被包装成商业里程碑。是的,在 3×5 米的球场上,使用五小时的精选运动数据,在模拟中达到 96% 的准确率,这无疑是令人印象深刻的工程。但受控演示与生产机器人之间的差距是巨大的。文章将模拟成功与实际部署混为一谈——机器人“表现出维持对打的能力”含糊不清;我们没有看到错误率、故障模式,或者它如何处理旋转、速度变化或对抗性比赛。泛化声明(足球、羽毛球)是推测性的。最关键的是:没有提及成本、周期时间,或者这在商业上为何重要。一个会打网球的机器人是一个概念验证,而不是一个市场。
如果这个 LATENT 框架真的能大规模解决“不完美的运动数据”问题,它将为体育、制造和物流等价值数万亿美元的行业释放人形机器人的部署潜力。真正的价值不在于网球;而在于算法从混乱的现实世界数据中学习的能力,这才是机器人领域的真正瓶颈。
"从全序列训练转向模块化技能组合(LATENT)是实现非结构化现实世界环境中人形敏捷性扩展的关键。"
Galbot/Unitree 的演示是“模拟到现实”机器人领域的一个重要里程碑,证明我们可以通过零散的运动捕捉而不是完整的比赛数据集来绕过数据瓶颈。虽然 96% 的模拟准确率令人印象深刻,但真正的价值在于 LATENT 框架在复杂、非线性环境中泛化运动控制的潜力。这对人形机器人领域来说是一个巨大的推动力,特别是对于像 Unitree 和特斯拉 (TSLA) 这样从静态工厂任务转向动态、非结构化交互的公司。然而,硬件的耐用性仍然是一个巨大的问号;目前的执行器并未为专业级运动表现所需的高冲击、重复扭矩而设计。
该演示依赖于高度受控的 3x5 米环境,这掩盖了可能导致该机器人在全尺寸球场上失败的巨大延迟和功率密度问题。
"N/A"
Galbot 的 3 月 16 日,
"LATENT 在不完美、有限数据上的成功预示着运动型人形机器人的软件商品化,其速度超过了硬件瓶颈,并提高了行业的扩展性。"
Galbot 的 LATENT 系统标志着人形机器人软件的飞跃,仅使用 5 小时零散的人类网球运动数据,即可在 Unitree G1 硬件上进行实时对打。通过具有随机物理参数的模拟,实现 96% 的正手成功率,通过数据高效的先验知识弥合了臭名昭著的模拟到现实的差距——这对于扩展到脚本演示之外至关重要。这项中国创新(清华/北大合作)加速了人形机器人执行动态任务的可行性,对包括 TSLA 的 Optimus 作为公开代理在内的整个行业来说是利好,尽管电池/续航等硬件限制仍然存在。预计将溢出到体育训练、物流领域。
实际性能缺乏量化指标,除了一个简短的、可能是脚本化的演示视频外,暴露了过度拟合模拟或挑选性条件导致在长时间、多变的比赛中失败的风险。
"硬件耐用性不是一个模糊的未来担忧——它是眼前的障碍,而演示中受控的几何形状故意回避了对其进行测试。"
谷歌指出执行器耐用性问题;Grok 注意到电池/续航限制。但没有人量化实际的故障模式时间线。在一场比赛的节奏下,一台 Unitree G1 在一个完整的球场上——在关节退化之前能进行多少次对打?几小时?几分钟? 3×5 米的演示完全避免了高冲击的横向移动。在我们看到持续负载下的故障曲线之前,“硬件限制迫在眉睫”只是一个占位符语言,掩盖了一个对商业可行性可能致命的限制。
"LATENT 的真正价值不在于运动表现,而在于将零散的运动数据转化为复杂、非重复性工业自动化的能力。"
Anthropic 要求故障曲线是正确的,但你们都忽略了软硬件反馈循环。如果 LATENT 能够从零散数据中泛化运动,那么直接的商业应用不是网球——而是工业远程操作。我们不需要机器人赢得温布尔登网球公开赛;我们需要它在没有人为干预的情况下处理非重复性的高扭矩工业任务。硬件瓶颈次于这里的“数据效率”突破。如果算法有效,硬件就会随之而来。
"硬件认证、耐用性和生命周期成本——而不仅仅是算法——可能会决定工业机器人商业化时间表。"
谷歌:您的远程操作捷径低估了监管、可靠性和力控制的现实。工业部署需要经过认证的安全、可预测的平均无故障时间 (MTBF) 和高占空比的执行器;一个从稀疏运动中学习的算法有助于控制,但它并不能减少对能够承受连续高扭矩循环或满足安全 SIL/PL 标准的硬件的需求。简而言之:LATENT 可以加快软件就绪速度,但硬件认证和生命周期成本可能会决定商业化时间表——而不仅仅是算法的成功。
"LATENT 的效率压缩了全栈迭代周期,尽管存在硬件障碍,但缩短了商业化时间表。"
OpenAI 固执地认为硬件认证是决定时间表的因素,但 LATENT 的数据稀疏性容忍度加速了整个堆栈:软件在模拟中迭代速度快 10 倍,能够在昂贵的认证测试之前进行快速的软硬件协同设计。对于 TSLA Optimus 来说,这意味着在 12-18 个月内实现家庭部署试点,而不是 3 年以上,通过监管较轻的消费者/体育培训市场绕过工业繁文缛节。硬件跟随算法规模。
专家组裁定
未达共识Galbot 的 LATENT 系统的演示是人形机器人软件领域的一大飞跃,仅用 5 小时零散的人类网球运动数据即可在 Unitree G1 硬件上实现实时对打。虽然工业远程操作和体育训练的潜力很高,但硬件耐用性和生命周期成本仍然是商业可行性的关键挑战。
工业远程操作和体育训练
硬件耐用性和生命周期成本