首次战胜高水平人类选手,打乒乓球的机器人来了
想象这样一个场景:一张标准乒乓球台,一边是挥洒自如的人类高手,另一边则是一台机械臂。球如闪电般掠过球网,肉眼几乎只能捕捉到一道残影。就在这电光石火之间——0.3秒,机械臂动了,精准地将球回击过去。几个回合的快速对拉后,球落地了。得分的是机械臂。
这个看起来有些“朴素”却速度惊人的家伙,名叫Ace,来自索尼AI。它可不是普通的陪练机器人,而是首个能在标准比赛中击败高水平人类选手的乒乓球机器人,这项成果刚刚登上了《自然》杂志。
要知道,过去的乒乓球机器人大多在高度简化的“模拟赛”中运行,比如用发球机代替真人、缩小球台,甚至禁止对手使用旋转球。而Ace进行的是实打实的标准比赛:标准场地、真实规则,对手是货真价实的人类精英。这件事的意义,远不止“机器人会打球”这么简单。
乒乓球比赛,对机器人来说有多难?
或许你会觉得,AI既然能在棋盘和虚拟游戏中所向披靡,打乒乓球应该也不在话下。但这里存在一个根本性的误解:棋盘和游戏画面再复杂,终究是数字世界里的抽象符号。屏幕里的棋子不会因手抖而掉落,游戏角色也无需担心关节会撞到实物。
真正的挑战,在于让AI走进充满不确定性的物理现实。而乒乓球,几乎集齐了机器人最头疼的几大难题。
首当其冲的是
速度
旋转
第三是
动态对抗
最后是
物理约束
把这四重挑战叠加在一起,就不难理解为何乒乓球机器人如此难造。它要求感知、决策、控制这一整条链路,必须在极短的时间内无缝衔接、精准配合。
Ace是如何突破重围的?
Ace的解决方案,可以粗略理解为“看、想、动”三个紧密协作的层级。
看:捕捉瞬息万变
Ace使用多台普通相机来三维定位球的位置,同时借助一种特殊的“事件相机”来估算球的旋转。
事件相机的工作原理与普通摄像头截然不同。普通相机像定时拍照,每秒截取几十张图。但对于高速运动的乒乓球,这种方式存在延迟和运动模糊的问题。事件相机则让每个像素点独立工作,只记录亮度变化的“事件”——哪里有动静,哪里就立刻上报。这好比一群高度警觉的哨兵,无需等待统一指令,一有风吹草动即刻发出信号。这种机制的时间分辨率极高,能清晰捕捉高速旋转球体表面的细微亮度变化模式,再通过算法反推出旋转的方向与速度,让Ace真正“看清”来球。
想:在仿真中“死”无数次
工程师不可能为无数种来球情况预先编写死板的动作规则。Ace的核心“大脑”依靠强化学习:在高度仿真的虚拟环境里,它通过海量的试错来学习——面对特定速度、旋转和落点的来球,若想回击出某种落点和旋转,该如何挥拍。
整个学习过程完全在仿真世界中完成,这让机器人可以“死”无数次:撞台、漏球、动作太慢……都可以推倒重来。若在现实世界进行这种强度的试错,机器人早就损毁,时间成本也无法承受。待仿真中学成的策略足够成熟,再将其迁移到真实的机械臂上。

乒乓球机器人的“超级大脑”丨Sony AI
动:从理想指令到安全执行
即便策略网络给出了“理想动作”,也不能直接生硬地丢给机械臂执行。因为理想动作可能要求机械臂在0.1秒内完成物理上不可能的大幅度挥拍,或者运动轨迹会导致关节撞上台沿。
Ace的解决之道是分层处理:策略网络输出一个短期目标,随后由轨迹优化与安全模块接手,将其转化为一系列真正可执行、符合物理约束的连续运动指令。简而言之,AI负责制定战略意图,底层控制系统负责在现实中安全、精准地实现它。

ACE的机械臂拥有8个自由度,回球速度可达19.6米/秒丨Sony AI
这三层系统紧密配合,将从“看见球”到“击出球”的整个闭环压缩在不到半秒内完成。而且这不是一次性的表演,而是一场比赛中需要连续、稳定执行数十甚至上百次的高压任务。
实战表现:优势与短板
在与5位球龄超过10年的精英选手的比赛中,Ace赢下了其中3场。面对2位职业选手时虽均告落败,但也拿下了一局。更重要的是,它能稳定回击高速和高旋转球,这表明它的得分并非依靠偶然运气。

Ace在今年4月对战了5位精英选手和2位职业选手。更早之前,它还曾与日本排名前十、世界排名第64位的选手吉村和弘切磋(并落败)。
一个有趣的现象是,
Ace的球风与人类截然不同
人类高手的得分利器常常是势大力沉、兼具速度与旋转的“爆冲”,力求一板制胜。Ace的优势则更多体现在
超乎寻常的稳定性
当然,Ace的短板也很明显。它目前仍无法战胜顶尖职业球员。更重要的是,人类高手不仅在回球,更在进行复杂的战术博弈:阅读对手意图、设置陷阱、控制节奏变化。目前的Ace还无法完成这种层级的战术思考。论文作者也指出,未来的重要方向包括更强大的人类对手行为建模,以及能在真实互动中持续改进的在线学习能力。
让机器人打乒乓球,意义何在?
如果仅仅将目光局限于“机器人能否取代人类体育冠军”,那么这项研究或许没那么激动人心,毕竟Ace目前还打不过世界排名前64的选手。
但它真正展示的,是一种新阶段的AI能力:不再局限于数字空间的抽象推理,而是能够以接近人类极限反应的速度,在真实的物理世界中与人进行实时互动、对抗并调整。这类能力的成熟,其影响绝不会止步于球桌边。
可以设想未来服务机器人的场景:你在厨房忙碌,需要机器人协助。当你说“把那个碗递给我”,机器人需要准确识别“那个碗”是哪一个,判断你当前的位置和姿势,然后以恰当的速度、角度和轨迹将碗平稳递到你手边——不能太慢耽误事,不能太快让人惊吓,更不能撞到你的手。这背后需要的,正是高速、精准的感知-决策-动作闭环能力。
乒乓球,只是一个足够直观、也足够艰难的测试舞台。下一个舞台会是什么,尚不可知。但可以肯定的是,通往现实世界智能体的大门,已经被推开了一道缝隙。