
联系我们
400-8768208
时间: 2025-10-31 21:56:39 | 作者: 曲棍球台
在这篇论文中,研讨者们提出了一套结合模型规划与强化学习的分层结构,完结了人形机器人在亚秒级(sub-second)反响下的安稳接连对打。
总的来说,为了教机器人打乒乓球,研讨团队提出了一个将高层规划与低层操控分隔处理的结构。
其间,在高层规划中,根据模型的规划器(model-based planner)能够导航球的轨道,并猜测击球方位、速度和机遇。
在低层结构中,根据强化学习(RL)的全身操控器,能够根据规划器的猜测,生成和谐的手臂和腿部动作来履行与人类类似的冲击动作。

具体来说,研讨团队直接将宇树G1的手掌变成了乒乓球拍,并让它站在一张规范尺度的乒乓球台上进行练习。
在感知方面,研讨采用了九个OptiTrack摄像头(运转频率为360 Hz)来追寻球的方位,这达到了毫米级的精度。
在规划方面,根据模型的规划器在每个时刻步接纳球的方位数据,并猜测球拍的击球方位、速度和机遇。
此外,为了鼓舞机器人做出类似人类的挥拍动作,研讨人员还在战略练习中加入了人类动作参阅(正手和反手)。
经过人类动作参阅进行练习,机器人产生了与人类动作十分类似的击球行为:例如下图中机器人击球时的腰部旋转。

在实在国际的试验中,团队向机器人抛掷了26个球,机器人成功回球24次,击中后未回球1次,彻底失球1次,达到了96.2%的击球率和92.3%的回球率。
并且,就像咱们最初说到的,G1在与人类对手对打时,完结了多达106次的接连击球,这一连拍远超于了休闲人类玩家的水平。
最终,值得一提的是,除了与人类进行对战,机器人也能够在彻底自主的匹配环境中继续进行对战。

在前段时刻的机器人运动会上,咱们已看到了不少机器人参加的运动项目(如跑步、拳击、足球等)。
而在实在的日子中,机器人常常需求在动态环境下与快速移动的物体交互,这种交互从根本上讲更难:
由于它们不只需求各个关节的和谐操控,还需求在极限时刻丈量内运转的精细感知-举动闭环,而乒乓球正是此类交互的绝佳比如。
相对于网球或羽毛球等运动,乒乓球的齐头并进更短、攻防转化更快、反响时刻窗口更小(球速超越5米/秒)。
这就意味着机器人体系必须在瞬间内完结感知、猜测、规划和击球以及与移动或静态的不同操作。
更难的是,成功的击球需求灵敏的全身运动,包含快速摇摆手臂、滚动腰部、快速垫步和康复平衡,以保证精确击球并为下一次打准备好。