控制|百度飞桨PaddleRobotics新升级!RL解决四足机器人多地形行走难题( 三 )



控制|百度飞桨PaddleRobotics新升级!RL解决四足机器人多地形行走难题
文章图片

图四、实验结果
百度的工作展现出 , 基于自主学习的方法在四足机器人控制上具有完全替代甚至超越经典算法的潜力 , 有可能成为强化学习和进化学习在复杂非线性系统中开始大规模落地和实用化的契机 。 这不是百度在机器人方向上做的第一个强化学习工作 , 早在 18 年 , 他们就尝试将人工干预引入到强化学习中 , 以推进强化学习应用在四轴飞行器控制等高风险的硬件场景 。
未来 , 相信强化学习会是四足机器人控制领域重要的技术突破口 , 有效推动足形态机器人走进我们的日常生活中 。 该模型和训练方法同步开源于飞桨机器人算法库 PaddleRobotics 和强化学习框架 PARL;其中四足机器人和复杂地形仿真也开放于飞桨强化学习环境集 RLSchool, 以便于更多该领域的专家和工程师对比研究 。
参考:
完整仿真效果和真机视频:https://www.bilibili.com/video/BV1a44y1b7nQ
论文:https://arxiv.org/abs/2109.06409
强化学习框架 PARL:https://github.com/PaddlePaddle/PARL
开源仿真环境 RLSchool:https://github.com/PaddlePaddle/RLSchool
飞桨机器人控制算法框架 PaddleRobotics:https://github.com/PaddlePaddle/PaddleRobotics

推荐阅读