擅长爬山的机器狗登Science,比人类徒步速度快4分钟( 二 )



▲ANYmal于其他机器人行动对比三、教师+学生模型训练 , 训练迭代1000个环境研究小组还采用了教师-学生模式来对机器人进行训练 。 在训练过程中 , 赫特将信息策略的控制频率设置为50 Hz , 每个环境收集250个时间段的轨迹数据 , 形成一次训练迭代 。 随后他们将模拟环境并行化 , 以同时执行1000个环境的训练 。
对于教师模型 , 研究人员采用深度增强学习PPO算法 , 这个算法模型可以有效衡量机器人的步长 。 在将观察结果汇总观察之前 , 他们会使用运行平均值和标准偏差对其进行标准化 , 不同的实验会在每一次训练中以指数形式更新 。
对于学生模型 , 赫特说:“我们在300个环境中进行了推广 , 并为一次训练迭代收集了400个时间段的轨迹 。 ”并且在训练学生模型时 , 实验过程没有高度样本噪音干扰 。
“通过这种训练 , 机器人能够在以前从未见过的情况下掌握最困难的自然地形 。 ”赫特说 , “即使直接环境中的传感器数据模棱两可或含糊不清 , 这也有效 。 ”

▲ANYmal与其他四足机器人避障对比根据赫特的说法 , ANYmal会依靠其本体感觉安全行事 , 这样的话机器人行动就做到了两全其美 , 能够结合外部感知的速度和效率以及本体感知的安全性 。
结语:机器人或能帮助人类探索未知领域在实际应用场景中 , ANYmal在自主探索狭窄隧道、洞穴和城市基础设施的地下系统的同时 , 还能自动快速地克服许多障碍物和困难地形 。
机器人的快速避障和感知能力进一步提升 , 在未来 , 各种极端条件下 , 比如地震之后、核灾难之后或是森林火灾期间 , 对人类来说太危险以及其他机器人无法应对困难地形的地方 , 像ANYmal这样的机器人都可以派上大用场 。
近年来 , 机器人研究的应用在不断扩展 , 机器人行动结合本体感受和外部感受等技术 , 都在解决很多机器人运动的难题 , 该领域未来在人类未知领域的探索应用场景可能会进一步扩大 。
来源:Robohub、Science

推荐阅读