▲ANYmal于其他机器人行动对比三、教师+学生模型训练 , 训练迭代1000个环境研究小组还采用了教师-学生模式来对机器人进行训练 。 在训练过程中 , 赫特将信息策略的控制频率设置为50 Hz , 每个环境收集250个时间段的轨迹数据 , 形成一次训练迭代 。 随后他们将模拟环境并行化 , 以同时执行1000个环境的训练 。
对于教师模型 , 研究人员采用深度增强学习PPO算法 , 这个算法模型可以有效衡量机器人的步长 。 在将观察结果汇总观察之前 , 他们会使用运行平均值和标准偏差对其进行标准化 , 不同的实验会在每一次训练中以指数形式更新 。
对于学生模型 , 赫特说:“我们在300个环境中进行了推广 , 并为一次训练迭代收集了400个时间段的轨迹 。 ”并且在训练学生模型时 , 实验过程没有高度样本噪音干扰 。
“通过这种训练 , 机器人能够在以前从未见过的情况下掌握最困难的自然地形 。 ”赫特说 , “即使直接环境中的传感器数据模棱两可或含糊不清 , 这也有效 。 ”
▲ANYmal与其他四足机器人避障对比根据赫特的说法 , ANYmal会依靠其本体感觉安全行事 , 这样的话机器人行动就做到了两全其美 , 能够结合外部感知的速度和效率以及本体感知的安全性 。
结语:机器人或能帮助人类探索未知领域在实际应用场景中 , ANYmal在自主探索狭窄隧道、洞穴和城市基础设施的地下系统的同时 , 还能自动快速地克服许多障碍物和困难地形 。
机器人的快速避障和感知能力进一步提升 , 在未来 , 各种极端条件下 , 比如地震之后、核灾难之后或是森林火灾期间 , 对人类来说太危险以及其他机器人无法应对困难地形的地方 , 像ANYmal这样的机器人都可以派上大用场 。
近年来 , 机器人研究的应用在不断扩展 , 机器人行动结合本体感受和外部感受等技术 , 都在解决很多机器人运动的难题 , 该领域未来在人类未知领域的探索应用场景可能会进一步扩大 。
来源:Robohub、Science
推荐阅读
- ?构建既精确又低功耗的控制系统,研究半导体自旋量子位
- 2022年“5大最佳旗舰”手机推荐:颜值性能兼具,实力实至名归
- Magic Leap 2规格曝光:配备眼球追踪等18个传感器、支持动态亮度调节
- 夫妻俩吵架,丈夫徒步4公里去娘家告状,丈母娘反应逗笑众人
- 各显神通!细数各大厂商后置镜头的独门秘技
- 男子银行取钱伸出五个手指,柜员一看立马报警
- 扎克伯格宣布研发电子触觉皮肤ReSkin,为元宇宙提供逼真物理交互
- 关于贵州中晟环球网络骗局信息广告的说明
- 美国橄榄球明星将随“蓝色起源”火箭进入太空