基准|MIT本科生研发机器人基准“健身房”,可进化出30多种运动能力( 二 )


基准|MIT本科生研发机器人基准“健身房”,可进化出30多种运动能力
文章图片
动图 | 自我翻转(来源:NeurIPS 2021)
研发人员把大量时间花在开发有效的控制算法上 , 来让机器狗跑得快、跑得稳定不容易摔倒等 。 但是 , 田韵声认为这种设计好的机器人形态并非是最优的 。 在优化机器人的大脑、也就是控制算法的同时 , 只有也对身体即形态结构进行优化 , 才能让机器人的能力更上一层楼 。
基于这一出发点 , 他和团队开发出了大规模基准测试平台 Evolution Gym , 旨在让更多人关注如何共同设计机器人的大脑和身体 , 通过算法共同进化两者 。
据悉 , Evolution Gym 专门为软体机器人而开发 , 涵盖 30 多个不同的任务环境 , 包括跑步、上台阶、攀爬、搬运物体等 。
基准|MIT本科生研发机器人基准“健身房”,可进化出30多种运动能力
文章图片
图 | 往上爬(来源:NeurIPS 2021)
Evolution Gym 中的机器人看起来像是柔软、可移动的俄罗斯方块 , 整体呈网格状结构 , 由许多个“细胞”作为基本单元组成 , 其中包括可以自由形变的软体细胞、坚硬的刚体细胞、以及可以主动收缩或扩张的致动器细胞 。 这种灵活的形态 , 使得机器人可以自由“进化”其形状 , 最终在不同地形上完成一系列运动和操纵物体等任务 。
这种可同时“进化”形态与控制的算法被称为协同设计(co-design) 。 具体而言 , 田韵声团队用深度强化学习去优化机器人的控制 , 并采用遗传算法、贝叶斯优化等方法 , 根据控制器的表现作为反馈信号来优化机器人的形态 。 整个进化过程是在控制优化和形态优化之间不断迭代进行 , 机器人可以像人类一样在环境中通过反复试验不断理解任务 , 并最终进化出更适合任务的形态 。
基准|MIT本科生研发机器人基准“健身房”,可进化出30多种运动能力
文章图片
(来源:NeurIPS 2021)
尽管机器人是从头开始自主进化的 , 并且除了任务本身之外 , 没有任何人类提供的先验知识 , 但在“进化”的过程中 , 它们经常会“进化”出一些类似于现有自然生物的器官或是整体形态 , 同时性能优于人工设计的机器人 。
如下图所示 , 搬运工机器人在优化到第 10 代的时候 , 不光进化出了两条腿 , 还在身体上方进化出了个凹槽用来放置物体 , 并能搬运物体向前移动 。 在优化到第 30 代时 , 在成功搬运物体的同时 , 它的跑速已比第 10 代快得多 。
基准|MIT本科生研发机器人基准“健身房”,可进化出30多种运动能力
文章图片
(来源:NeurIPS 2021)
【基准|MIT本科生研发机器人基准“健身房”,可进化出30多种运动能力】

推荐阅读