Google 系两公司联手,要让无人车少“犯错”( 二 )

Google 系两公司联手,要让无人车少“犯错”

图3/7

PBT 的灵感来自于达尔文的进化论,由 DeepMind 在 2017 年开发。

Waymo 之前的算法是一个模型接受一个任务来不断优化,而 PBT 是由多个随机变量启动的机器学习模型,以一种进化的方式相互对抗,只有最优的才会留下来。

Google 系两公司联手,要让无人车少“犯错”

图4/7

因此 PBT 的模型不需要重新训练,它会自动更新出更好的参数值。为了让 PBT 长期保持优化,DeepMind 还创建了更多样的模型与之竞争。

DeepMind 还凭借着 PBT 训练机器人,让机器人在《星际争霸》等游戏中击败了人类玩家。

Waymo 团队看到了它在自动驾驶上的潜力,并通过一个虚拟司机「驾驶」Waymo 进行了试验。结果发现,使用 PBT 的算法,计算资源减少了一半,训练时间缩短了一半,Waymo 的性能水平也达到了最高。

推荐阅读