Google 系两公司联手，要让无人车少“犯错”( 二 )

2019-07-27

图3/7

PBT 的灵感来自于达尔文的进化论，由 DeepMind 在 2017 年开发。

Waymo 之前的算法是一个模型接受一个任务来不断优化，而 PBT 是由多个随机变量启动的机器学习模型，以一种进化的方式相互对抗，只有最优的才会留下来。

图4/7

因此 PBT 的模型不需要重新训练，它会自动更新出更好的参数值。为了让 PBT 长期保持优化，DeepMind 还创建了更多样的模型与之竞争。

DeepMind 还凭借着 PBT 训练机器人，让机器人在《星际争霸》等游戏中击败了人类玩家。

Waymo 团队看到了它在自动驾驶上的潜力，并通过一个虚拟司机「驾驶」Waymo 进行了试验。结果发现，使用 PBT 的算法，计算资源减少了一半，训练时间缩短了一半，Waymo 的性能水平也达到了最高。

推荐阅读

上一篇：用27个摄像头实现自动结账，旧金山AI创企融资3500万美元

下一篇：多核打游戏反而更慢？谈CPU和游戏优化那点事