为什么说“行为预测”是自动驾驶终极杀器?( 九 )

在模仿学习过程中,神经网络会「吸入」一些输入数据,它可能是原始视频,但恐怕更像计算视觉神经网络生成的抽象记录。

整个神经网络通路走下来,大家想在输出端得到车辆下一步该采取什么行动的指示,随后这些数据会被传输至控制软件以决定到底该下什么命令(刹车、转向还是加速)。

借助成千上万特斯拉车主,特斯拉能采集到丰富的输出数据。这些数据与抽象记录相结合,就能生成训练所用的「输入-输出」。

在模仿学习中,这个「输入-输出」对其实就是「状态-动作」,它包含了世界或周边环境的状态,以及人类驾驶员的动作。

与行为预测类似,模仿学习的「输入-输出」对也无需人类对数据进行手动标记。

有了充足的「状态-动作」对,神经网络就能从人类驾驶员那里学到状态与动作间的联系。再加上充分的训练,神经网络就能自己找到发号施令的状态,从而学会驾驶。

如果在模仿学习中用到了抽象记录,那么训练和推理中计算视觉错误的减少,也意味着模仿学习错误的减少。

推荐阅读