ICLR 2019论文解读:深度学习应用于复杂系统控制( 三 )

ICLR 2019论文解读:深度学习应用于复杂系统控制

图2/5

图一:本文提出的输入凸的神经网络的(a)动态系统学习与(b)闭环控制过程。

在「Optimal control via neural network: a convex approach」一文中,作者提出了一种新的数据驱动的控制方法。该篇文章作出了结合 model-free control 与 model-based control 的一步重要尝试。在训练过程中,我们用一个输入凸 (input convex) 的神经网络来表达系统表达复杂的动态特性;在控制与优化过程中,我们就可以将训练好的神经网络作为动态系统的模型,求解凸优化问题从而得到有最优保证的控制输入。算法思路详见图一

基于输入凸神经网络的最优控制框架

为了解决现有模型的不足,本文作者提出了一种新的系统辨识方法:基于输入凸的神经网络的系统辨识。建立在之前 Input Convex Neural Network (ICNN) [3] (ICML 2017, Amos et al., 2017, CMU) 的基础上,本文作者提出一种新型的 Input Convex Recurrent Neural Network (ICRNN) 用于具有时间关联的动态系统建模。不同于通用的神经网络结构,输入凸的神经网络要求所有隐藏层之间的权重矩阵非负,同时加入了对输入向量的负映射以及输入到隐藏层的直连层增加 ICNN 和 ICRNN 的表达能力。

推荐阅读