ICLR 2019论文解读：深度学习应用于复杂系统控制( 三 )_机器之心发布作者：石媛媛&陈绎泽引言2

图2/5

图一：本文提出的输入凸的神经网络的（a）动态系统学习与（b）闭环控制过程。

在「Optimal control via neural network: a convex approach」一文中，作者提出了一种新的数据驱动的控制方法。该篇文章作出了结合 model-free control 与 model-based control 的一步重要尝试。在训练过程中，我们用一个输入凸 (input convex) 的神经网络来表达系统表达复杂的动态特性；在控制与优化过程中，我们就可以将训练好的神经网络作为动态系统的模型，求解凸优化问题从而得到有最优保证的控制输入。算法思路详见图一

基于输入凸神经网络的最优控制框架

为了解决现有模型的不足，本文作者提出了一种新的系统辨识方法：基于输入凸的神经网络的系统辨识。建立在之前 Input Convex Neural Network (ICNN) [3] (ICML 2017, Amos et al., 2017, CMU) 的基础上，本文作者提出一种新型的 Input Convex Recurrent Neural Network (ICRNN) 用于具有时间关联的动态系统建模。不同于通用的神经网络结构，输入凸的神经网络要求所有隐藏层之间的权重矩阵非负，同时加入了对输入向量的负映射以及输入到隐藏层的直连层增加 ICNN 和 ICRNN 的表达能力。