ICLR 2019论文解读:深度学习应用于复杂系统控制( 四 )

作者在文章中理论证明了,输入凸神经网络 ICNN 和 ICRNN 可以表示所有凸函数(Theorem 1),并且其表达的效率比分段线性函数高指数级(Theorem 2)。两条性质保证所提出的网络架构能够很好地应用于优化与控制问题中用于对象建模与求解。

在使用输入凸神经网络进行系统建模后,作者将系统模型嵌入到模型预测控制(Model Predictive Control)框架中,用于求解最优的系统控制值。因为使用了输入凸神经网络,这里的 MPC 问题是一个凸优化问题,使用经典的梯度下降方法就可以保证我们找到最优的控制策略。如果系统的状态或者控制输入包含约束条件(constraints),我们也可以使用投影梯度下降(Projected Gradient Method) 或者内点法进行求解。这样,使用 ICNN 对瞬态特性建模或使用 ICRNN 对时序过程建模并用于控制对输入优化求解,我们不仅能够满足控制论中对于最优解的性质的保证,同时也可以充分发挥深度模型的表征能力,即可作为一种适用于各领域的建模与控制方法。

ICLR 2019论文解读:深度学习应用于复杂系统控制

图3/5

推荐阅读