ICLR 2019论文解读:深度学习应用于复杂系统控制( 三 )
图2/5
图一:本文提出的输入凸的神经网络的(a)动态系统学习与(b)闭环控制过程。
在「Optimal control via neural network: a convex approach」一文中,作者提出了一种新的数据驱动的控制方法。该篇文章作出了结合 model-free control 与 model-based control 的一步重要尝试。在训练过程中,我们用一个输入凸 (input convex) 的神经网络来表达系统表达复杂的动态特性;在控制与优化过程中,我们就可以将训练好的神经网络作为动态系统的模型,求解凸优化问题从而得到有最优保证的控制输入。算法思路详见图一
基于输入凸神经网络的最优控制框架
为了解决现有模型的不足,本文作者提出了一种新的系统辨识方法:基于输入凸的神经网络的系统辨识。建立在之前 Input Convex Neural Network (ICNN) [3] (ICML 2017, Amos et al., 2017, CMU) 的基础上,本文作者提出一种新型的 Input Convex Recurrent Neural Network (ICRNN) 用于具有时间关联的动态系统建模。不同于通用的神经网络结构,输入凸的神经网络要求所有隐藏层之间的权重矩阵非负,同时加入了对输入向量的负映射以及输入到隐藏层的直连层增加 ICNN 和 ICRNN 的表达能力。
推荐阅读
- 2019英雄联盟全球总决赛|S9的Tian对比S11的Tian,今非昔比,心态炸裂
- 剑网3|剑网3:2019年大型818被铲出,女主简直无底线!
- 2019英雄联盟全球总决赛|三国志战略版S9赛季4套新阵容,3大登庸令新队伍搭配!
- ag战队|AG杀疯了!初晨的露娜永远值得相信,一诺信心回来了,梦回2019
- estar|AG超玩会要小心eStar,阿泰表示,花海梦回2019年,有可能是AG夺冠最大的障碍
- 乌迪尔|LOL:本周3款半价,这款2019年的皮肤,首次在周半价中出现
- iqoo|5G为什么突然不火了?
- 温氏集团2019年经营业绩,净利润为139.06亿元,同比增长251.38%
- 荣耀发布会:智能手机海外出货量2019前三季度同比增长21%
- 三星彩电2019量额第一 2500美元以上高端电视占比超半