世界欠他一个图灵奖!LSTM之父的深度学习“奇迹之年”( 四 )

第 3 节:基本的深度学习问题:梯度消失 / 爆炸 (1991)

第 4 节:长短时记忆网络:有监督深度学习 (1991 年以来的基本想法)

第 5 节:通过对抗生成神经网络的人工好奇心 (1990)

第 6 节:通过最大化学习神经网络学习进度的人工好奇心 (1991)

第 7 节:用于无监督数据建模的对抗网络 (1991)

第 8 节:端到端可微快速权重:让神经网络学习编程神经网络 (1991)

第 9 节:通过神经网络学习序列注意力 (1990)

第 10 节:分层强化学习 (1990)

第 11 节:用循环神经世界模型做规划和强化学习 (1990)

第 12 节:将目标定义作为额外的 NN 输入 (1990)

第 13 节:作为 NN 输入 / 通用值函数的高维奖励信号 (1990)

第 14 节:确定性策略梯度 (1990)

推荐阅读