世界欠他一个图灵奖!LSTM之父的深度学习“奇迹之年”(12)
当人类与世界互动时,他们学会预测自己行为的后果。他们也很好奇,设计实验得出新的数据,从中他们可以学到更多。为了构建好奇的人工智能体,我在 1990 年介绍了一种新型的主动无监督学习或自监督学习。它基于一个极小极大博弈,其中一个神经网络最小化另一个神经网络最大化的目标函数。我把这两种无监督的对抗性神经网络之间的决斗称为对抗性好奇心 (Adversarial Curiosity)[AC19],以区别于人工好奇心 (Artificial Curiosity)。
图10/24
6、通过最大化学习神经网络学习进度的人工好奇心 (1991)
在这里,我重点介绍 1991 年 [AC91] [AC91b] 对对抗性好奇心 (Adversarial Curiosity) 的第一个重要改进。
图11/24
推荐阅读
- 设计师|魔兽世界:9.1.5刚上线,就要9.2了?来看设计师爆料的更多细节
- skt|被SKT冷藏埋没,来中国带队打进世界赛决赛的励志人物史
- LGD|LOL:SN又差点翻车?NEST焕峰烬重现世界名画高地反向架狙!
- 捉迷藏|?LOL世界赛“含金量”数据出炉:EDG仅排第六,IG稳居榜首
- 魔兽世界|魔兽TBC:为什么玩家期待跨区组队?降低组队难度,无需频繁换区
- edg战队|“EDG夺冠只拿48万”!同样是世界冠军,IG却可以拿到242万美金
- 雷神|原神:曾经有一个强力五星角色,却因各种“流言蜚语”,擦肩而过
- 魔兽世界|魔兽世界:60版本赛季服最新消息,大家都跑过去体验,真香定律
- 点卡|魔兽世界:9.1.5首日“回归潮”?游戏实力劝退玩家,真有点卡
- 魔兽世界|魔兽世界TBC:猎人宠物挑选指南,引怪是其次,这个误区不能犯