专访递归神经网络之父:AI下一轮革命核心是“人工好奇心”( 五 )

婴儿在没有老师的情况下就能学到很多东西。当他们与世界互动时,他们学习预测其行动的后果。他们还有好奇心,会用玩具设计实验,从中获得新的数据,了解更多信息。

为了构建具有好奇心的智能体,我在1990年引入了一种新型的主动无监督学习。它基于一个最大最小值博弈,其中一个神经网络最小化一个目标函数,而这个目标函数却被另一个网络最大化。那么它具体是怎么工作的呢?第一个网络称为控制器,它生成可能影响环境的输出。第二个网络称为世界模型,它预测环境对控制器输出的反应。世界模型的目标是最小化其误差,从而成为更好的预测器。但在零和博弈中,控制器试图找到最大化世界模型误差的输出。也就是说,控制器想要找到某种新的实验,这种实验可以生成世界模型仍不熟悉的数据,直到这些数据对世界模型来说非常熟悉。如今,在算力比1990年便宜了一百万倍的情况下,我们使用这一简单原则的复杂变式来构建无监督的机器人,这些机器人为自己设定目标,从而在这个过程中能够解决越来越普适的问题。

澎湃新闻:无监督学习的成熟将对人类产生什么影响?

Jürgen Schmidhuber:人工好奇心(Artificial curiosity)将成为下一轮人工智能(有时称为“第四次工业革命”)的核心,这次革命中,智能机器人和其他机器将通过自己的行动来塑造他们的数据。他们将主要从自己发明的实验中学习,偶尔才向人类学习。

推荐阅读