3年血亏10亿美元:Google Deepmind出了什么问题?( 三 )

在某种程度上,深度强化学习是一种涡轮增压式的记忆,使用它的系统能够实现一些人们觉得不可思议的目标,但它们本身对自己在做的事情只有肤浅的理解。因此,当前的系统缺乏灵活性,也无法在环境发生变化时进行调整。

深度强化学习还需要大量的数据。比如,AlphaGo在训练过程中参加了数百万次围棋游戏,这远远超过了一个人想要成为世界级棋手所需要的数量;而且实现这个目标需要巨大规模的计算资源,价格也不菲——据估计,训练AlphaGo的成本为3500万美元。

不过,这些都是出于经济学的考虑。正如Rebooting AI(重启人工智能)这本书中所说,真正的问题在于信任。

目前,深度强化学习只能在受到严格控制、很少出现意外的环境中进行,将其运行在几千年里都没有出现变化的环境里或许可行,但在现实生活中,人们可能不会想依赖它。

商业方面收效甚微

3年血亏10亿美元:Google Deepmind出了什么问题?

Deepmind创始人兼CEO Demis Hassabis

推荐阅读