谷歌与DeepMind:史上最强AI拉锯战( 六 )

公司花大力气发展的一种机器学习技术——强化学习,源于Hassabis所擅长了两个领域:游戏和神经科学。建立这样一个程序是为了收集有关其环境的信息,然后通过重复经验来从中学习,就像Hassabis所说的“睡眠期间大脑活动”一样。

在此之前,强化学习在计算机领域还是一片空白。程序显示了一个虚拟环境,除了游戏规则,它什么也不知道。程序包含至少一个称为神经网络的组件。由计算结构层组成,可筛选信息,目的是识别特定特征或策略。每一层都在不同的抽象层次上检查环境。起初,这些网络的成功率很低。当他们尝试不同的策略时,变得越来越老练,当成功时,也会得到奖励。程序不会再次范同样的错误。AI神奇的地方就在于它重复任务的速度。

DeepMind的AI项目在2016年获得重大胜利,当年,AlphaGo在首尔举行的五局三胜比赛中击败围棋世界冠军,震惊世人。2.8亿人见证了AlphaGo的胜利,有专家曾预测人机对战机器取胜还需要十年时间。次年,升级版AlphaGo击败了中国围棋冠军。

人类智慧将被人工智能超越吗?

就像1997年的Deep Blue一样,AlphaGo改变了人们对人类成就的看法。人类冠军无疑拥有地球上最聪明的头脑,可是他们已经被AI超越。近20年后,Hassabis实现了自己当年的野心,他说这场比赛让他热泪盈眶。

推荐阅读