谷歌与DeepMind：史上最强AI拉锯战( 六 )_【猎云网（微信号：ilieyun）】3月18日

公司花大力气发展的一种机器学习技术——强化学习，源于Hassabis所擅长了两个领域：游戏和神经科学。建立这样一个程序是为了收集有关其环境的信息，然后通过重复经验来从中学习，就像Hassabis所说的“睡眠期间大脑活动”一样。

在此之前，强化学习在计算机领域还是一片空白。程序显示了一个虚拟环境，除了游戏规则，它什么也不知道。程序包含至少一个称为神经网络的组件。由计算结构层组成，可筛选信息，目的是识别特定特征或策略。每一层都在不同的抽象层次上检查环境。起初，这些网络的成功率很低。当他们尝试不同的策略时，变得越来越老练，当成功时，也会得到奖励。程序不会再次范同样的错误。AI神奇的地方就在于它重复任务的速度。

DeepMind的AI项目在2016年获得重大胜利，当年，AlphaGo在首尔举行的五局三胜比赛中击败围棋世界冠军，震惊世人。2.8亿人见证了AlphaGo的胜利，有专家曾预测人机对战机器取胜还需要十年时间。次年，升级版AlphaGo击败了中国围棋冠军。

人类智慧将被人工智能超越吗？

就像1997年的Deep Blue一样，AlphaGo改变了人们对人类成就的看法。人类冠军无疑拥有地球上最聪明的头脑，可是他们已经被AI超越。近20年后，Hassabis实现了自己当年的野心，他说这场比赛让他热泪盈眶。