图灵奖得主,带你详解深度学习(21)

图21/33

上图是历届比赛冠军的成绩。2010和2011年,最好成绩的判断错误率都在26%以上,但是2012年,错误率下降到了16%,从此之后更是直线下降。2017年的错误率是2.3%,这个水平已经超过人类。

那2012年到底发生了什么呢?发生了“卷积网络”。

3.卷积网络

2012年的冠军是多伦多大学的一个研究组,他们使用的方法就是卷积网络。

正是因为这个方法太成功了,“深度学习”才流行起来,现在搞图形识别几乎全都是用这个方法。

获奖团队描述卷积网络的论文的第一作者叫艾利克斯·克里泽夫斯基(Alex Krizhevsky),当时他只是一个研究生,这篇论文现在被人称为“AlexNet” 。

简单来说,AlexNet的方法是在最基本的像素到最终识别的物体之间加入了几个逻辑层,也就是“卷积层”。

“卷积”是一种数学操作,可以理解成“过滤”,或者叫“滤波”,意思是从细致的信号中识别尺度更大一点的结构。

推荐阅读