上交大AI研究院首席科学家徐雷:中国人工智能研究真的世界领先?( 五 )

(2) 芯片算力 马斯克的OpenAI 认为 , 2012-2017六年间AI计算力6年提升30万倍 。 保守估计九十年代初到2006年的算力增长就算只有它的十分之一 , 那也意味着做2006年需要20分钟算的问题 , 九十年代初中期要算一年 。 当时的基础研究提出了各种方法 , 但不可能通过计算得到验证 , 所以才会有一、二十年的滞后期 。 Hinton在1986年后的二十年再续前缘 , 既反映他的执着 , 也是历史的圆满 。

(3) 大数据和互联网 九十年代初采集用于语音识别的数据都已经十分困难 , 采集人脸图像数据则难度更大 。 就算那时有算力 , 也不可能有足够大量的数据来训练 , 以确定深度神经网络中的大量参数 。 2009年原微软人工智能首席科学家邓力邀请Hinton来到微软 , 利用他们在语音领域积累了多年的大数据 , 尝试了深度学习的应用 , 发现用深度学习进行语音识别比原来的识别方法成果有了很大提高 。 李飞飞在 CVPR 2009 上发表了关于ImageNet的论文 , 关注如何有效地获取图像数据集 , 并从2010 年开始开启了每年一度的ImageNet 挑战赛(通过互联网和众筹) , 解决了计算机视觉的大数据获取问题 。

在上述三大支撑中 , 第三个是我国的明显强项 。 最多的人口、通讯和互联网的飞速发展和普及、以及体制的优势和社会的需求 , 语音、图像、以及其他大数据的获取都远超欧美 。 而通过雄厚的资金投入 , 也购买获得了巨大的算力 , 这些催生了国内许多独角兽公司出现和飞速发展 。 2012年 , Hinton团队在ImageNet首次使用深度学习完胜其它团队 , 神经网络层数只有个位数 。 商汤的团队在2016年ImageNet图片分类中做出最佳性能时 , 用得神经网络层数是1200多层 。

推荐阅读