旷视首席科学家孙剑:深度学习变革视觉计算丨CCF-GAIR 2019(19)

从ImageNet数据集建立 , 到打破人类的性能大概用了5-6年时间 。 我想当初李飞飞教授团队完全没有想象到可以这么快 , 机器的能力超过人的能力 。

我们当时做152 Layers网络经常被问一个问题:为什么这个网络是152 Layers?我们确定的回答是当时内存就可以装这么多层 。

去年一个朋友给了一个更好的答案:8乘以19等于152 。 AlexNet是8层 , VGG网络是19层 , 所以ResNet是152层 。

ResNet的核心思想是加入跳层连接 , 不要学习直接的映射而是学习残差映射 , 这样非常有利于训练或优化 。

推荐阅读