7 大类卷积神经网络(CNN)创新综述( 七 )

基于多路径的 CNN

深度网络的训练颇具挑战性 , 这也是近来很多深度网络研究的主题 。 深度 CNN 为复杂任务提供了高效的计算和统计 。 但是 , 更深的网络可能会遭遇性能下降或梯度消失/爆炸的问题 , 而这通常是由增加深度而非过拟合造成的 。 梯度消失问题不仅会导致更高的测试误差 , 还会导致更高的训练误差 。 为了训练更深的网络 , 多路径或跨层连接的概念被提出 。 多路径或捷径连接可以通过跳过一些中间层 , 系统地将一层连接到另一层 , 以使特定的信息流跨过层 。 跨层连接将网络划分为几块 。 这些路径也尝试通过使较低层访问梯度来解决梯度消失问题 。 为此 , 使用了不同类型的捷径连接 , 如零填充、基于投影、dropout 和 1x1 连接等 。

激活函数是一种决策函数 , 有助于学习复杂的模式 。 选择适当的激活函数可以加速学习过程 。 卷积特征图的激活函数定义为等式(3) 。

推荐阅读