7 大类卷积神经网络(CNN)创新综述( 八 )

基于宽度的多连接 CNN

2012 至 2015 年 , 网络架构的重点是深度的力量 , 以及多通道监管连接在网络正则化中的重要性 。 然而 , 网络的宽度和深度一样重要 。 通过在一层之内并行使用多处理单元 , 多层感知机获得了在感知机上映射复杂函数的优势 。 这表明宽度和深度一样是定义学习原则的一个重要参数 。 Lu 等人和 Hanin & Sellke 最近表明 , 带有线性整流激活函数的神经网络要足够宽才能随着深度增加保持通用的近似特性 。 并且 , 如果网络的最大宽度不大于输入维度 , 紧致集上的连续函数类无法被任意深度的网络很好地近似 。 因此 , 多层堆叠(增加层)可能不会增加神经网络的表征能力 。 与深度架构相关的一个重要问题是 , 有些层或处理单元可能无法学习有用的特征 。 为了解决这一问题 , 研究的重点从深度和较窄的架构转移到了较浅和较宽的架构上 。

基于特征图(通道特征图)开发的 CNN

CNN 因其分层学习和自动特征提取能力而闻名于 MV 任务中 。 特征选择在决定分类、分割和检测模块的性能上起着重要作用 。 传统特征提取技术中分类模块的性能要受限于特征的单一性 。 相较于传统技术 , CNN 使用多阶段特征提取 , 根据分配的输入来提取不同类型的特征(CNN 中称之为特征图) 。 但是 , 一些特征图有很少或者几乎没有目标鉴别作用 。 巨大的特征集有噪声效应 , 会导致网络过拟合 。 这表明 , 除了网络工程外 , 特定类别特征图的选取对改进网络的泛化性能至关重要 。 在这一部分 , 特征图和通道会交替使用 , 因为很多研究者已经用通道这个词代替了特征图 。

推荐阅读