7 大类卷积神经网络(CNN)创新综述( 九 )

基于通道(输入通道)利用的 CNN

图像表征在决定图像处理算法的性能方面起着重要作用 。 图像的良好表征可以定义来自紧凑代码的图像的突出特征 。 在不同的研究中 , 不同类型的传统滤波器被用来提取单一类型图像的不同级别信息 。 这些不同的表征被用作模型的输入 , 以提高性能 。 CNN 是一个很好的特征学习器 , 它能根据问题自动提取鉴别特征 。 但是 , CNN 的学习依赖于输入表征 。 如果输入中缺乏多样性和类别定义信息 , CNN 作为鉴别器的性能就会受到影响 。 为此 , 辅助学习器的概念被引入到 CNN 中来提升网络的输入表征 。

基于注意力的 CNN

不同的抽象级别在定义神经网络的鉴别能力方面有着重要的作用 。 除此之外 , 选择与上下文相关的特征对于图像定位和识别也很重要 。 在人类的视觉系统中 , 这种现象叫做注意力 。 人类在一次又一次的匆匆一瞥中观察场景并注意与上下文相关的部分 。 在这个过程中 , 人类不仅注意选择的区域 , 而且推理出关于那个位置的物体的不同解释 。 因此 , 它有助于人类以更好的方式来抓取视觉结构 。 类似的解释能力被添加到像 RNN 和 LSTM 这样的神经网络中 。 上述网络利用注意力模块来生成序列数据 , 并且根据新样本在先前迭代中的出现来对其加权 。 不同的研究者把注意力概念加入到 CNN 中来改进表征和克服数据的计算限制问题 。 注意力概念有助于让 CNN 变得更加智能 , 使其在杂乱的背景和复杂的场景中也能识别物体 。

推荐阅读