即插即用新卷积:提升CNN性能、速度翻倍( 三 )

即插即用新卷积:提升CNN性能、速度翻倍

图4/17

图 4. OctConv 的设计细节

Octave Convolution(OctConv)的命名应该是受到了 SIFT 特征的启发。而 Octave 是八个音阶的意思,音乐里降 8 个音阶代表频率减半。本文通过一个 Octave 将 高频 和 低频 特征隔离到不同的组中,并将低频的分辨率减半。

研究人员指出 OctConv 可以直接用于替代现有卷积,并且即插即用,无需调参,也不影响 CNN 的网络结构以及模型大小。由于 OctConv 专注于降低 CNN 空间维度上的冗余,因此它与现有专注于网络拓补结构设计,以及减少网络特征容易的方法是正交和互补的。

实验表明,用 OctConv 替代普通卷积可以稳定提高现有的 2D CNN 网络(包括ResNet、ResNeXt、DenseNet、MobileNet、SE-Net)提高其在 ImageNet 上的图像识别的性能,此外也可以稳定提高 3D CNN 网络(C2D、 I3D)并在 Kinetics(行视频动作识别数据集)上取得了更佳的性能。配备了 OctConv 的 Oct-ResNet-152 甚至可以媲美当前最佳的自动搜索的网络 (NAS, PNAS 等)。

推荐阅读