白天鹅黑天鹅灰天鹅?卷积神经网络帮你搞定识别( 九 )

标准多层感知器(传统神经网络)

MLP有几个缺点 , 特别是在图像处理方面 。 MLP对每个输入使用一个感知器(例如 , 图像中的像素 , 在RGB情况下乘以3) 。 对于大图像 , 权重量迅速变得难以操纵 。 对于具有3个颜色通道的224 x 224像素图像 , 必须训练大约150000个重量!结果 , 困难发生在训练和过度拟合的时候 。

另一个常见问题是MLP对输入(图像)及其移位版本的反应不同——它们不是平移不变的 。 例如 , 如果猫的图片出现在一张图片的左上角和另一张图片的右下角 , 则MLP会尝试自我纠正并认为猫将始终出现在图像的这一部分中 。

很明显 , MLP不是用于图像处理的最佳思路 。 其中一个主要问题是当图像变平为MLP时 , 空间信息会丢失 。 靠近的节点很重要 , 因为它们有助于定义图像的特征 。

因此 , 我们需要一种方法来利用图像特征(像素)的空间相关性 , 这样我们就可以看到图片中的猫 , 无论它出现在何处 。 在下图中 , 我们正在学习冗余功能 。 这种方法并不健全 , 因为猫可能出现在另一个位置 。

推荐阅读