胶囊网络:一种全新的富有吸引力的AI架构( 五 )

那么我们先创建一个用于对MNIST数据集进行分类的分步胶囊体系结构:第一层为典型的卷积层。

在第二层中,在称为初级胶囊 的层中执行卷积过程,其中应用了挤压函数。

每个主胶囊接收图像的一个小区域作为输入(称为感受野),它用来检测特定图案(如圆圈)的存在和姿态。

较高层的胶囊(称为路由胶囊)检测更大和更复杂的物体,如由两个圆组成都的数字8。

然后他们使用一个新的挤压函数来保证这些向量的长度在0-1之间。

在初级胶囊层之前应用标准卷积层,并且得到9x9x256的输出。

在初级胶囊层中采用32通道、步长为2的卷积核。

然而,这个区别于其他卷积核的特征就是挤压函数。

最后就得到了初级胶囊的输出。

此时可以得到6x6的输出。

因为在应用了动态路由算法的胶囊层中,其具有第三层动态路由的结果(根据协议路由算法),即获得这些8-长度输出DigitCaps矢量的32个输出。

推荐阅读