人工智能新突破:计算机正在学习从更高维度观察世界( 十 )

\n

Weiler 说:“等变神经网络的关键是将这些明显的对称放置进网络结构里面 , 这有点类似一顿免费的午餐 。 ”

\n

到了2018年 , Weiler、Cohen及其博士导师Max Welling已经扩大了这种“免费午餐”的范围 , 将其他等变也纳入进来 。 他们的“群等变”(group-equivariant) CNN无需用旋转或镜像方向样本训练即可检测平面图像上这些特征的存在;球面CNN可以根据球体表面上的数据创建特征图谱而不需要将其扭曲为平面投影 。

\n

这些方法仍然不够通用 , 没法处理崎岖不平、不规则结构流形(从土豆到蛋白质 , 再到人体 , 乃至于时空弯曲 , 几乎涵括了所有物体的几何形状)的数据 。 对于神经网络 , 这些类型的流形“全局”对称性来让神经网络做出等变假设:因为它们上面的每个位置都是不同的 。

\n \n

用两个水平圆柱体展示最曲面上的卷积计算

\n

其挑战在于 , 视选取的路径不同 , 平面滤波器在某表面的滑动会改变该过滤器的方向 。 不妨想象一个用于检测简单模式(左侧为深色斑点 , 右侧为浅色斑点)的滤波器 。 在平面网格上上下左右滑动这个滤波器 , 它都将始终保持正面朝上 。 但是 , 哪怕是在球体的表面上 , 这一点也会改变 。 如果将过滤器围绕球面的赤道移动180度 , 则滤波器的方向将保持不变:左侧为深色斑点 , 右侧为浅色斑点 。 但是 , 如果越过球体北极将其滑动到同一点的话 , 则过滤器将是是上下颠倒的——右侧为深色斑点 , 左侧为浅色斑点 。 滤波器将检测不出数据存在相同的模式或对相同的特征图谱进行编码 。 在更复杂的流形上移动滤波器的话 , 最终会指向许多不一致的方向 。

推荐阅读