人工智能新突破:计算机正在学习从更高维度观察世界( 七 )

\n

用这种方式改变滑动滤波器的属性能让CNN更好地“理解”某些几何关系 。 比方说 , 这种神经网络可以自动识别出弯曲成两个不同姿势的3D形状(比方说 , 一个站立的人像和抬起一条腿的人像)是同一对象的实例 , 而不是两个完全不同的对象 。 这种改变也使得神经网络的学习效率大大提高 。 Bronstein说 , 标准的CNN“要使用数百万个形状的样本 , 而且需要训练数周 。 我们只用了不同的姿势的大概100种形状 , 训练只用了约半小时 。 ”

\n

同时 , Taco Cohen和他在阿姆斯特丹的同事开始从相反的方向去解决同一问题 。 2015年 , 当时还是研究生的Cohen并没有研究如何让深度学习摆脱平面 。 相反 , 他对自认为很实用的一个工程问题很感兴趣:那就是数据效能 , 或者说 , 通常训练神经网络需要数千或数百万个样本 , 怎么才能把这个数量减少?Cohen说:“深度学习方法可以说是非常迟钝的学习者 。 ” 如果训练CNN是用来识别猫(互联网最不缺猫的图像)的话 , 几乎是不成问题的 。 但是 , 如果你想让网络检测出更重要的内容 , 比方说肺组织图像里面的癌性结节的话 , 想要找到足够的训练数据(需要在医学上进行准确适当的标记并且没有隐私问题)并非易事 。 训练网络所需的样本越少越好 。

推荐阅读