何恺明组基础理论再突破:媲美双阶段方法的单阶段实例分割算法( 五 )

何恺明组基础理论再突破:媲美双阶段方法的单阶段实例分割算法

TensorMask 和 Mask R-CNN 的分割结果对比,网络主干是 ResNet-101-FPN —— 作者们自信地表示,两者结果定性和定量的相似度都很高,他们邀请大家猜猜哪些结果是 TensorMask 的,哪些是 Mask R-CNN 的。

何恺明组基础理论再突破:媲美双阶段方法的单阶段实例分割算法

在 COCO 上的定量实验表明,Mask R-CNN 仍然取得了更高的 mAP 成绩,这并不令人意外。不过,TensorMask 目前也并没有运行速度优势,ResNet-101-FPN 主干的 TensorMask 在英伟达 V100 GPU 上的运行速度为 0.38 秒每图像(Mask R-CNN 只有 0.09 秒每图像)。作者们的解释是,TensorMask (作为单阶段方法)在密集的滑动窗口中(数量大于 100k)预测遮罩造成了很高的计算开销,相比之下 Mask R-CNN (作为双阶段方法)只需要在第二阶段选择出的窗口中预测遮罩,需要预测的窗口数量很可能不大于 100 个。作者们表示,加速的办法自然是有的,不过这篇论文的目的是完善基础、探路,加速优化的办法另外再谈。

推荐阅读