何恺明组基础理论再突破：媲美双阶段方法的单阶段实例分割算法( 五 )_TensorMask密集实例分割效果示例。左图

TensorMask 和 Mask R-CNN 的分割结果对比，网络主干是 ResNet-101-FPN —— 作者们自信地表示，两者结果定性和定量的相似度都很高，他们邀请大家猜猜哪些结果是 TensorMask 的，哪些是 Mask R-CNN 的。

在 COCO 上的定量实验表明，Mask R-CNN 仍然取得了更高的 mAP 成绩，这并不令人意外。不过，TensorMask 目前也并没有运行速度优势，ResNet-101-FPN 主干的 TensorMask 在英伟达 V100 GPU 上的运行速度为 0.38 秒每图像（Mask R-CNN 只有 0.09 秒每图像）。作者们的解释是，TensorMask （作为单阶段方法）在密集的滑动窗口中（数量大于 100k）预测遮罩造成了很高的计算开销，相比之下 Mask R-CNN （作为双阶段方法）只需要在第二阶段选择出的窗口中预测遮罩，需要预测的窗口数量很可能不大于 100 个。作者们表示，加速的办法自然是有的，不过这篇论文的目的是完善基础、探路，加速优化的办法另外再谈。