谷歌公布亚毫秒级人脸检测算法人脸检测又一突破( 五 )_谷歌近日发布了一款专为移动GPU推理量

通常的做法是根据目标比例范围在多个分辨率级别定义锚点，同时下采样也是计算资源优化的手段。典型的 SSD 模型使用 1×1,2×2,4×4,8×8 和 16×16 特征映射大小的预测。然而，金字塔池化网络 PPN 架构（https://arxiv.org/pdf/1807.03284.pdf）的成功意味着在特征图达到某个特征映射分辨率后，将产生大量额外的计算。

相比于 CPU 计算，GPU 独有的关键特性是调度特定层计算会有一个显著的固定成本，这对于流行的 CPU 定制架构固有的深度低分辨率层而言非常重要。例如，在一个实验中我们观察到 MobileNetV1 推理时间需要 4.9 毫秒，而在实际 GPU 计算中花费 3.9 毫秒。

考虑到这一点，我们采用了另一种锚定方案，该方案停留在 8×8 特征图尺寸处而无需进一步下采样（图 2）。我们已经将 8×8,4×4 和 2×2 分辨率中的每个像素的 2 个锚点替换为 8×8 的 6 个锚点。由于人脸长宽比的变化有限，因此发现将锚固定为 1：1 纵横比足以进行精确的面部检测。