谷歌公布亚毫秒级人脸检测算法人脸检测又一突破( 六 )_谷歌近日发布了一款专为移动GPU推理量

图 3 锚点计算，SSD（左）与 BlazeFace（右）

4、后处理机制

由于我们的特征提取器未将分辨率降低到 8×8 以下，因此给定目标重叠的锚点数量会随目标尺寸的增加而显著增加。在典型的非最大抑制方案中，只有一个锚点被选中作为算法的输出。这样的模型应用于后续视频人脸预测时，预测结果将在不同锚之间波动并且在时间序列上检测框上持续抖动（人类易感噪声）。

为了最小化这种现象，我们用一种混合策略代替抑制算法，该策略以重叠预测之间的加权平均值估计边界框的回归参数，它几乎不会产生给原来的 NMS 算法带来额外成本。对于人脸检测任务，此调整使准确度提高 10％。

我们通过连续输入目标轻微偏移的图像来量化抖动量，并观察模型结果（受偏移量影响）如何受到影响。在联合分辨率策略修改之后，抖动量（定义为原始输入和移位输入的预测之间的均方根差）在我们的前置摄像头数据集上下降了 40％，在包含较小人脸的后置摄像头数据集上下降了 30％。

实验

谷歌公布亚毫秒级人脸检测算法人脸检测又一突破( 六 )