谷歌公布亚毫秒级人脸检测算法 人脸检测又一突破( 四 )

谷歌公布亚毫秒级人脸检测算法 人脸检测又一突破

图 1 单个 BlazeBlock (左) 与 双 BlazeBlock (右)

2、特征提取器

对于具体的例子,我们专注于前置摄像头模型的特征提取器。该特征提取器必须考虑较小范围的目标尺度,因此它具有较低的计算需求。提取器采用 128×128 像素的 RGB 输入,包括一个 2D 卷积和 5 个单 BlazeBlock 和 6 个双 BlazeBlock 组成,完整布局见下表。最大张量深度(通道分辨率)为 96,而最低空间分辨率为 8×8(与 SSD 相比,它将分辨率一直降低到 1×1)。

谷歌公布亚毫秒级人脸检测算法 人脸检测又一突破

图 2 BlazeFace 特征提取器的网络结构

3、Anchor 机制

类似 SSD 的目标检测模型依赖于预定义的固定大小的基础边界框,称为先验机制,或 Faster-R-CNN 术语中的锚点。为每个锚预测一组回归(可能还包括分类)参数,例如中心偏移量和尺寸调整。它们用于将预定义的锚位置调整为紧密的边界矩形。

推荐阅读