谷歌公布亚毫秒级人脸检测算法 人脸检测又一突破( 三 )
模型结构与设计
BlazeFace 模型架构围绕下面讨论的四个重要设计考虑因素而构建。
1、扩大感受野
虽然大多数现代卷积神经网络架构(包括 MobileNet,https://arxiv.org/pdf/1704.04861.pdf )都倾向于在模型图中都使用 3 x 3 卷积核,但我们注意到深度可分离卷积计算是由它们的点态部分主导。在 s×s×c 输入张量上,应用可分离卷积操作,其中,k×k 的深度卷积涉及 s^2ck^2 次乘加运算,而后续的 1×1 卷积到 d 个输出通道由 s^2cd 次乘加运算组成,是深度阶段的 d /(k^2)倍。
实际上,在具有金属外壳的 Apple iPhone X 上,16 位浮点运算中的 3×3 深度卷积对于 56×56×128 的张量需要花费 0.07 ms,相比之下 128 到 128 通道的 1×1 卷积运算会慢 4.3 倍,即后续的点卷积操作需要 0.3 毫秒(由于固定成本和存储器访问因素导致的纯算术运算计数差)。
该观察表明增加深度部分的核尺寸性价比更高。我们在模型架构中使用 5×5 内核,这样使得感受野达到指定大小所需的 bottleneck 数量大大减少,得到的 BlazeBlock 有下图所示的两种结构:
推荐阅读
- xyg|第三轮分组名单公布,检验XYG实力的时候到了,S组首战就是大魔王
- lpl|狂铁新皮到手,新出装思路公布,1套打法是核心,英雄弱点揭晓!
- 原神|原神:新版本直播送300原石!新版本卡池公布,阿贝多和优菈复刻
- edg战队|外媒公布最新世界赛决赛含金量TOP10,EDG对DK这场登顶
- 腾讯|腾讯Q3财报公布,青少年游戏时长仅占比0.7%,目标却远不止此
- 手机游戏|2021英雄联盟手游破晓杯嘉宾评论员和嘉宾解说公布!
- |《英雄联盟手游》当前版本最强上分英雄公布,阿克尚最强团战“利器”,上分很简单
- s11全球总决赛|炉石传说平衡补丁公布,2400点奥术之尘,不知道你能拿到多少?
- 腾讯|10月网吧热力排行榜公布,LOL第一原神第8,前20腾讯占据10款
- 杨玉环|9号碎片商店更新公布,胡桃夹子参与活动领取,杨玉环春节新皮肤官宣确定