澎思科技资深算法研究员罗伯特:有限算力资源下的深度学习与人脸识别( 七 )
下面介绍一个基于ADABOOST思想的三个阶段人脸检测算法,如下图所示。总共有三个深度学习模型:PNET、RNET和ONET。PNET网络不深,只有三个卷积层,用12x12的窗口扫描图像金字塔,快速排除大量的简单负样本。留下的候选窗口用大小24x24重新抠,当作RNET的输入,RNET的计算量中等,有四个卷积层。对RNET可能没有成功排除的难负样本调用计算量比较大的ONET,输入大小为48x48,ONET有5个卷积层,构造最终的人脸/非人脸分类效果。同时ONET计算人脸5个特征点(眼睛,鼻尖,嘴角),用来在人脸比对之前做人脸矫正。
三个阶段的高效人脸检测器运行速度快,分类效果不错。然而,如果CPU跟GPU联合使用的话,CPU与GPU之间的传输数据时间不可忽略,如下图所示。
为了减少传输数据的时间,我们寻找一个阶段的人脸检测器,即只有一个深度模型的人脸检测器。下面我们来看一下一个阶段的高效人脸检测器。因为没有快速预淘汰简单负样本的步骤了,我们在前两个卷积层和欠采样层大大降低网络输入图的尺寸,缩小率为32倍。两个卷积层之后还有非常多的深度学习层,但是因图像尺寸非常小了,其计算量并不大了。一个阶段的人脸检测器没有图像金字塔了,但是有一个以上的分类输出层。输出层的输入是不同尺寸的特征图,一个阶段的人脸检测器基于特征金字塔,是克服人脸大小未知的另外一种方法。两个尺度之间跨度比较大,容易漏检特征金字塔中间大小的人脸。为了避免这种现象,设计了Inception模块。其设计特点为不同分支,分支卷积核大小不一致,最终连和不同分支。不同卷积核大小的分支构造不同大小的感受野,构造不同尺度的特征图。连续三次使用Inception模块,构造非常多的卷积核大小的组合,非常好地客服了人脸大小未知的问题。
推荐阅读
- 永劫无间|国产游戏优化都不行?永劫无间更新“黑科技”,玩家:丝滑般体验
- 吕蒙|三国志战略版:吕蒙、关银屏黑科技联动,技穷、缴械全都有
- 黄忠|三国志战略版黄忠蜀盾黑科技,蜀盾内战和打弟弟一样!
- ai|EDG夺冠,虎牙斗鱼B站直播间AI字幕黑科技比拼亮眼,虎牙的最准确
- 一加科技|钱小佳签约后平台未定,神豪“A皇”爆料,他复播不会选择斗鱼
- 地下城与勇士|DNF:堆满暴击率的4种方法!土豪靠“科技”,平民靠“变异”
- 主机掌机类游戏|我的世界:mc“穿越事件”,第一天还在砍树,数月后科技拉满!
- t1|LOL:T1黑科技时光辅助锁定赛点,六神跑酷烬DK毫无办法!
- 动视|巾帼不让须眉,新赛季女将黑科技十分惊艳,硬刚T0吴枪麒麟弓
- 剑网3|《英雄联盟手游》小法成为黑科技,打野发挥很重要