澎思科技资深算法研究员罗伯特:有限算力资源下的深度学习与人脸识别( 九 )

澎思科技资深算法研究员罗伯特:有限算力资源下的深度学习与人脸识别

3.人脸跟踪与深度学习

虽然人脸检测速度快,但是每帧都做人脸检测,满足不了一个GPU实时处理数十路视频的数据。另外这种方法也放弃了帧与帧之间的关联性。假设,在帧1检测出四个人脸。在帧2出现4个人脸的概率很高,甚至4个人脸的位置跟前一帧的位置非常相似。从前一帧到当前帧人脸具体平移量是多少,这就是人脸跟踪的命题,请看下图。人脸跟踪在目标周围范围考虑问题,人脸检测在整个场景图范围考虑问题,与全局的检测相比,跟踪属于局部算法,可以大量节省整个抓拍系统的计算量。

澎思科技资深算法研究员罗伯特:有限算力资源下的深度学习与人脸识别

接下来,给大家分享一下一个属于传统算法领域的跟踪算法。其特点是运行速度非常快,数学模型和求解非常潇洒。下图的第一个数学公式是空间域中的数学模型,优化对象是相关核h,使得对在帧1的图像数据f进行滤波的话,得到跟标签g尽可能接近的值,其中*代表循环卷积。标签g经常选择为高斯函数。正则化系数lambda控制过度适应现象。利用傅里叶变换和相应的一些数学定理,可以把空间域建模问题等价地描述在频率域。大写字母符号代表小写字母符号的傅里叶变换。卷积定理把耗时的循环卷积操作改成快速的乘法。频率域的解析式形式很简单,只有乘法、加法和除法的操作。在帧2,对空间域的图像数据z应用傅里叶变换,跟在帧1学到的模板H进行乘法,得到频率域的响应Y,再用逆傅里叶变换回到空间域,得到空间域的响应y。最终跟踪效果为响应y最大值的对应的位置。

推荐阅读