澎思科技资深算法研究员罗伯特:有限算力资源下的深度学习与人脸识别( 三 )

澎思科技资深算法研究员罗伯特:有限算力资源下的深度学习与人脸识别

传统算法主要有两个步骤。其中第一步为“手动特征提取”,即按照当前分类任务手动定义特征提取方法。下图显示对于文字图像的边缘特征,总共四个方向的边缘特征。深度学习之前,基于四个方向的边缘特征在文字识别领域非常流行,因为文字图像边缘特征的判别能力好于原始图像像素的判别能力。

澎思科技资深算法研究员罗伯特:有限算力资源下的深度学习与人脸识别

传统算法第二步为“训练参数”,参数训练是基于在第一步提取好的特征进行的。下图显示对于文字特征向量的建模,每类由多维高斯分布建模。多维高斯分布唯一由期望值和相关矩阵描述。为了提高鲁棒性,仅仅估计了相关矩阵的前k个特征值和特征向量,后(d-k)个特征值由一个常数描述。有了每一类的参数,可以使用贝叶斯分类器对未知、不在训练库的新图像提取特征,并对提取好的特征进行分类。

澎思科技资深算法研究员罗伯特:有限算力资源下的深度学习与人脸识别

推荐阅读