OCR识别简介

text":"

OCR简介

光学字符识别 Optical Character Recognition(OCR)其目标是对图像中的字符进行分析识别 , 将其转换为文本格式的字符序列 。 利用模式识别和数字图像处理技术 , 解决文字输入问题 。 按输入方式分类

印刷体文字手写体文字(由扫描仪输入/由手写板输入)按识别字符集分类

英文 , 中文 , 日文 , 韩文等中文 , 常用4000字 , 各种字体 , 相似字不易区分面向应用的OCR

牌照 , 票据 , 文稿 , 名片 , 身份证 , 驾驶执照 , 汽车制造业 。 身份证识别

识别身份证图片中的个人信息和数字编号一个典型的身份证识别算法流程图如下:

图像预处理

降噪 滤波、光照处理增强(可选) 灰度拉伸二值化 由灰度图像变成二值图像倾斜校正 Hough变换、投影法图像分割

行分割身份证图像字符信息分布规则 , 每行有一定间隙;采用水平投影法进行图像分割

推荐阅读