发票扫描识别,发票扫描仪
一、行业背景务共享这个概念很早以前就被提出 , 只是在实际的推广过程中遇到了很多难题 。 比如我们今天谈到的发票录入问题 。 日常生活中 , 我们几乎每天都在和各种各样的发票打交道 , 出门打车要发票 , 吃饭完毕要发票 , 发票作为报销也好 , 消费记录也好 , 都是一种重要的凭据 。 尤其是增值税发票 , 作为全国通用的票据来讲 , 其重要性不言而喻 。 一般情况常见的是每一张发票都需要录入到ERP系统当中 , 并且要做到三单匹配 , 最关键的是要认证和抵扣 。 二、行业调查那么我们今天想解决的问题就是让财务办公人员脱离手工录入的烦恼 。 利用扫描仪 OCR这两者的结合 , 来解决这一财务痛点 。 扫描仪负责纸质发票的扫描 , OCR则完成发票内容信息的提取 。 这看似非常简单的步骤其实困难重重 , 让我们简单来概括一下 。 第一点 , 就是发票的独特性 。 打印发票所用的纸质非常的特殊 , 不像A4纸张那样 , 发票的纸质一般在40克以下 , 也就是说纸质很脆 , 贴别容易撕烂 。 这给纸质发票能否通过市面上的扫描仪带了了巨大的挑战 。 第二点 , 就是打印发票所使用的打印机 , 一般发票一共有三联 , 也就是需要同时在三张纸上打印内容 , 目前使用的是传统的针式打印机 。 采用的是色带 , 不像市场上的激光打印机 , 用的是硒鼓 。 第三点 , 不得不说的就是发票上的字体 。 目前主要是有两家 , 航天信息和百旺金赋 , 这两家用的是不同的字体 。 这个后期OCR识别也带了巨大的挑战 。 三、行业方案带着这三点 , 我们来看看目前的解决方案中是如何处理的 。 首先就是扫描仪的选型 , 扫描仪必须具有发票的高通过率 , 通俗的讲就是不可以卡纸 , 因为发票易碎 , 一旦卡纸 , 很有可能就会对发票造成伤害 , 得不偿失 。 其次是图像的高度还原 , 生成的图像不可以产生变形 , 一旦变形 , 对OCR的识别会带来致命的一击 , 也就是无法识别 。 最后是扫描仪的速度 , 一分钟能扫描发票的张数 , 这个因素很大程度上决定了这套系统能帮财务人员提高多少效率 , 节省多少时间 。 然后我们来研究一下OCR , 理想情况 , OCR识别率要达到90%以上 , 才能真正的给行业带来效益 。 那么要达到这么高的识别率 , 最起码要做到哪些基本的图像处理呢?想必大家能想到的无非是以下这些 , 譬如图像纠偏 , 图像方向检测 , 图像分色 , 印章提取和去除 , 包括红色、绿色、蓝色表格线的滤除 , 还有由于针式打印机导致的字符链接问题 。 只有把这些基本的因素处理到位 , 才能确保OCR拥有高识别率 , 让财务人员手工修改量达到最少 。
推荐阅读
- steam|DNF:又一场“发票圣战”?策划实力甩锅!短短几分钟公告又改了
- 扫描仪|梦幻西游:队长的眼睛是扫描仪吗?躲在界面下面的地煞都被找到了
- 流氓公司第4赛epic包|第五人格:据说官方已制作人脸识别系统,漏网之鱼要夜不能寐了
- 人脸识别|接入人脸识别认证,网易游戏再次优化防沉迷系统
- 死亡赔偿金|两孩子游戏花掉父亲 22 万死亡赔偿金,用奶奶信息绑定并人脸识别
- 孤岛惊魂6|《孤岛惊魂6》现神秘二维码!扫描视频或暗示添加大逃杀模式
- 王者荣耀|防沉迷“破防”,17次人脸识别都是“本人”,平台公开承认无能为力
- 王者荣耀|王者荣耀:防沉迷新规?上线就人脸识别,小学生彻底说拜拜!
- 身份证|玩家用奶奶身份证防沉迷,8次“人脸识别”后,屏幕弹出14个字!
- 端游|大型端游却被显卡驱动识别错误,中国游戏市场真的没救了吗?