澎思科技资深算法研究员罗伯特:AI与乒乓的双面人生(11)

罗伯特在算法上的表现很快得到了老板的认可。

在2012年,铁道部的项目已经基本结束,老板觉得罗伯特应该转而去做文字识别(OCR),因为他想到一个很好的商业契机,即做一个网上答题系统。简单来说就是学生用手机拍一道题,上传到服务器中,根据文字识别技术,将拍出的图像转成文字,通过题库搜索找出最相似的题并将答案反馈给用户。

这个项目即后来红遍中国的全学科作业神器「学习宝」。

老板邀请罗伯特担任公司的联合创始人兼首席科学家。罗伯特不负所望,在一年的时间里便完成了学习宝所有模式识别算法的搭建及商用。

我们知道,即使现在在神经网络的协助下,文字识别准确率也并不如何高,更何况当时主要使用的是基于特征的传统统计方法。不过对于“学习宝”来讲这些都是可以克服的。首先,他们发现在国内学校的各种习题中主要只有四种字体:方体、宋体、楷体和黑体,针对特定的字体,即使使用传统基于特征的方法识别率也能达到97%以上。其次,即使即使100个字中有3个字识别错误也没有关系,因为题库搜索过程可以包容一定程度的不一致性。

推荐阅读