阿里巴巴和国内外高校研究人员开发新读唇语AI,准确率大升

阿里巴巴和国内外高校研究人员开发新读唇语AI,准确率大升

----阿里巴巴和国内外高校研究人员开发新读唇语AI , 准确率大升//---- http://


首先需要理解是 , 人工智能和机器学习算法能够从视频中读取唇语并非首创 。 早在2016年 , 来自谷歌和牛津大学的研究人员就详细介绍了一个系统 , 该系统可以以46.8% 的准确率为视频片段添加注释 , 其准确率超过了专业人类读唇器的12.4% 。 但即使是最先进的系统也难以克服唇动中的模糊性 , 使其性能无法超越基于音频的语音识别 。

为了追求更高效的系统 , 阿里巴巴、浙江大学和史蒂文斯理工学院(Stevens Institute of Technology)的研究人员设计了一种方法 , 称为 LIBS(Lip by Speech) , 利用从语音识别器中提取的特征作为补充线索 。 他们说 , 在衡量准确性的在两个行业标杆基准测试上 , 它以7.66% 和2.75% 的字符错误率优于基线 。

推荐阅读