搜狗同传:用 3.0 技术撬动 AI 语音市场更大版图( 五 )

\n

实际上 , 」每个演讲者都有一套自己的话语体系 , 」陈伟指出 , 基于搜狗同传 2.0 , 团队引入 OCR 技术 , 通过摄像头或数据线来捕捉 PPT 内容 , 算法实时在后端分析 PPT 的核心关键词 , 搜狗同传 3.0 的就绪度已完成了 50% 。

\n \n

识别翻译协同模块进化前后的语句对比

\n \n

\n 多模态+知识图谱=语境引擎 \n

当自动化定制成为过去式 , 最新发布的搜狗同传 3.0 , 内核进化成为了「语境引擎」 。 除了「语音信息+OCR」的结合方式 , 升级后的产品 , 最大亮点是在「能听会看」的多模态基础上 , 注入了思考和推理能力 , 背后靠的是知识图谱的加持 。

\n

从机器同传的流程来看 , 当机器视觉捕捉到核心关键词之后 , 会根据搜狗的知识图谱技术 , 把相关的词汇以及专业领域相关的词语拓展出来 , 作为语音识别和翻译的加强 。

\n

这一点非常重要 。 通过语境引擎构建的个性化知识 , 团队在某一专业论坛做了测试评估 , 结果显示其识别准确率提升了 21.7% , 翻译正确率提升了 40.3% 。 补足了上一代从 PPT 获许不到太多关键词的短板 。

推荐阅读