搜狗同传：用 3.0 技术撬动 AI 语音市场更大版图( 五 )_摘要：先爬再走后跑

实际上，」每个演讲者都有一套自己的话语体系，」陈伟指出，基于搜狗同传 2.0 ，团队引入 OCR 技术，通过摄像头或数据线来捕捉 PPT 内容，算法实时在后端分析 PPT 的核心关键词，搜狗同传 3.0 的就绪度已完成了 50% 。

\n \n

识别翻译协同模块进化前后的语句对比

\n \n

\n 多模态+知识图谱=语境引擎 \n

当自动化定制成为过去式，最新发布的搜狗同传 3.0 ，内核进化成为了「语境引擎」。除了「语音信息+OCR」的结合方式，升级后的产品，最大亮点是在「能听会看」的多模态基础上，注入了思考和推理能力，背后靠的是知识图谱的加持。

从机器同传的流程来看，当机器视觉捕捉到核心关键词之后，会根据搜狗的知识图谱技术，把相关的词汇以及专业领域相关的词语拓展出来，作为语音识别和翻译的加强。

这一点非常重要。通过语境引擎构建的个性化知识，团队在某一专业论坛做了测试评估，结果显示其识别准确率提升了 21.7% ，翻译正确率提升了 40.3% 。补足了上一代从 PPT 获许不到太多关键词的短板。

搜狗同传：用 3.0 技术撬动 AI 语音市场更大版图( 五 )