搜狗同传:用 3.0 技术撬动 AI 语音市场更大版图( 七 )

\n \n

语境引擎是搜狗同传3.0取得突破的关键

\n \n

\n 2B 最终落向 2C \n

「我们认为未来面向人和机器交互过程中 , 一定是多模态的」 , 搜狗提倡的技术主张 , 使机器同传和同类产品拉开了一代之差 。 「他们还是以同传为主 , 我们已经从语音跨到了多模态 , 并把对于知识和语音的理解放进去 , 使同传开始具备一定的认知能力 。 」

\n

必须要承认的是 , 无论是搜狗同传还是其他玩家 , 大家目前距离顶级同传的水准还有很长的路要走 。 虽然真正到金字塔塔尖的同传人才十分稀少 , 但陈伟认为目前的机器同传能力和顶级人工同传相比 , 仍存在不小的差距 。

\n

显然 , 针对极高规格的会议场景 , 现阶段的机器同传还达不到要求 。 不过在复杂要求不高 , 辅助观众和听众跨语言交流的用途中 , 其发挥的作用愈发明显 。 因此 , 行业应该要抱着向人工同传学习的态度 , 「而不能说今天六级 , 明天八级 , 后天机器超越人工了 , 这不是特别好的心态 。 」

\n

除了大会演讲这种 2B 同传场景 , 未来 , 机器同传可向记者采访、跨国办公会议、中英文视频直播、字幕翻译等场景延展 。 这些应用场景最主要的挑战 , 是怎么保证机器同传的稳定效果 , 考验的是采集设备、网络环境、识别能力等 。 「预计迭代到 3.5 的版本 , 技术沉淀后的能力 , 就可以向这些场景做覆盖了 。 」

推荐阅读