原创<br> 从打造智能硬件到开放听写服务,搜狗AI之变( 七 )

具体而言,首先搜狗开放了高准确度的语音转写能力,并支持10余种语音识别及方言识别。它采用业界领先的深层Transformer-based 端到端声学模型、神经网络语言模型、智能标点预测技术等,语音转写准确率可达95% 以上。

第二,麦克风阵列和语音增强技术。搜狗基于“云端+本地”结合,打造了双麦语音方案,并针对远场噪音环境,做了专门的降噪算法。

第三,个性化语音识别技术。语音转写时,关键词识别错误给用户体验带来的体验是糟糕的。搜狗通过打通输入法账号体系,基于产品中用户数据的使用习惯,自动挖掘用户的个性化词组,使用户常用语的转写错误率下降40%以上。

第四,智能编辑与多端同步编辑。语音转写不是目的,用户的最终目的是编辑成文。通过云端智能纠错编辑技术,搜狗听写可以针对置信度低的转写结果提供多个候选词,针对口头语、重复词进行自动文本顺滑。此外它还支持三到四人的人声识别,语音转写时在内容上自动区分说话人。

第五,云存储服务。用户的录音和文字都可以长期安全地保存在云端。

推荐阅读