原创<br> 从打造智能硬件到开放听写服务，搜狗AI之变( 七 )_：从打造智能硬件到开放听写服务

具体而言，首先搜狗开放了高准确度的语音转写能力，并支持10余种语音识别及方言识别。它采用业界领先的深层Transformer-based 端到端声学模型、神经网络语言模型、智能标点预测技术等，语音转写准确率可达95% 以上。

第二，麦克风阵列和语音增强技术。搜狗基于“云端+本地”结合，打造了双麦语音方案，并针对远场噪音环境，做了专门的降噪算法。

第三，个性化语音识别技术。语音转写时，关键词识别错误给用户体验带来的体验是糟糕的。搜狗通过打通输入法账号体系，基于产品中用户数据的使用习惯，自动挖掘用户的个性化词组，使用户常用语的转写错误率下降40%以上。

第四，智能编辑与多端同步编辑。语音转写不是目的，用户的最终目的是编辑成文。通过云端智能纠错编辑技术，搜狗听写可以针对置信度低的转写结果提供多个候选词，针对口头语、重复词进行自动文本顺滑。此外它还支持三到四人的人声识别，语音转写时在内容上自动区分说话人。

第五，云存储服务。用户的录音和文字都可以长期安全地保存在云端。

原创<br> 从打造智能硬件到开放听写服务，搜狗AI之变( 七 )