百度地图推出语音定制功能,一次真正意义上的技术普惠众生( 三 )

2、进入页面后,点击最下方的悬浮按钮“录制我的语音”便可进入语音录制选择界面,进行录制选择。

百度地图推出语音定制功能,一次真正意义上的技术普惠众生

3、按照规则提升,确认后即可开启专属语音定制。

百度地图推出语音定制功能,一次真正意义上的技术普惠众生

当然,上述两种方法,均需要用户在录入完语音文本后,在等待20分钟左右的专属语音包的生成时间。

背后黑科技——说话人韵律迁移技术Meitron

于是,问题随之而来,百度地图是如何让这件三年前看起来怎么也不可能实现的事情,正式走进普通用户群体,让我们普通人都能录制属于自己的语音导航包?

其背后离不开百度独创的说话人韵律迁移技术 Meitron这一黑科技的支撑。这个技术可以将语音中的音色、风格、情感等要素映射到不同的子空间,在使用时,不同要素可以任意组合,灵活的控制合成语音的风格。作为百度大脑5.0在语音技术上交出的成绩单之一,事实上,这技术是专门为了解决现阶段语音合成技术面临的风格迁移、音色模拟和情感拟人这三大挑战而诞生。从相关资料来看,自2016年开始,百度就通过采用深度学习的离线参数合成、全面深度学习的EMPHASIS声学建模、Tacotron+WaveRNN的联合训练等新技术来训练、提升语音合成产品落地,时至今日已经逐渐取得行业领先的语音合成产品体验成果。

推荐阅读