百度地图“语音定制”出彩背后,技术的温度更暖心( 二 )

有了百度地图的语音定制功能后 , 用户不仅可以使用自己或家人的语音包畅游景区听播报 , 还可以将录制的个人语音包还可以分享给亲朋好友 , 无论是思念游子的父母、还是异地的恋人都能通过地图语音包与亲人更“近”一步 。 这种亲近感 , 极大提升了地图软件的使用体验 , 也是用户普遍都希望在地图软件上看到的新特征 。

百度地图“语音定制功能”的发布 , 标志着地图导航进入“语音定制”时代 。

二、MEITRON模型技术:百度地图“语音定制”实现的关键

从技术角度看 , 要实现这种极受欢迎的语音定制 , 地图软件的制作技术必须要跨越三大门槛:灵活的音色转换、朗读的多情感化、语音的韵律迁移 。 而目前能够跨越这些技术障碍的 , 只有百度一家 。

据了解 , 百度为实现语音定制 , 在AI技术领域独创了风格迁移技术Meitron模型 。 该模型能够以按照不同的情感模式来合成语音;并能够根据一个人的声音特征 , 合成出不同的讲话风格;甚至能够依靠少量的样本语音 , 来合成符合一个人讲话特征的专属音库 。 为了展示Meitron模型的高超能力 , 百度在今年5月还通过语音合成技术 , 利用少量的录音材料 , 专门为某位抗战老兵“再造”了栩栩如生的讲话声音 , 让他的老战友们能在时空中与其“重逢” 。

推荐阅读