语音|致敬单田芳,喜马拉雅用AI语音让已故大师声音重现( 二 )



语音|致敬单田芳,喜马拉雅用AI语音让已故大师声音重现
文章图片

完美复现
时隔三年 , 能够再次听到那标志性的“云遮月”嗓音 , 得益于喜马拉雅智能语音实验室对单田芳先生声音的潜心探索和研发 。 为了能最大程度保留单老那苍劲、沙哑的独特嗓音以及情感充沛的评书腔调 , 喜马拉雅智能语音实验室下了不少功夫 。
喜马拉雅智能语音实验室长期专注于语音合成、识别、语音信号处理、编解码以及智能音效的研究和开发 , 是喜马拉雅的核心部门 。
【语音|致敬单田芳,喜马拉雅用AI语音让已故大师声音重现】为了重现单老的声音 , 向传统艺术致敬 , 喜马拉雅的智能语音实验室不仅完美复现了单老苍劲、沙哑的“云遮月”式独特嗓音 , 就连他那情感充沛、起伏跌宕的腔调也一并保留了下来 。 当那个与单田芳先生本人声音极其相似、近乎于本尊的AI合成音自然流畅地说起评书时 , 昔日那位仅凭一张嘴就让人欲罢不能的说书人似乎又重新回到了我们身边 。
喜马拉雅还请来专业音效师为每一部“单式新作”都添加了配乐和音效 , 让听众通过耳朵就能获得身临其境的沉浸式体验 。 高级音效设计师的加持 , 使单老口中的世界变得更加立体和生动了 。
相较一般的合成音频 , 评书中有很多场景描写和不同的情绪表达 , 尤其单田芳先生善以声音塑造角色 , 他的评书中韵律起伏变化非常之大 。 其中还有很多口语化发音 , 和普通话的发音大不相同 。 比如 , “这个”中的“这”字 , 普通话发音“zhè” , 但在评书中通常读为“zhèi” 。 如果仅靠当前主流的 TTS 框架模型做提取和合成 , 合成评书最终的整体感情和情绪都会很平淡 , 没有了原作的跌宕起伏 。
为了解决这一难题 , 喜马拉雅智能语音实验室自主设计了单独的韵律提取模块 , 并将其融入到 HiTTS 技术框架中 。 这就意味着 , 不管单田芳先生评书中的韵律多么丰富和多变 , 都能提取并完全复刻出来 , 让单老的AI合成音仿佛本尊再现 。 另外一方面 , 针对单老评书中区别于标准普通话的发音 , 团队还开创性地设计了口音模块并对这些特殊发音进行了标注 , 使得单老AI合成音能够原汁原味还原出老味道 。
就这样 , 原汁原味的单田芳“声音”复现了 。

语音|致敬单田芳,喜马拉雅用AI语音让已故大师声音重现
文章图片

声音想象
单田芳“声音”的完美复现并非偶然 。 喜马拉雅已在TTS领域潜心钻研多年 , TTS技术将助力喜马拉雅在现有的“UGC + PGC + PUGC”内容生态之外 , 进一步拓展AIGC的可能性 。
喜马拉雅智能语音实验室的卢恒博士表示 , 针对小说的TTS系统和音色选取是喜马拉雅TTS的亮点与特色 。 用真实自然的TTS音色演绎有声小说是非常难的 , 不同于普通的文字转语音 , 用TTS音色演绎小说需要学习小说中的抑扬顿挫、情感表达、上下文关系 , 区分旁白和对白 , 并最终将作品完美演绎出来 。 “喜马拉雅在这方面有着天然的优势 。 在音频赛道耕耘多年后 , 喜马拉雅已经聚集了海量有声书内容和众多优秀主播 。 喜马拉雅智能语音实验室尝试用各式的声音来表达不同的情感、题材和频道 , 因而就有了更大的试验和发挥空间 。 ”

推荐阅读