喜马拉雅|致敬单田芳,语音AI让已故大师再次“书接上回”( 二 )


为致敬单老 , 传承文化 , “书接上回——新评书传承计划”也已启动 , 希望借此能让越来越多的评书爱好者和青年评书演员 , 参与到新评书的创造中 , 丰富和传承评书这份非物质文化遗产。
复现“云遮月”嗓音
喜马拉雅智能语音实验室的卢恒博士介绍 , 他们长期专注于语音合成、识别、语音信号处理、编解码以及智能音效的研究和开发 , 是喜马拉雅的核心部门 。 再次听到那标志性的“云遮月”嗓音 , 得益于该语音实验室对单田芳先生声音的潜心探索和研发 。 为了能最大程度保留单老那苍劲、沙哑的独特嗓音以及情感充沛的评书腔调 , 智能语音实验室下了不少功夫 。
除了复现了单老独特嗓音 , 就连他那情感充沛、起伏跌宕的腔调也一并保留了下来 。 当那个与单田芳先生本人声音极其相似、近乎于本尊的AI合成音自然流畅地说起评书时 , 昔日那位仅凭一张嘴就让人欲罢不能的说书人似乎又重新回到了我们身边 。
为了让听众通过耳朵就能获得身临其境的沉浸式体验 , 每一部“单式新作”都添加了配乐和音效 。 高级音效设计师的加持 , 使单老口中的世界变得更加立体和生动了 。
卢恒博士解释:“相较一般的合成音频 , 评书中有很多场景描写和不同的情绪表达 , 尤其单田芳先生善以声音塑造角色 , 他的评书中韵律起伏变化非常之大 。 其中还有很多口语化发音 , 和普通话的发音大不相同 。 比如 , ‘这个’中的‘这’字 , 普通话发音‘zhè’ , 但在评书中通常读为‘zhèi’ 。 如果仅靠当前主流的 TTS 框架模型做提取和合成 , 合成评书最终的整体感情和情绪都会很平淡 , 没有了原作的跌宕起伏 。 ”
【喜马拉雅|致敬单田芳,语音AI让已故大师再次“书接上回”】“为了解决这一难题 , 我们自主设计了单独的韵律提取模块 , 并将其融入到 HiTTS 技术框架中 。 这就意味着 , 不管单田芳先生评书中的韵律多么丰富和多变 , 都能提取并完全复刻出来 , 让单老的AI合成音仿佛本尊再现 。 另外一方面 , 针对单老评书中区别于标准普通话的发音 , 团队还开创性地设计了口音模块并对这些特殊发音进行了标注 , 使得单老AI合成音能够原汁原味还原出老味道 。 ”就这样 , 原汁原味的单田芳“声音”复现了 。

推荐阅读