语音合成假冒老板 电话骗走173万!当事人:真心听不出( 四 )
随着引入了更深的layer的卷积网络模型,这些模型能编码更高维度和可解释的特征(neural style)。从原理上来说,语音克隆就是从neural style算法中汲取灵感,实现一个好的隐空间模型来生成raw audio,并用于进行语音Style Transfer。
在谷歌的NSynth中,对合并两种乐器声音的工作中已经对Style Transfer进行了研究。一般认为voice style transfer更容易评估,语音克隆则更具挑战性,因为语音在模型的隐空间中更难被表征。
通常情况下,目标风格的声音和可能会说出的原声音内容完全不同。为了实现语音克隆,会设计出这样一种模型——该模型能够在更高维信息的隐空间内对语音编码的方式进行修改,并能概括到目标语言风格,而无需在内容语音中可能出现的所有音素(最小语音单元)上进行训练。
上述模型设想,可以简称为voice transfer(CTI技术中一种语音传输方法的设计与实现),它能够让语音助理,拥有所有的不同风格,甚至创造一个拥有自己声音的语音助手。
推荐阅读
- ag战队|一诺果真AG“亲儿子”,赛后语音曝光:月光强令一诺做最终决策,网友吐槽难怪输那么惨
- 王者荣耀|王者荣耀:异界灵契技能特效升级优化,拒霜思语音二选一,上官婉儿或获得亚运会专属
- 一阵雨|DNF:宝哥合成第5块玉玺!一阵雨1分钟10个表情,能给北影当素材
- 原神|T1再次证实FPX训练赛强,队内语音迟迟未放出,LNG也意难平!
- 原神|DNF玩家RP爆发,合成2个JP辟邪玉,看到属性:一辈子不用买YXB了
- 原神|AG赛前语音曝光,猫神自黑玩梗求血包,语气卑微让人心疼
- 放开那三国3|三国杀:二蒯可以合成了?玩家:策划你对得起我吗?RNM退钱!
- ag战队|AG局内语音曝光,一诺再也不用指挥了,最初一句话拯救队伍
- 宿命|宿命回响:男主终于完成新手教学,首次和女主配合成功
- ag战队|AG队内语音曝光,月光只是傀儡,真正做BP的“主教练”是他!