AI诈骗电话克隆声音,这个CEO被骗173万( 六 )
视频演示
该系统由三个经过独立训练的组件组成:
speaker encoder网络
基于Tacotron 2的序列到序列合成网络,其以语音嵌入为条件,从文本生成mel频谱;
一个自动回归的基于WaveNet的声码器,它将mel频谱图转换为一系列时域波形样本。
Speaker Encoder是谷歌之前提出的说话人鉴别网络,该深度网络单独预训练,训练语料使用大量的说话人音频,不需要对应文本,且音频可以充满噪音,该部分网络输出固定大小的speaker embedding,说话人向量就编码了说话人的声音特征。
这项研究证明了所提出的模型能够将由经过判别训练的说话者编码器学习的说话者可变性的知识传递给多语言TTS任务,并且在看不到说话者的情况下能够从训练期间合成自然语音。
最后,我们证明随机抽样的speaker embedding可以用来合成新说话人语音中的语音,这表明该模型获得了高质量的说话人表示。
论文地址:https://papers.nips.cc/paper/7700-transfer-learning-from-speaker-verification-to-multispeaker-text-to-speech-synthesis.pdf
推荐阅读
- 网易游戏|网易游戏的策划半夜三点给玩家打电话:我是海马濑人!
- 教室|LOL手游新模式预测!末日人机克隆在列!玩家最期待的是无限火力
- edg战队|崩坏3女武神来电让玩家社死,接电话被未婚妻听见:琪亚娜是谁?
- 地下城与勇士|DNF:克隆天空“烂大街”,1件透明1500W金币,拍卖行升级券大跌
- 翠神|LOL:五个大柱子辣是真滴折磨,玩家克隆被暴打求招:怎么打巨魔
- 锤石|克隆五黑惩戒流锤石,1333层被动拿38杀
- blg|“管泽元退出预测界”,WE干碎BLG,微笑怒打电话警告管泽元
- 小青龙|王者荣耀西施新皮被买爆,克隆10人全是小青龙,3大原因是重点?
- 天谕|PDD探秘“女仆店”,粉丝戏称董卓酒池肉林,中途还打电话给UZI
- 火星|《合金弹头》火星克隆人的幕后黑手,抽取主角的基因制造怪物