老司机开车也防不胜防:被诈骗分子用假视频骗了( 三 )

“篡改难度往往取决于监控画面的整个布局。通常来讲,固定的监控摄像机,或者画面运动较规律(案例中高速行车就是运动画面较规律),画面颜色都一样,篡改难度会小一点。”

有没有更高级的篡改方式?

2017年华盛顿大学研究院的学生,利用现有的奥巴马声音和视频片段,用AI工具合成了一个非常逼真的奥巴马演讲“假视频”。在对比视频中,两人不仅话语一致,连话语节奏甚至面部肌肉的动作都是一致的,但谈吐风格却能保持各自特点。

这就是GAN(生成对抗网络)技术。GAN是一种生成模型,通过将两个神经网络的对抗作为训练准则,可以自动生成图像,包括自动篡改图像。

不过,这种篡改难度相当大,需要利用神经网络分析了数百万帧的视频,对音频和视频进行分析,并了解与声音匹配的各种口型,以此确定面部表情如何变化。

开口说话需要整个面部器官的协调,所以研究人员不仅分析了口型变化,还包括他的嘴唇、牙齿和下巴周围的皱纹,甚至还包括脖子与衣领。然后选取与音频匹配的口型,将它们嫁接到新视频中。

推荐阅读