不要再相信视频了!现在是连视频都能P的时代( 五 )

不要再相信视频了!现在是连视频都能P的时代

(人脸合成模型结构图)

生成器生成可用帧

这个生成器主要有多个解码器组成,它们分别为内容编码器(Content Encoder),一个鉴别编码器(Identity Encoder)、一个帧解码器(Frame Decoder)和声音解码器(Noise Generator)。

不要再相信视频了!现在是连视频都能P的时代

(生成器:多部件协力生成表情画面)

生成器接收画面和声音,并将声音通过GRU网络的深度学习方法,让画面匹配声音,以此产生可用于组成动图或视频的画面帧。

GRU是什么:是一种“循环神经网络”(RNN)特殊的类型,RNN学习通常用的是Long Short Term 网络来进行学习长期依赖信息。

而GRU是LSTM网络的一种效果很好的变体,它较LSTM网络的结构更加简单,而且效果也很好,因此也是当前非常流行的一种网络。GRU既然是LSTM的变体,因此也是可以解决RNN网络中的长依赖问题。

推荐阅读