比AI视频换脸还可怕！DeepMind新AI可生成逼真视频( 三 )_：比AI视频换脸还可怕！DeepMind新AI可

同时，研究人员们表示，Kinetics-600具有多样化特征，能消除他们对过拟合（Overfitting）的担忧。过拟合主要是指机器学习时选择的模型所包含的参数过多，以至出现这一模型对已知数据预测得很好，但对未知数据预测得很差的现象。

另一方面，DeepMind的研究人员们利用生成对抗网络（GANs）来区分生成样本和真实世界样本，该网络主要由生成器和判别器两部分组成。

GANs曾被应用在把文字转换成一幕幕的场景故事，或生成人造星系图像等任务中。而研究人员们这次使用的是名为BigGANs的生成对抗网络，该网络以大批量和数百万个参数而得名。

值得一提的是，DVD-GAN包含两个判别器。一个是空间判别器（Spatial Discriminator：D_S），该判别器通过随机采样全分辨率帧并单独处理，以评估单个帧的内容和结构；另一个是时间判别器（Temporal Discriminator：D_T），它可以提供一个能生成动作的学习信号。

此外，DVD-GAN还有一个单独的Transformer模块，它可以让学习信息在整合AI模型中传播。

比AI视频换脸还可怕！DeepMind新AI可生成逼真视频( 三 )