2018最佳GAN论文回顾(上)( 十 )

在经典的GAN方法中 , 生成器以一些潜在的代码作为输入 , 并输出一个图像 , 这属于它在训练阶段所学习到的分布 。 作者们通过创建一个基于样式的、由两个元素组成的生成器来背离这种设计:

1.一个全连接的网络 , 代表着非线性映射f:Z→W;

2.一个综合网络g;

全连接的网络—通过变换一个标准化的潜在向量z∈Z , 我们得到了一个中间的潜在向量w=f(z) 。 中间的潜在空间W有效地控制了生成器的样式 。 作为旁注 , 作者确保避免从W的低密度区域采样 。 虽然这可能造成w的变化损失 , 但据说最终会导致更好的平均的图像质量 。 现在 , 一个从中间的潜在空间采样的潜在向量w被输入到块“A”(训练的仿射变换)中 , 并转换成样式y=(ysyb) 。 最后通过每个卷积层的自适应实例标准化(adaptive instance normalization , AdaIN)将该风格添加到合成网络中 。 AdaIN操作是这样定义的:

合成网络— AdaIN的操作通过对其进行标准化来改变每个特征图xi , 然后使用来自样式y的分量进行比例缩放和移位 。 最后 , 生成器的特征映射也被提供了一个直接的方式来生成随机细节—显式的噪声输入—以包含不相关高斯噪声的单通道图像的形式 。

推荐阅读