学习GAN模型量化评价,先从掌握FID开始吧( 六 )

首先,通过加载经过预训练的 Inception v3 模型来计算 FID 分数。

删除模型原本的输出层,将输出层换为最后一个池化层(即全局空间池化层)的激活函数输出值。此输出层有 2,048 维的激活向量,因此,每个图像被预测为 2,048 个激活特征。该向量被称为图像的编码向量或特征向量。

针对一组来自问题域的真实图像,预测 2,048 维的特征向量,用来提供真实图像表征的参考。然后可以计算合成图像的特征向量。

结果就是真实图像和生成图像各自的 2,048 维特征向量的集合。

然后使用以下公式计算 FID 分数:

该分数被记为 d^2,表示它是一个有平方项的距离。

「mu_1」和「mu_2」指的是真实图像和生成图像的特征均值(例如,2,048 维的元素向量,其中每个元素都是在图像中观察到的平均特征)。

C_1 和 C_2 是真实图像的和生成图像的特征向量的协方差矩阵,通常被称为 sigma。

推荐阅读