FID (Fréchet Inception Distance)

  • 用途: 衡量生成图像集的真实性 (Realism)多样性 (Diversity)
  • 原理: FID 认为,如果生成图像集的特征分布与真实图像集的特征分布非常接近,那么生成的图像就足够好。
  • 计算方法:
    1. 准备一个大规模的真实图像集和一个生成图像集。
    2. 用一个预训练好的 InceptionV3 网络的中间层来提取每张图片的特征向量。
    3. 假设真实图像和生成图像的特征向量分别服从两个多元高斯分布,计算出这两个分布的均值 () 和协方差矩阵 ()。
    4. 计算这两个高斯分布之间的 Fréchet 距离(也叫 Wasserstein-2 距离):
  • 优缺点:
    • 优点: 与人类的感知判断有很强的相关性,是目前公认的评估生成模型质量的黄金标准之一。
    • 缺点: 需要大量的样本(通常上万张)才能得到稳定的结果,计算成本较高,且对 InceptionV3 模型有依赖。
  • 解读: FID 越低说明生成质量越高