FID (Fréchet Inception Distance) ↓
- 用途: 衡量生成图像集的真实性 (Realism) 和多样性 (Diversity)。
- 原理: FID 认为,如果生成图像集的特征分布与真实图像集的特征分布非常接近,那么生成的图像就足够好。
- 计算方法:
- 准备一个大规模的真实图像集和一个生成图像集。
- 用一个预训练好的 InceptionV3 网络的中间层来提取每张图片的特征向量。
- 假设真实图像和生成图像的特征向量分别服从两个多元高斯分布,计算出这两个分布的均值 () 和协方差矩阵 ()。
- 计算这两个高斯分布之间的 Fréchet 距离(也叫 Wasserstein-2 距离):
- 优缺点:
- 优点: 与人类的感知判断有很强的相关性,是目前公认的评估生成模型质量的黄金标准之一。
- 缺点: 需要大量的样本(通常上万张)才能得到稳定的结果,计算成本较高,且对 InceptionV3 模型有依赖。
- 解读: FID 越低说明生成质量越高