Flow Matching for Generative Modeling

核心结论

Flow Matching (FM) 是一种新的生成建模范式，基于连续归一化流（CNF），无需模拟即可高效训练。FM 通过回归条件概率路径的向量场实现训练，兼容通用高斯概率路径族，将扩散路径作为特例。最优传输（OT）路径比扩散路径更高效：形成直线轨迹（而非曲线），训练更快、采样更快、泛化更好。

Flow Matching 目标： $L_{FM} (θ) = E_{t, p_{t} (x)} ∥ v_{t} (x) - u_{t} (x) ∥^{2}$ ，直接在时间区间 $[0, 1]$ 上回归目标向量场 $u_{t}$ 。
Conditional Flow Matching (CFM)：利用条件概率路径 $p_{t} (x ∣ x_{1})$ 和条件向量场 $u_{t} (x ∣ x_{1})$ ，CFM 目标 $L_{CFM}$ 与 FM 具有相同梯度，但只需逐样本计算即可。
高斯条件路径的统一框架： $p_{t} (x ∣ x_{1}) = N (x ∣ μ_{t} (x_{1}), σ_{t} (x_{1})^{2} I)$ ，向量场为 $u_{t} (x ∣ x_{1}) = \frac{σ _{t}^{'}}{σ _{t}} (x - μ_{t}) + μ_{t}^{'}$ 。
两种路径实例：
- 扩散路径（VP/VE）：从 SDE 推导出的特定 $μ_{t}$ 、 $σ_{t}$ 选择，恢复到 DDPM 的分数匹配。
- OT 路径： $μ_{t} = t x_{1}$ ， $σ_{t} = 1 - (1 - σ_{m i n}) t$ ，形成 Wasserstein-2 最优传输位移，直线轨迹、恒定速度。
实验效果：ImageNet 上 FM-OT 在 NLL 和 FID 上均优于扩散方法，且收敛更快的训练，所需 NFE（函数评估次数）更少。