Flow Matching

概述

Flow Matching (FM) 是 2023 年由 Meta AI 提出的一种生成建模范式,基于连续归一化流(Continuous Normalizing Flows, CNF)。它摒弃了扩散模型的 SDE 推导方式,直接在概率路径层面设计生成过程,通过回归向量场实现仿真自由(simulation-free)训练。核心优势:泛化了扩散模型,并引入 OT 路径实现更高效训练和采样。

核心原理

连续归一化流(CNF)

  • 向量场 通过 ODE 定义流映射
  • 将简单先验分布 (如高斯噪声)push-forward 为目标数据分布

Flow Matching 目标

  • 直接回归目标向量场:
  • 问题: 通常是不可处理(intractable)的。

Conditional Flow Matching (CFM)

  • 核心技巧:通过在条件概率路径 上定义条件向量场 ,证明 CFM 目标与 FM 目标梯度相同。
  • 只要能从 采样并计算 即可。

高斯条件路径统一公式

  • 向量场:
  • 满足 (从噪声出发),(到达数据)。

两种关键路径

扩散路径(Diffusion Path)

  • VP 路径:,对应 DDPM 的扩散过程。
  • VE 路径:
  • FM 用扩散路径训练比 score matching 更稳定。

最优传输路径(OT Path)

  • (均值方差均线性变化)。
  • 向量场:
  • 对应 Wasserstein-2 最优传输位移,形成直线轨迹恒定速度
  • 相比扩散路径:训练更快收敛、采样需要更少 NFE、FID 更优。

为什么 Flow Matching 比扩散模型更快

  1. 直线 vs 曲线路径:OT 路径是直线,扩散路径是曲线(可能”超调”),直线路径允许更少采样步数。
  2. 定义在有限时间区间 而非 ,无需近似截断。
  3. 向量场回归优于分数匹配:FM 直接回归向量场,训练更稳定,采样时无需 Langevin 动力学。
  4. 与 Rectified Flow 的关系:Rectified flow 使用 (固定方差=1 路径),可视为 FM-OT 在 且无方差收缩的极限情况。FLUX 和 Seedream 3.0/4.0 均使用此路径。

实例应用

模型使用的路径
原始 FM (Meta)Diffusion (VP) / OT
FLUX.1 (BFL)Rectified Flow (MMDiT)
FLUX.1 Kontext (BFL)Rectified Flow + 序列拼接
Stable Diffusion 3Rectified Flow (MMDiT)
Seedream 2.0/3.0/4.0Flow Matching (MMDiT)