Tuna-2(Meta AI)

Tuna-2 是 Meta AI、香港大学和 Waterloo 大学在 2026 年 4 月发布的无编码器统一多模态模型。

  • 机构:Meta AI、The University of Hong Kong、University of Waterloo
  • 架构:Qwen2.5-7B-Instruct + patch embedding(无 VAE、无 SigLIP 等编码器)
  • 关键创新:首次证明统一多模态模型不需要任何预训练视觉编码器,直接在像素空间端到端学习
  • 对比实验:Tuna-2(无编码器)vs Tuna-R(有 SigLIP2 编码器)→ 理解任务上无编码器更优
  • Benchmark:GQA 65.0、MMMU 50.7、GenEval 等多项超越同规模模型
  • 开源:项目页面 tuna-ai.org/tuna-2