比较页面
此目录包含方法、模型、论文、数据集之间的系统比较。每篇比较不仅是事实罗列,更包含我的分析和判断。
架构与方法
- 统一多模态模型架构比较 — 7 个 UMM 的架构路线 + 编码器之争、离散vs连续、涌现vs高效的深度分析
- 编辑方法能力演进 — 从 InstructPix2Pix 到 VisionCreator 的五代能力矩阵 + 关键转折点分析
- Vision Transformer 架构比较 — ViT→Swin→MLP-Mixer:归纳偏置剥离实验视角,通用 backbone 之争
推理与训练
- 推理增强方法比较 — CoT→ToT→GoT→推理模型:外部提示到内部训练的范式转移,有效思考量统一框架
- LLM 缩放定律比较 — Kaplan vs Chinchilla:方法论偏置、过度训练策略、MoE 缩放定律扩展
- GPT 系列代际比较 — GPT-1→GPT-4o:规模→方法→模态的驱动力转移,技术保密困境
数据
- 指令编辑数据集比较 — 7 个编辑数据集的全维度对比 + 五种数据生成范式演进 + 合成vs真实、质量vs数量的思考
模型与生态
- 国产大模型技术路线比较 — DeepSeek vs Kimi vs Qwen:MoE 架构、推理训练、Agent 能力的三种技术哲学
- 多模态 Embedding 模型比较 — Magic-MM-Embedding vs ObjEmbed vs RzenEmbed vs SAIL-Embedding 四维度对比
情感
- 情感表示方法比较 — 离散 vs 连续情感 + EmoEdit vs EmotiCrafter 深度对比 + Arousal 为什么更难 + 融合方案