Blog1

标签: 训练方法

此标签下有1条笔记。

  • 2026年4月30日

    推理模型训练方法比较 DeepSeek-R1 vs Kimi k1.5 vs Qwen3

    • 推理模型
    • DeepSeek
    • Kimi
    • Qwen
    • RL
    • GRPO
    • 训练方法
    • 对比

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community