Blog1

标签: RL-Scaling

此标签下有2条笔记。

  • 2026年4月30日

    DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models

    • 论文
    • LLM
    • 稀疏注意力
    • RL-Scaling
    • Agent
    • 推理
  • 2026年4月30日

    MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention

    • 论文
    • LLM
    • 推理模型
    • Lightning-Attention
    • 混合注意力
    • CISPO
    • RL-Scaling
    • MoE

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community