Blog1
Search
搜索
暗色模式
亮色模式
探索
标签: RL-Scaling
此标签下有2条笔记。
2026年4月30日
DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models
论文
LLM
稀疏注意力
RL-Scaling
Agent
推理
2026年4月30日
MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention
论文
LLM
推理模型
Lightning-Attention
混合注意力
CISPO
RL-Scaling
MoE