Blog1
Search
搜索
暗色模式
亮色模式
探索
标签: 混合注意力
此标签下有1条笔记。
2026年4月30日
MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention
论文
LLM
推理模型
Lightning-Attention
混合注意力
CISPO
RL-Scaling
MoE