Blog1
Search
搜索
暗色模式
亮色模式
探索
标签: 稀疏注意力
此标签下有4条笔记。
2026年4月30日
DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models
论文
LLM
稀疏注意力
RL-Scaling
Agent
推理
2026年4月30日
Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention
论文
稀疏注意力
长上下文
高效推理
DeepSeek
FlashAttention
KV-Cache
2026年4月30日
NSA 原生稀疏注意力
NSA
稀疏注意力
DeepSeek
长上下文
硬件对齐
2026年4月30日
Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention
NSA
稀疏注意力
DeepSeek
长上下文
硬件对齐