Blog1

标签: 稀疏注意力

此标签下有4条笔记。

  • 2026年4月30日

    DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models

    • 论文
    • LLM
    • 稀疏注意力
    • RL-Scaling
    • Agent
    • 推理
  • 2026年4月30日

    Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

    • 论文
    • 稀疏注意力
    • 长上下文
    • 高效推理
    • DeepSeek
    • FlashAttention
    • KV-Cache
  • 2026年4月30日

    NSA 原生稀疏注意力

    • NSA
    • 稀疏注意力
    • DeepSeek
    • 长上下文
    • 硬件对齐
  • 2026年4月30日

    Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

    • NSA
    • 稀疏注意力
    • DeepSeek
    • 长上下文
    • 硬件对齐

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community