Blog1

标签: DeepSeek

此标签下有14条笔记。

  • 2026年4月30日

    DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

    • 论文
    • 推理
    • 强化学习
    • RL
    • GRPO
    • 蒸馏
    • DeepSeek
    • LLM
  • 2026年4月30日

    Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

    • 论文
    • 稀疏注意力
    • 长上下文
    • 高效推理
    • DeepSeek
    • FlashAttention
    • KV-Cache
  • 2026年4月30日

    国产大模型技术路线比较

    • comparison
    • DeepSeek
    • Kimi
    • Qwen
    • 国产大模型
  • 2026年4月30日

    推理模型训练方法比较 DeepSeek-R1 vs Kimi k1.5 vs Qwen3

    • 推理模型
    • DeepSeek
    • Kimi
    • Qwen
    • RL
    • GRPO
    • 训练方法
    • 对比
  • 2026年4月30日

    GRPO 分组相对策略优化

    • GRPO
    • RL
    • 强化学习
    • 推理模型
    • DeepSeek
    • PPO
  • 2026年4月30日

    MLA 多头潜在注意力

    • MLA
    • 注意力机制
    • KV-cache
    • 推理效率
    • DeepSeek
    • MoE
  • 2026年4月30日

    MoE 混合专家模型

    • MoE
    • 架构
    • DeepSeek
    • Kimi
    • Qwen
    • Google
    • Switch-Transformer
  • 2026年4月30日

    NSA 原生稀疏注意力

    • NSA
    • 稀疏注意力
    • DeepSeek
    • 长上下文
    • 硬件对齐
  • 2026年4月30日

    多模态 Agent

    • Agent
    • 多模态
    • Kimi
    • DeepSeek
    • 工具使用
  • 2026年4月30日

    测试时计算扩展

    • test-time-compute
    • 推理模型
    • scaling
    • MiniMax
    • DeepSeek
  • 2026年4月30日

    知识蒸馏

    • 知识蒸馏
    • 推理模型
    • 模型压缩
    • 能力迁移
    • DeepSeek
    • Kimi
  • 2026年4月30日

    DeepSeek 系列模型

    • DeepSeek
    • LLM
    • MoE
    • 推理模型
    • Agent
  • 2026年4月30日

    Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

    • NSA
    • 稀疏注意力
    • DeepSeek
    • 长上下文
    • 硬件对齐
  • 2026年4月30日

    国产大模型演进

    • 国产大模型
    • DeepSeek
    • Kimi
    • Qwen
    • LLM
    • 演进

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community