Blog1
Search
搜索
暗色模式
亮色模式
探索
标签: DeepSeek
此标签下有14条笔记。
2026年4月30日
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning
论文
推理
强化学习
RL
GRPO
蒸馏
DeepSeek
LLM
2026年4月30日
Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention
论文
稀疏注意力
长上下文
高效推理
DeepSeek
FlashAttention
KV-Cache
2026年4月30日
国产大模型技术路线比较
comparison
DeepSeek
Kimi
Qwen
国产大模型
2026年4月30日
推理模型训练方法比较 DeepSeek-R1 vs Kimi k1.5 vs Qwen3
推理模型
DeepSeek
Kimi
Qwen
RL
GRPO
训练方法
对比
2026年4月30日
GRPO 分组相对策略优化
GRPO
RL
强化学习
推理模型
DeepSeek
PPO
2026年4月30日
MLA 多头潜在注意力
MLA
注意力机制
KV-cache
推理效率
DeepSeek
MoE
2026年4月30日
MoE 混合专家模型
MoE
架构
DeepSeek
Kimi
Qwen
Google
Switch-Transformer
2026年4月30日
NSA 原生稀疏注意力
NSA
稀疏注意力
DeepSeek
长上下文
硬件对齐
2026年4月30日
多模态 Agent
Agent
多模态
Kimi
DeepSeek
工具使用
2026年4月30日
测试时计算扩展
test-time-compute
推理模型
scaling
MiniMax
DeepSeek
2026年4月30日
知识蒸馏
知识蒸馏
推理模型
模型压缩
能力迁移
DeepSeek
Kimi
2026年4月30日
DeepSeek 系列模型
DeepSeek
LLM
MoE
推理模型
Agent
2026年4月30日
Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention
NSA
稀疏注意力
DeepSeek
长上下文
硬件对齐
2026年4月30日
国产大模型演进
国产大模型
DeepSeek
Kimi
Qwen
LLM
演进