Blog1

标签: DeepSeek

此标签下有14条笔记。

2026年4月30日
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning
2026年4月30日
Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention
2026年4月30日
国产大模型技术路线比较
2026年4月30日
推理模型训练方法比较 DeepSeek-R1 vs Kimi k1.5 vs Qwen3
2026年4月30日
GRPO 分组相对策略优化
2026年4月30日
MLA 多头潜在注意力
2026年4月30日
MoE 混合专家模型
2026年4月30日
NSA 原生稀疏注意力
2026年4月30日
多模态 Agent
2026年4月30日
测试时计算扩展
2026年4月30日
知识蒸馏
2026年4月30日
DeepSeek 系列模型
2026年4月30日
Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention
2026年4月30日
国产大模型演进

Created with Quartz v4.5.2 © 2026

GitHub
Discord Community