Blog1
Search
搜索
暗色模式
亮色模式
探索
标签: 蒸馏
此标签下有5条笔记。
2026年4月30日
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning
论文
推理
强化学习
RL
GRPO
蒸馏
DeepSeek
LLM
2026年4月30日
Qwen3 Technical Report
论文
LLM
MoE
推理
多语言
开源
蒸馏
2026年4月30日
Switch Transformers: Scaling to Trillion Parameter Models with Simple and Efficient Sparsity
论文
MoE
稀疏模型
语言模型
模型并行
蒸馏
2026年4月30日
Qwen3
Qwen
LLM
MoE
推理模型
蒸馏
2026年4月30日
Qwen3 Technical Report
Qwen
推理模型
MoE
蒸馏
thinking-budget