Blog1
Search
搜索
暗色模式
亮色模式
探索
标签: 语言模型
此标签下有2条笔记。
2026年4月30日
Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer
论文
MoE
稀疏模型
条件计算
语言模型
机器翻译
2026年4月30日
Switch Transformers: Scaling to Trillion Parameter Models with Simple and Efficient Sparsity
论文
MoE
稀疏模型
语言模型
模型并行
蒸馏