Blog1
Search
搜索
暗色模式
亮色模式
探索
标签: LLM
此标签下有28条笔记。
2026年5月07日
LLM Agent 与工具使用
agent
LLM
tool-use
2026年4月30日
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
论文
推理
Prompt-Engineering
思维链
LLM
2026年4月30日
DeepSeek LLM: Scaling Open-Source Language Models with Longtermism
论文
LLM
缩放定律
开源
预训练
2026年4月30日
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning
论文
推理
强化学习
RL
GRPO
蒸馏
DeepSeek
LLM
2026年4月30日
DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model
论文
LLM
MoE
MLA
高效推理
KV-Cache
2026年4月30日
DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models
论文
LLM
稀疏注意力
RL-Scaling
Agent
推理
2026年4月30日
DeepSeek-V3 Technical Report
论文
LLM
MoE
FP8训练
MTP
负载均衡
2026年4月30日
Graph of Thoughts: Solving Elaborate Problems with Large Language Models
论文
推理
图推理
LLM
Prompt-Engineering
2026年4月30日
Kimi K2: Open Agentic Intelligence
论文
LLM
MoE
Agent
MuonClip
RL
工具使用
2026年4月30日
MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention
论文
LLM
推理模型
Lightning-Attention
混合注意力
CISPO
RL-Scaling
MoE
2026年4月30日
OneRec-Think: In-Text Reasoning for Generative Recommendation
论文
生成推荐
推理增强
CoT
GRPO
LLM
2026年4月30日
Qwen3 Technical Report
论文
LLM
MoE
推理
多语言
开源
蒸馏
2026年4月30日
Tree of Thoughts: Deliberate Problem Solving with Large Language Models
论文
推理
搜索
LLM
树搜索
CoT扩展
2026年4月30日
GPT 系列代际比较
comparison
GPT
OpenAI
LLM
multimodal
scaling
2026年4月30日
LLM 缩放定律比较
comparison
scaling-laws
Chinchilla
Kaplan
LLM
compute-optimal
2026年4月30日
GPT 系列模型
GPT
OpenAI
LLM
generation
2026年4月30日
LLM Agent 架构
agent
LLM
architecture
2026年4月30日
LoRA 低秩适配
LoRA
微调
高效训练
LLM
Stable-Diffusion
2026年4月30日
RoPE 旋转位置编码
position-encoding
RoPE
transformer
LLM
2026年4月30日
Scaling Laws
scaling
LLM
compute-optimal
Chinchilla
2026年4月30日
DeepSeek 系列模型
DeepSeek
LLM
MoE
推理模型
Agent
2026年4月30日
GPT-4o
GPT-4o
OpenAI
多模态
omni
LLM
2026年4月30日
Kimi 系列模型
Kimi
Moonshot
LLM
MoE
多模态
Agent
2026年4月30日
Qwen3
Qwen
LLM
MoE
推理模型
蒸馏
2026年4月30日
A Survey on LLM-based Autonomous Agents
agent
LLM
survey
2026年4月30日
LoRA: Low-Rank Adaptation of Large Language Models
LoRA
微调
高效训练
LLM
2026年4月30日
国产大模型演进
国产大模型
DeepSeek
Kimi
Qwen
LLM
演进
2026年4月30日
大语言模型基础
LLM
transformer
scaling
alignment