Blog1
Search
搜索
暗色模式
亮色模式
探索
标签: 推理
此标签下有9条笔记。
2026年4月30日
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
论文
推理
Prompt-Engineering
思维链
LLM
2026年4月30日
Competitive Programming with Large Reasoning Models
论文
推理
竞赛编程
o1
o3
CodeForces
IOI
RL
2026年4月30日
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning
论文
推理
强化学习
RL
GRPO
蒸馏
DeepSeek
LLM
2026年4月30日
DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models
论文
LLM
稀疏注意力
RL-Scaling
Agent
推理
2026年4月30日
Graph of Thoughts: Solving Elaborate Problems with Large Language Models
论文
推理
图推理
LLM
Prompt-Engineering
2026年4月30日
Kimi k1.5: Scaling Reinforcement Learning with LLMs
论文
推理
RL
长上下文
多模态
训练基础设施
Long2Short
2026年4月30日
OCRBench v2: An Improved Benchmark for Evaluating Large Multimodal Models on Visual Text Localization and Reasoning
论文
OCR
Benchmark
多模态
LMM
文字识别
文本定位
推理
2026年4月30日
Qwen3 Technical Report
论文
LLM
MoE
推理
多语言
开源
蒸馏
2026年4月30日
Tree of Thoughts: Deliberate Problem Solving with Large Language Models
论文
推理
搜索
LLM
树搜索
CoT扩展