Blog1

标签: 推理

此标签下有9条笔记。

  • 2026年4月30日

    Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

    • 论文
    • 推理
    • Prompt-Engineering
    • 思维链
    • LLM
  • 2026年4月30日

    Competitive Programming with Large Reasoning Models

    • 论文
    • 推理
    • 竞赛编程
    • o1
    • o3
    • CodeForces
    • IOI
    • RL
  • 2026年4月30日

    DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

    • 论文
    • 推理
    • 强化学习
    • RL
    • GRPO
    • 蒸馏
    • DeepSeek
    • LLM
  • 2026年4月30日

    DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models

    • 论文
    • LLM
    • 稀疏注意力
    • RL-Scaling
    • Agent
    • 推理
  • 2026年4月30日

    Graph of Thoughts: Solving Elaborate Problems with Large Language Models

    • 论文
    • 推理
    • 图推理
    • LLM
    • Prompt-Engineering
  • 2026年4月30日

    Kimi k1.5: Scaling Reinforcement Learning with LLMs

    • 论文
    • 推理
    • RL
    • 长上下文
    • 多模态
    • 训练基础设施
    • Long2Short
  • 2026年4月30日

    OCRBench v2: An Improved Benchmark for Evaluating Large Multimodal Models on Visual Text Localization and Reasoning

    • 论文
    • OCR
    • Benchmark
    • 多模态
    • LMM
    • 文字识别
    • 文本定位
    • 推理
  • 2026年4月30日

    Qwen3 Technical Report

    • 论文
    • LLM
    • MoE
    • 推理
    • 多语言
    • 开源
    • 蒸馏
  • 2026年4月30日

    Tree of Thoughts: Deliberate Problem Solving with Large Language Models

    • 论文
    • 推理
    • 搜索
    • LLM
    • 树搜索
    • CoT扩展

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community