Blog1

标签: 推理增强

此标签下有2条笔记。

  • 2026年4月30日

    OneRec-Think: In-Text Reasoning for Generative Recommendation

    • 论文
    • 生成推荐
    • 推理增强
    • CoT
    • GRPO
    • LLM
  • 2026年4月30日

    为什么 MCTS 在 LLM 推理中失败了

    • 推理增强
    • 推理模型
    • MCTS
    • 搜索

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community