A Survey on LLM-based Autonomous Agents

核心结论

  • 首次系统性地提出 LLM Agent 统一框架,包含四个核心模块:Profile(角色设定)、Memory(记忆)、Planning(规划)、Action(行动)
  • Agent 能力获取分为两大类:需要微调(人工标注/LLM生成/真实数据)和不需要微调(Prompt Engineering / Mechanism Engineering)。
  • LLM Agent 应用覆盖社会科学(心理模拟、社会仿真)、自然科学(实验助手、文献管理)和工程(软件开发、机器人)。

关键事实

  • 来源:Renmin University of China(中国人民大学),发表于 Frontiers of Computer Science 2024。
  • 统一框架:Profile 决定角色 → Memory 存储经验 → Planning 分解任务 → Action 执行操作。
  • 记忆结构分 Unified Memory(仅短时)和 Hybrid Memory(短时+长时向量库)。
  • 规划分为 Planning without Feedback(单路径/多路径/外部规划器)和 Planning with Feedback(环境反馈/人类反馈/模型自检)。
  • 常用框架:LangChain、AutoGPT、MetaGPT、ChatDev、Voyager(Minecraft)。

与现有 Wiki 的关系

后续问题

  • LLM Agent 的幻觉问题如何在架构层面缓解?
  • 记忆模块的长期一致性保证机制仍需探索。