什么是 AI Agent

Open AI 的应用研究主管 Lilian Weng发表了《LLM Powered Autonomous Agents》一文，其中她提出了一个公式：“智能体=大模型（LLMs）+规划（Planning）+记忆（Memory）+工具使用（Tools）”。

智能体的推理与执行能力，指的是利用大模型（LLMs）来理解、执行并回顾任务。这包括将复杂任务分解为更小、更易管理的子任务以提高效率，并且通过吸取历史经验和错误教训来优化行动的质量。

智能体具备短期与长期记忆功能：短期记忆通过利用提示（Prompt）中的信息和上下文数据进行学习，而长期记忆则通过外部向量存储和快速检索技术来实现，这使得智能体能够在更广泛的时间跨度内存储和回忆（理论上无限）信息。

智能体具有调用外部 API 来使用“工具”的能力，这包括浏览网页、启动应用程序、读写文件、进行支付甚至操控用户设备等。与传统的自动化工具不同，AI智能体能够在未知和不可预测的新环境中有效工作。

在Open AI 的定义基础上，还应补充智能体的反馈接受能力。正如人类在处理复杂任务时需要与环境互动，我们的行为会改变环境，环境也会给予我们反馈，我们根据这些反馈进行决策。因此，智能体应该能够根据采取的行动接收正面或试错性的反馈、阶段性成果或奖励，并据此进行下一轮的规划和行动。

在 AI Agent 的整体架构设计中，一般可以将框架划分为五个主要模块：感知、定义、记忆、规划和行动。

感知模块 这一部分主要负责处理各种输入信息，确保智能体能够与环境进行有效的交互。

定义模块 该模块包含了智能体的特性、目标和其他相关属性信息。

记忆模块 涵盖了短期和长期记忆，它为智能体在处理复杂任务时提供历史数据和策略支持。

规划模块 涉及任务分解、反思、推理、策略制定等，是智能体的决策中心，类似于大脑的功能。

行动模块 负责以文本、实体动作、工具指令等多种方式输出智能体的决策结果。

记忆能力

目前的研究普遍将记忆分为短期记忆和长期记忆两大类。

短期记忆主要依赖于上下文学习，但受到 Transformer 模型上下文窗口大小的限制。

长期记忆则更加广泛地应用于任务中，它涉及对世界的宏观和抽象理解。这包括存储生产系统的过程记忆、关于世界事实的语义记忆，以及代理过去行为序列的情节记忆。长期记忆通过参数知识存储（模型训练）和非参数知识存储（外部搜索）来实现。

对于超出常规上下文范围的长期记忆，学术界探索了两条路径：一条是扩展上下文，即将上下文支持扩展到100K甚至无限大；另一条是利用 RAG 和信息压缩技术，即对输入信息进行总结和压缩存储，仅在需要时提取相关记忆。

扩展上下文的方案相对简单，依赖于算力的提升和成本的降低，但目前的成本仍然较高。

RAG 技术则是搜索相关信息片段，并将搜索结果融入大模型的上下文中，以便大模型基于这些结果回答问题。

信息压缩则是对信息进行总结，最基本的方法是文本总结，更高级的方法是使用指令访问外部存储，或者在模型层面使用 Embedding 技术进行总结。

规划能力

规划是 AI Agent 解决复杂问题的关键能力，主要包括子目标分解、反思和提炼等。

子目标分解：通过思维链（CoT）技术，将大任务分解为多个更易管理的子任务，并为大模型的思维过程提供解释线索。思维树技术则通过在每一步探索多种推理可能性来扩展 CoT，创建一个树状结构的思考过程。

反思提炼：ReAct 技术通过将动作空间扩展为特定任务的离散动作和语言空间的组合，将推理和动作整合到 LLM中。Reflexion 框架则为智能体提供了动态记忆和自我反思的能力，以提高推理技能。

ReAct 方法能够发挥 LLM 的推理能力，通过交错生成推理轨迹和任务特定的操作，实现推理与操作的协同。尽管存在一些局限性，如解决复杂问题的能力有限、成本不可控等，但它仍然是提升AI智能体能力的重要途径。

行动能力

智能体的行动能力主要体现在文本输出、工具使用和具身动作等方面。

在工具使用方面，智能体主要通过微调或预设模型描述框架来调用外部API，实现对现有功能的使用或特定信息的访问。未来，随着模型能力的提升，智能体可能能够创造新工具。

如何让大模型学会按需使用工具？有两种观点：一种认为工具使用是过程记忆，需要通过 Fine-tuning 方法教授模型工具使用的样例；另一种认为工具使用是代码生成能力，可以通过 RAG 方法匹配工具并使用。

减少幻觉

减少幻觉主要依赖于基础模型的进步和 Scaling Law，同时也有工程方法可以减少现有模型的幻觉。

事实性校验：首先使用大模型生成回答，然后通过 RAG 方法找到与回答内容匹配的原始语料，最后让大模型判断回答的准确性。

多次生成：论文 SelfCheckGPT 提出的多次生成方法，通过多次生成同一问题的回答并让大模型挑选最一致的回答，以减少偶发的幻觉问题，但无法解决系统性偏差。

我的笔记

你可能想看的

1OpenClaw新手必看：20款高人气Skills安装指南 AI OpenClaw

2手把手教你用AI Skills：比提示词强在哪，怎么配置 AI AI提示词

3阿里开源图像生成模型:Qwen-Image！精准搞定复杂字体排版，支持多艺术风格编辑！ AI

4简单分高的发文策略：LSTM+Transformer+时间序列预测 AI

5上海交大增强推理智能体X-Master在“人类最后的考试”首次突破30分 AI DeepSeek

62024值得读的LLM论文 LLM AI 科研

7人工智能、机器学习、神经网络、深度学习，它们有什么关系 AI 机器学习深度学习神经网络

8AI 聊天机器人的人工情感是一种语言技巧 AI

92024 年度诺贝尔物理学奖：John Hopfield 和 Geoffrey Hinton 引领人工智能革命 AI 诺贝尔物理学奖

1Mac 下 brew services 启动失败，报错：sudo launchctl bootstrap

2使用launchctl list 查看项目状态，状态码出现 78 的问题 MacOS

3使用pthon实现word转换成pdf，适用于windows系统和macos系统 MicrosoftOfficeWord PDF

4OpenClaw新手必看：20款高人气Skills安装指南 AI OpenClaw

5Trae开发的Python项目，如何在Windows系统上开机自运行？ Windows Python

6Trae开发的Python项目，如何在苹果Macbook上开机自运行？ Python Macbook

7Google Search Console 站长工具使用指南 Google 站长工具

8iOS开发中7个提高效率的实用工具库：MBProgressHUD，Vapor，Try，Swift OpenAPI Generator，MarkEdit，AXe iOS开发

9Excel如何绘制差额对比折线图 Excel教程

10旋风加速器，真正免费的加速器，不限流量旋风加速器

11Origin如何绘制多半径饼图 Origin教程

12海贼王(真人版) 第二季全8集迅雷（国英多音轨+简繁英字幕）动漫动画片海贼王

1【避坑贴】奇迹MU回归玩家值得一看的100个小常识

2RESTful API 设计指南 - 阮一峰的网络日志

3中华人民共和国个人信息保护法

4审讯技巧（审讯对抗） - 知乎

5國家地理雜誌中文網

6保姆级教学，阿里出品的《Java开发者面试百宝书》限时免费下载-阿里云开发者社区

7独家下载 | 阿里云数据库客户案例集-阿里云开发者社区

8【译】Android应用架构 - 泡在网上的日子

9讲真，男人很擅长搞大自己的肚子

10证监会：北交所新股上市首日不设涨跌幅限制，自次日起涨跌幅限制为30%

11纸钞屋第一季 (豆瓣)

12爱课程

13SEO外链工具 - 网站自动化宣传机器/免费的超级外链工具可批量增加外链

14豆瓣2016年度读书榜单

15万方数据知识服务平台

16安易加速器：新用户注册送365天可永久免费使用的加速器

17快连加速器iOS版下载安装使用教程