什么是大模型 Agent ？

大模型 Agent，作为一种人工智能体，是具备环境感知能力、自主理解、决策制定及执行行动能力的智能实体。简而言之，它是构建于大模型之上的计算机程序，能够模拟独立思考过程，灵活调用各类工具，逐步达成预设目标的智能存在。

Agent 是 AI 大模型应用的主要新形态，在技术架构范式也发生了很大的变化，从面向过程的架构变成了面向目标架构。

大模型虽作为智能体的核心“大脑”，负责思维与决策，但仅凭此并不足以胜任复杂任务的执行。为了全面实现智能体的功能，还需融入类似“神经感官系统”以感知环境，以及“肢体”以执行实际动作的元素。这正是构建 Agent 技术架构的初衷，旨在通过这一框架，将感知、思考与行动三者紧密结合，共同作用于复杂任务的完成。

"规划"是智能体的思维模型。类比人类，面对任务，我们先构思解决方案，拆解为子任务，评估工具，执行中反思调整，并考量终止时机。通过大模型提示工程，比如：ReAct、CoT 推理模式，可赋予智能体类似思维模式，精准拆解复杂任务，分步解决。

记忆，即信息存储与回忆。智能体模拟人类，设短期记忆存会话上下文，助多轮对话，任务毕则清；长期记忆存用户特征、业务数据，向量数据库速存速查。

智能体依据“工具”感知环境、执行决策。工具比如：神经感官，助其获取信息、执行任务。配备多样工具并赋权，比如：API 调用业务信息，插件扩展大模型能力，比如：ChatPDF 解析文档、Midjourey 文生图。

智能体依规划与记忆，执行具体行动，包括与外部互动或工具调用，实现输入至输出的转化。比如：智能客服回复、查询天气预报、AI 机器人抓起物体等等。

为了更好地理解大模型 Agent，我们一起来看个生活中的实际场景：假设你需要与朋友在附近吃饭，需要 Agent 帮你预订餐厅。

Agent 会先对您提出的任务进行规划如下：

第一步：获取当前位置推理 1：当前知识不足以回答这个问题，需要知道当前所在位置以及附近的餐厅；

行动 1：使用地图工具（Tools）获取当前所在位置；

结果 1：得出附近餐厅列表。

第二步：确定匹配餐厅推理 2：确定预订的餐厅，需要知道饮食偏好以及其他细节（比如：吃饭时间、人数）；

行动 2：从记忆（Memory）中获取您的饮食偏好、人数、时间等信息；

结果 2：确定最匹配的餐厅。