智能体：把能力转化为生产力

2026-04-02 16:24:22 来源： 《环球》杂志

文/《环球》杂志记者胡艳芬郭丹（发自北京）褚怡（发自柏林）

编辑/马琼

　　《环球》杂志：智能体到底是什么？它和我们现在常用的人工智能（AI）大模型、AI助手有什么本质区别？

　　曹涛：AI智能体（Agent）是当前人工智能发展的前沿，是最具变革意义的形态之一，要理解它需要先厘清三个基本层级的概念。

　　其一，大型语言模型（LLM）。它本质上是一个“超级语言引擎”——给定输入、输出文本。它被动响应、没有记忆，也不会主动行动。GPT、深度求索（DeepSeek）、通义千问这些模型都属这一层级。

　　其二，AI助手（如ChatGPT、豆包）。它是在大模型外包裹了一层交互界面与记忆管理。它能进行多轮对话，但本质上依然是“人问、AI答”的被动交互模式，执行的边界止步于文字回应。

　　其三，智能体。它是能够自主感知环境、独立制订计划、调用工具、执行行动，并在结果反馈中动态调整策略的AI系统。它有四大核心特征：自主目标分解，在接到高层指令后，能自行拆解为可执行的子任务序列；工具调用能力，能调用搜索引擎、数据库、应用程序编程接口（API）、代码执行器乃至其他AI模型；闭环行动能力，形成“感知→规划→行动→反馈→修正”的完整自主决策循环；持久记忆与状态管理，可以跨会话保持上下文贯通，像一个真正“在工作”的角色。

　　简单做个比喻：大模型是“大脑”，AI助手是“会说话的大脑”，而智能体是一个“会行动、会协作、会学习的数字员工”。

　　这一区别在产业层面上意义深远。如果说大模型赋能的是人类的“认知生产”，那么智能体赋能的则是人类完整的“任务执行流程”。这是从量变到质变的范式跃迁。

　　金坚敏：智能体是一个系统，由多个模块组成；生成式AI只是一个单独模块。多个智能体可以组合在一起形成智能体团队。就像一个部门里有负责收集资料的智能体，有负责调用公式、工具的智能体，有负责最后验收评估的智能体，甚至可以有负责协调、管理的智能体。不同的智能体团队之间也可以交流，这就形成了智能体生态。智能体生态中会涉及交流标准、授权等。

　　一个重要的问题是自主性和主体行为能力，就是说这个智能体是否具备代理人的资格。在很多欧洲国家，目前行为主体只能是人；但当前美国一些信用卡公司或谷歌这样的大型科技公司开始做智能体，它们可以打破购物平台壁垒，在能使用信用卡的商铺、平台上提供辅助购物服务。不过，日本目前还没有此类实践。

　　以前人是购物主体，但今后购物主体可能是智能体，因此未来的商家可能不再需要吸引人的注意，而是想方设法吸引智能体的注意。也就是我们说的“注意力经济”将会兴起。作为企业，无论做B2B（企业对企业）、还是B2C（企业对消费者），都需要考虑“注意力经济”。

　　王强：如果说大模型更像是会思考、会表达的大脑，那么智能体就是眼睛、手脚、记忆和执行链条。简单说，就是大模型会对话和思考，而智能体能做事。它不只是回答你一个问题，而能够围绕一个目标连续做事，比如检索信息、拆解任务、调用软件、与其他系统协同，最后交付结果。

　　它和大模型的本质区别，在于是否具备面向目标的闭环行动能力。大模型擅长理解语言、进行推理和生成内容，但常停留在给建议、给答案的层面；AI助手更像一个交互入口和协作工具。所以，大模型是能力底座，AI助手是交互入口，智能体则是把能力转化为生产力的执行形态。

　　亚历山大·措恩：什么是智能体？学术界有很多说法，我个人比较认可这个定义：“智能体是一个能感知环境、自己做决定、采取行动来达成目标的系统，智能体可以自主运行，无需直接的人为控制。”不过，这个说法也有漏洞，比如家用温控器，其实也符合这些条件，但没人觉得它有多“智能”。在我看来，一个智能体系统真正核心的能力是：由一个主智能体先把复杂的大问题拆分成几个小任务，然后交给子智能体或者其他工具去执行。系统会观察执行过程、检测错误，并在必要时独立修正执行方案。