2026：智能体爆发年_新华报刊-环球

2026：智能体爆发年

2026-04-02 16:26:27 来源： 《环球》杂志

文/《环球》杂志记者胡艳芬郭丹（发自北京）褚怡（发自柏林）

编辑/刘娟娟

　　《环球》杂志：为什么2026年被称为“智能体（Agent）爆发年”，AI产业即将进入“智能体时代”吗？

　　曹涛：从我的实践视角来看，2026年确实是AI智能体规模化落地的临界点，但“爆发”不等于“成熟”，这背后有非常清晰的技术与产业逻辑。

　　为何恰在2026年？在我看来是由于以下基本条件同时成熟：

　　一是基础模型能力突破推理门槛。以OpenAI o1、DeepSeek-R1、Gemini 3等为代表的新一代模型，在复杂推理、长上下文处理、工具调用准确性上均实现质的飞跃，AI智能体的“大脑”终于够用了。

　　二是工具生态基础设施成熟。MCP（模型上下文协议）、A2A（Agent-to-Agent）协议以及各类企业API（应用程序编程接口）标准化，使AI智能体能够真正“接入”现实世界的系统，而不只是在沙盒中运行。

　　三是企业侧AI治理体系逐步建立。作为AI领域一线实践者，我观察到2025至2026年是全球头部企业密集建立AI治理框架、风险管控机制和AgentOps（智能体运营）体系的窗口期，这为Agent大规模部署扫清了一些合规障碍。

　　四是成本曲线拐点出现。AI模型推理成本两年内下降超过95%，这使得“每个业务流程部署一个Agent”在经济上真正可行。

　　但我们必须保持清醒，智能体时代的到来不是平滑的线性增长，而要经历一个“基础设施快速铺设期”。企业级Agent的成熟应用将集中在2026年至2028年，真正的“Agent原生应用生态”可能还需要3至5年。我们正处于这场范式革命的序章，而非高潮。

　　这和2007年智能手机iPhone出现后并未立刻产生“App应用经济”是同样的节奏——智能体也是基础设施先行，生态随后爆发。

　　亚历山大·措恩：这主要是由于模型本身的进步。以美国Anthropic公司推出的Claude Opus 4.6为代表的大语言模型，如今在规划、编写和测试程序代码方面都表现出极强的能力，同时还能在较长的时间跨度内保持上下文连贯。因此，那些能够可靠地执行任务（如运行代码）的AI模型正在广泛普及，开源人工智能体OpenClaw（“龙虾”）就是一个典型例子。

　　随之而来的是，“具身智能”和“AI智能体”等话题迅速升温。不过需审慎指出的是，这其中也包含不少营销成分，很多2025年还被称为“生成式 AI”的东西，如今只是换了个名字，就被贴上了“AI智能体”的标签。

　　金坚敏：经过近几年的发展，AI模型自身的智能化程度不断提高，出错率、幻觉率也大幅下降，智能体的制造成本、销售价格也大幅下降。这就让个人、企业都愿意使用，智能体随之迎来爆发年。

　　例如，DeepSeek将语言模型和推理模型结合在一起，大幅提升沟通水平，经过推理，出错率也大幅降低；又如，支付宝用于支付保险的模型，据说幻觉率已从最初的3%左右下降到现在的0.6%。

　　“龙虾”也是一个重要案例，我们对它的关注度非常高。这时候就要思考，智能体能为个人、企业带来什么价值。特别是对企业而言，应用智能体大概需要投资多少、回报是什么，以及多久能回本、回报率如何等，都需要认真思考。

　　日本在应用智能体方面进度有些慢。从2025年下半年开始，日本企业对智能体的关注度开始上升，但仍远远落后于美国和中国。原因是日本到目前为止还没有好的国产大语言模型，虽然最近富士通、都科摩通信公司（NttDocomo）、PayPay银行等企业也开发出一些模型，但用的人很少。模型是用的人越多，积累数据量越大，培训越多，进化越快。

　　2026年3月6日，日本数字厅正式公布了7家可以试用于政府机构的AI平台，并计划从5月起在全国39个政府机关的约18万名职员中开展实证测试，2027年度确定正式采购名单。这7家企业及其大模型分别是：恩梯梯数据公司提供的tsuzumi、客户云提供的CC Gov-LLM、日本通信企业KDDIKDDI与伊丽莎人工智能公司（ELYZA）联合开发的Llama-3.1-ELYZA-JP-70B、软银提供的Sarashina2 mini、日本电气公司（NEC）开发的cotomi v3、富士通提供的Takane 32B以及“优选网络”公司提供的PLaMo 2.0 Prime。

　　当前，各国都非常强调主权AI，且会从制度、体制、法律上对信息进行过滤，虽然各国具体执行的情况不同，但只是程度上的差别。

　　王强：2026年之所以被很多人称为“智能体爆发年”，确实是因为几个条件同时成熟：第一，大模型的推理、规划和多模态理解能力明显增强，且AI完成长程任务的能力持续提升，如Claude Opus 4.6能完成的长程任务长达14小时30分钟（50%准确率）；第二，调用浏览器、办公软件、企业系统、代码环境等外部工具的能力越来越稳定；第三，企业对“不只生成内容，而是直接完成任务”的需求变得非常强烈；第四，成本正快速下降，使得智能体从演示走向大规模试用成为可能。

　　但我认为，我们更准确的表述不是“已经全面进入智能体时代”，而是“正在进入由智能协同助手（CoPilot）向智能体过渡的阶段”。未来两三年，最先落地的不会是无所不能的“超级智能体”，而是大量垂直场景中的专业智能体，比如客服、销售、数据分析、软件开发、内容运营、供应链协同等。也就是说，智能体时代不是一夜之间到来，它会先在高频、标准化、可验证的任务中率先成熟，然后逐步向更复杂的决策型工作扩展。