2026:智能体爆发年
文/《环球》杂志记者 胡艳芬 郭丹(发自北京) 褚怡(发自柏林)
编辑/刘娟娟
《环球》杂志:为什么2026年被称为“智能体(Agent)爆发年”,AI产业即将进入“智能体时代”吗?
曹涛:从我的实践视角来看,2026年确实是AI智能体规模化落地的临界点,但“爆发”不等于“成熟”,这背后有非常清晰的技术与产业逻辑。
为何恰在2026年?在我看来是由于以下基本条件同时成熟:
一是基础模型能力突破推理门槛。以OpenAI o1、DeepSeek-R1、Gemini 3等为代表的新一代模型,在复杂推理、长上下文处理、工具调用准确性上均实现质的飞跃,AI智能体的“大脑”终于够用了。
二是工具生态基础设施成熟。MCP(模型上下文协议)、A2A(Agent-to-Agent)协议以及各类企业API(应用程序编程接口)标准化,使AI智能体能够真正“接入”现实世界的系统,而不只是在沙盒中运行。
三是企业侧AI治理体系逐步建立。作为AI领域一线实践者,我观察到2025至2026年是全球头部企业密集建立AI治理框架、风险管控机制和AgentOps(智能体运营)体系的窗口期,这为Agent大规模部署扫清了一些合规障碍。
四是成本曲线拐点出现。AI模型推理成本两年内下降超过95%,这使得“每个业务流程部署一个Agent”在经济上真正可行。
但我们必须保持清醒,智能体时代的到来不是平滑的线性增长,而要经历一个“基础设施快速铺设期”。企业级Agent的成熟应用将集中在2026年至2028年,真正的“Agent原生应用生态”可能还需要3至5年。我们正处于这场范式革命的序章,而非高潮。
这和2007年智能手机iPhone出现后并未立刻产生“App应用经济”是同样的节奏——智能体也是基础设施先行,生态随后爆发。
亚历山大·措恩:这主要是由于模型本身的进步。以美国Anthropic公司推出的Claude Opus 4.6为代表的大语言模型,如今在规划、编写和测试程序代码方面都表现出极强的能力,同时还能在较长的时间跨度内保持上下文连贯。因此,那些能够可靠地执行任务(如运行代码)的AI模型正在广泛普及,开源人工智能体OpenClaw(“龙虾”)就是一个典型例子。
随之而来的是,“具身智能”和“AI智能体”等话题迅速升温。不过需审慎指出的是,这其中也包含不少营销成分,很多2025年还被称为“生成式 AI”的东西,如今只是换了个名字,就被贴上了“AI智能体”的标签。
金坚敏:经过近几年的发展,AI模型自身的智能化程度不断提高,出错率、幻觉率也大幅下降,智能体的制造成本、销售价格也大幅下降。这就让个人、企业都愿意使用,智能体随之迎来爆发年。
例如,DeepSeek将语言模型和推理模型结合在一起,大幅提升沟通水平,经过推理,出错率也大幅降低;又如,支付宝用于支付保险的模型,据说幻觉率已从最初的3%左右下降到现在的0.6%。
“龙虾”也是一个重要案例,我们对它的关注度非常高。这时候就要思考,智能体能为个人、企业带来什么价值。特别是对企业而言,应用智能体大概需要投资多少、回报是什么,以及多久能回本、回报率如何等,都需要认真思考。
日本在应用智能体方面进度有些慢。从2025年下半年开始,日本企业对智能体的关注度开始上升,但仍远远落后于美国和中国。原因是日本到目前为止还没有好的国产大语言模型,虽然最近富士通、都科摩通信公司(NttDocomo)、PayPay银行等企业也开发出一些模型,但用的人很少。模型是用的人越多,积累数据量越大,培训越多,进化越快。
2026年3月6日,日本数字厅正式公布了7家可以试用于政府机构的AI平台,并计划从5月起在全国39个政府机关的约18万名职员中开展实证测试,2027年度确定正式采购名单。这7家企业及其大模型分别是:恩梯梯数据公司提供的tsuzumi、客户云提供的CC Gov-LLM、日本通信企业KDDIKDDI与伊丽莎人工智能公司(ELYZA)联合开发的Llama-3.1-ELYZA-JP-70B、软银提供的Sarashina2 mini、日本电气公司(NEC)开发的cotomi v3、富士通提供的Takane 32B以及“优选网络”公司提供的PLaMo 2.0 Prime。
当前,各国都非常强调主权AI,且会从制度、体制、法律上对信息进行过滤,虽然各国具体执行的情况不同,但只是程度上的差别。
王强:2026年之所以被很多人称为“智能体爆发年”,确实是因为几个条件同时成熟:第一,大模型的推理、规划和多模态理解能力明显增强,且AI完成长程任务的能力持续提升,如Claude Opus 4.6能完成的长程任务长达14小时30分钟(50%准确率);第二,调用浏览器、办公软件、企业系统、代码环境等外部工具的能力越来越稳定;第三,企业对“不只生成内容,而是直接完成任务”的需求变得非常强烈;第四,成本正快速下降,使得智能体从演示走向大规模试用成为可能。
但我认为,我们更准确的表述不是“已经全面进入智能体时代”,而是“正在进入由智能协同助手(CoPilot)向智能体过渡的阶段”。未来两三年,最先落地的不会是无所不能的“超级智能体”,而是大量垂直场景中的专业智能体,比如客服、销售、数据分析、软件开发、内容运营、供应链协同等。也就是说,智能体时代不是一夜之间到来,它会先在高频、标准化、可验证的任务中率先成熟,然后逐步向更复杂的决策型工作扩展。


手机版
