
























如果你连续几年参加云相关的峰会,今年就会有一个明显的感受:话题变了。
过去我们聊云,我们在聊什么?
一来是聊云,我们聊的是怎么把服务器搬上去。
再后来,我们聊的是怎么在云上跑AI,买GPU、调模型、搭推理服务。可能大家还会有印象,去年这个时候,大家的焦点还是哪家云的GPU够便宜、模型推理延迟多少、算力供应够不够。
但今年,行业的问题完全变了。今年云计算行业一个非常大的变化是,大家都开始聊,怎么让Agent自主使用云。
5月20日,杭州,雷峰网参与了阿里云峰会,现场观察到阿里云把这个问题摆到了台面上,而且给出了一个系统性的回答。
从发布搭载自研芯片真武M890的超节点服务器、推出国产第一的旗舰模型Qwen3.7-Max、升级百炼推理平台,到推出100多个云产品Skill、建设Agent原生基础设施、重写云的入口,阿里云正在彻彻底底地为Agent重建从芯片到入口的整套基础设施。
值得注意的是,就在上周,阿里财报刚刚交出AI收入连续11个季度三位数增长、百炼平台ARR突破80亿元的成绩单,消息发布当天阿里股价飙涨8%。
据某云计算行业人士透露:"阿里云在大模型的MaaS市场是规模第一。"他表示,真正的市场按国际通用标准应看大语言模型(LLM),"在这个市场,阿里云一直都是第一,而且还在加速增长。"
从财报到峰会落地全栈Agent化方案,中间没有犹豫期。吴泳铭在财报电话会上将Agent时代定义为"一场计算范式的革命",而这次峰会就是对这场革命的系统性回应。
阿里云为何要革新云?这还是要回到一个正在发生的根本性变化,云的服务对象,正在发生巨变。
过去十几年,云产品的使用方式其实很固定:开发者登录控制台,买服务器、配网络、配数据库、部署应用。这背后,有一个云计算行业最底层的产品逻辑,云平台默认"操作者"是人,所有产品设计都是围绕人怎么操作展开的。
但 Agent 时代,这个逻辑开始松动。
就拿雷峰网(公众号:雷峰网)所在的内容创作领域来说,现在我们已经在用Agent干很多事:扫描几十个信源、提炼观点、生成选题、甚至起草初稿。但你可能没注意到的是,这背后每完成一个任务,Agent都在自动调用云资源、调模型做推理、调存储读历史文章、调搜索接口抓实时信息、调向量数据库做语义匹配。
一篇稿子从选题到成文,Agent可能已经发起了上百次调用。整个过程,人只说了一句话。所以说,真正频繁调用云资源的,变成了Agent。
而且这个变化的幅度,远比看起来大。以前云服务的是几百万登录控制台的人,以后要服务的是数以亿计、永不下线的Agent。阿里云公共云事业部总裁刘伟光在峰会上说,AI劳动者和人类劳动者相比,规模上不仅多了N个数量级,而且可以24×7不间断运转。这是量级跃迁。
而这种量级跃迁,对于云操作系统的影响是结构性的。
这意味着云系统必须从原来为人设计的"人机交互系统",变成面向机器的"机器执行系统"。而当服务对象从人变成 Agent,三个问题必须回答:
第一,怎么让 Agent 真正看懂云?过去的交互界面是给人设计的,Agent 看不懂这些,它需要可以直接调用的标准接口和封装好的专家知识。云产品必须配备一本"机器能读懂的说明书"。
第二,怎么管理海量 Agent 的执行行为?上百万 Agent 同时执行不同任务,怎么调度、怎么隔离、怎么控制成本?这些在传统云的稳态负载时代不是问题,在 Agent 的炸裂式负载面前,每一环都需要重新设计。
第三,怎么保证 Agent 行为的安全?这个问题在云时代几乎不存在。但Agent火了之后,李飞飞说,"很多人问的第一个问题就是,你把任务都交给 Agent 以后,它的安全怎么保障?"传统云安全防的是坏人,Agent 时代要防的是好心办坏事的 AI。这是一个过去从未出现过的新命题。
三个问题,指向同一个结论:不是在云上加一层 AI 能力就够了,而是要用 Agent 的逻辑,从头重写云。
怎么重写?这是阿里云本次峰会上的一大核心内容。
和外界想象的不同,阿里云这次不是只动了云平台这一层,而是从芯片、云平台、模型到MaaS推理平台同时动刀,是一次四层全栈改造。其中云平台层可以概括为两层改造。
第一层,把现有的60多个云产品,改造成Agent能直接调用的标准化技能。李飞飞在峰会上扔了一个时间节点:今年内,阿里云所有云产品都会完成控制面改造,以Agent为优先用户。
具体来看,各条产品线已经在动了。
存储线推出了OSS Agent,帮用户自动管理和优化冷存储空间。数据库线,瑶池数据库长出了自己的Agent,能做自动化运维和数据分析。
数据开发线,DataWorks Agent,提供了一个统一的面向智能体的数据开发平台。安全和运维线也在全面Agent化。用李飞飞的话说,"让每个产品都有自己的Agent。"
第二层,为Agent建一套全新的运行环境,从沙箱运行时、记忆系统、多Agent编排到安全治理,全部从零设计。
目前,阿里云为Agent新建的基础设施拆成了六个方向,其中有三个可以重点展开讲讲。
第一,运行时。Agent不是一直跑着的。它的典型特征是:接到任务,瞬间启动,疯狂调用资源,干完活就消失。这就要求运行环境必须具备两个能力:极速弹性,以及强隔离。
李飞飞给出的数字是:阿里云的Agent沙箱支持百毫秒级冷启动,"一分钟可以开启1万到2万多个沙箱"。同时支持浅休眠和深度休眠,Agent干完活就休眠,有新任务秒级唤醒,不用一直占着资源。
第二,记忆。这一点对Agent来说比对人更根本。人开会可以翻聊天记录,Agent执行跨天任务怎么办?李飞飞把Agent的记忆分了三层:短期记忆,Agent干活干到一半,不能抬头就忘;长期记忆,跨任务的上下文,今天干一半,休眠,明天醒来接着干,中间的上下文不能丢;知识记忆,外挂的企业知识库,通过RAG、向量数据库、多模态数据引擎,让Agent能检索企业沉淀多年的知识。
对应到产品上,阿里云的数据库产品、存储产品、大数据产品等,全线推出了支持长短记忆和知识库结合的功能,分层存储,按需唤醒。
第三,安全。阿里云在峰会上给出的方案是一整套面向Agent的安全体系:Agent安全中心、AI安全护栏、Agent防火墙等产品。除了这三个方向,还有编排、治理、数据平面,每一个方向都在从零开始建。
云平台层的改造之外,这次峰会上同样重磅的,是芯片、模型和推理平台三层的同步升级。
Agent时代的海量并发推理,对底层算力提出了完全不同的要求。平头哥在峰会上发布了128卡超节点服务器,搭载新一代训推一体芯片真武M890与自研互联芯片ICN Switch 1.0。
目前,平头哥AI芯片"真武"累计出货已达56万片,60%以上服务外部客户,服务包括中国电信、中国一汽、浦发银行在内的400多家客户。
全球范围内,拥有自研AI芯片并大规模商用的云厂商只有四家:谷歌、亚马逊、微软、阿里云。在国内市场,阿里云是唯一同时具备GPU、CPU、存储、网络芯片全栈自研能力的公有云厂商,这是独一无二的结构性壁垒。
Agent要完成复杂任务,模型能力是底座。在三方机构Arena全球大模型盲测总榜中,Qwen3.7-Max与GPT、Claude、Gemini最强模型接近,位列国产模型第一。同时该模型编程能力位居前列,面向Agent全新设计,可胜任35小时长程复杂任务。
更值得关注的是迭代速度——近3个月千问旗舰模型已连续迭代3.5、3.6、3.7三个版本,这种迭代节奏在全球旗舰模型中也属最快之列。
Agent的爆发式调用对推理平台的稳定性和弹性提出了极端要求。阿里云在百炼平台上构建了大规模GPU资源集群,并通过一套完整的技术栈来应对Agent场景的特殊挑战。
平台生态同样在加速打开——九家模型厂商入驻百炼,开放接入GLM-5.1、MiniMax M2.7、Kimi K2.6等顶尖模型,开放度对标AWS Bedrock。百炼平台半年内Token消耗增长超10倍,这本身就是Agent时代到来的最直观注脚。
前两部分讲了两个判断,第一,调云的主体从人变成了Agent;第二,阿里云用Agent逻辑重写"芯-云-模型-推理"全栈技术体系。但这里还剩下一个问题:当用户从人变成Agent,云的第一个接触点——入口,应该是什么样?
阿里云在本次峰会最后给出的答案,是"千问云"。
乍一看,这是一个新产品发布。放在峰会的压轴位置,也很容易被理解成阿里云又发了一个AI产品。但如果把前两部分的逻辑串起来,你会发现千问云不是又一个产品,而是整套逻辑的终点。
还是先退一步看,过去十几年,云计算的入口一直是一个东西:控制台。
开发者登录进去,左边是产品目录,计算、存储、网络、数据库、安全,几十个大类、上百个产品,像超市货架一样排开。你看中哪个,点进去,看参数、选规格、填配置、下单。但回到第一部分的结论——如果未来频繁调用云的是Agent而不是人,那这套"超市货架"逻辑就从根本上不成立了。
Agent不需要逛货架。它不需要看产品介绍。它甚至不需要知道ECS和OSS的区别,它只需要知道自己要完成什么任务,然后找到能完成这个任务的能力。
这意味着,云的入口必须从产品目录变成一个任务引擎,不是我能卖你什么,而是你想干什么,我来调度。
这就是千问云在做的事。千问云目前对外呈现的,可以拆成三层来理解。
第一层,模型聚合。入口的第一件事,是让用户先接触到"能力"而不是"产品"。过去你打开阿里云官网,最先看到的是产品列表。千问云打开后的第一屏,是模型。据阿里云峰会上公布的数据,千问云集成了150多个模型系列、480多款模型,从千问自身到三方模型全覆盖。
第二层,阿里云把多款云产品改造成了Agent可调用的标准化Skill。千问云就是这些Skill的门面,12条产品线、60多个产品的核心能力,封装成100多个Agent能直接读懂的技能包。
这形成了一个"双面入口":对人来说,你想做什么就找对应的Skill,是一个能力超市;对Agent来说,它通过MCP协议直接调用同一套Skill,不需要理解云产品的内部逻辑。同一个入口,两种用户,一套能力。
第三层,CLI工具。如果说Skill是让Agent看得懂云,CLI就是让Agent用得快。人用云,要登录、选产品、配参数、等部署,每一步都得自己盯。Agent用云,应该是告诉它做什么,它就做完了,中间不需要人插手,也不需要图形界面。千问云提供的CLI工具,让Agent可以自己完成一系列全流程,人连屏幕都不用看。
从模型、Skill到CLI,千问云本质上都在做同一件事,开始重新定义"进云"这件事。
如果说上一代云计算的核心是把服务器搬上云,那么这一代云计算的变化,可能是调用云的人正在消失,Agent,正在成为新的入口。而阿里云所做的,就是提前为Agent时代,把整套云计算逻辑重新搭了一遍。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。