惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

G
GRAHAM CLULEY
T
Tailwind CSS Blog
B
Blog
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
The Cloudflare Blog
V
Visual Studio Blog
爱范儿
爱范儿
人人都是产品经理
人人都是产品经理
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
Jina AI
Jina AI
小众软件
小众软件
Apple Machine Learning Research
Apple Machine Learning Research
雷峰网
雷峰网
博客园 - 司徒正美
博客园 - 三生石上(FineUI控件)
罗磊的独立博客
博客园 - Franky
aimingoo的专栏
aimingoo的专栏
博客园 - 【当耐特】
N
Netflix TechBlog - Medium
L
LangChain Blog
美团技术团队
J
Java Code Geeks
Microsoft Azure Blog
Microsoft Azure Blog
Stack Overflow Blog
Stack Overflow Blog
U
Unit 42
云风的 BLOG
云风的 BLOG
宝玉的分享
宝玉的分享
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
大猫的无限游戏
大猫的无限游戏
Last Week in AI
Last Week in AI
博客园_首页
博客园 - 叶小钗
P
Proofpoint News Feed
WordPress大学
WordPress大学
Martin Fowler
Martin Fowler
阮一峰的网络日志
阮一峰的网络日志
酷 壳 – CoolShell
酷 壳 – CoolShell
博客园 - 聂微东
M
MIT News - Artificial intelligence
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
C
Cisco Blogs
月光博客
月光博客
L
Lohrmann on Cybersecurity
Security Latest
Security Latest
I
InfoQ
Recorded Future
Recorded Future
C
Cyber Attacks, Cyber Crime and Cyber Security
C
CXSECURITY Database RSS Feed - CXSecurity.com
D
Darknet – Hacking Tools, Hacker News & Cyber Security

雷峰网

1.8亿人在小红书读书:图书业在小红书电商营收规模年增超30% | 雷峰网 减重300kg,首搭5nm智驾芯片:2026款乐道L90正式亮相 | 雷峰网 阶跃和千⾥科技官宣战略合作:打造原⽣智驾基座模型,提升物理AI能⼒上限 | 雷峰网 “还债骑手”被强制下线240次:“开始我很反感过劳提醒,影响赚钱” | 雷峰网 石头科技:2025年营收高增56.51%,2026Q1营收增23.31% | 雷峰网 Mythos引爆攻击工业化时代,奇安信:构建三位一体内生安全体系是破解之道 | 雷峰网 曝两家科技大厂争投DeepSeek,估值飙至200亿美元;小米深夜放大招!最强大模型MiMo-V2.5系列发布;微软 Xbox 部门将裁员15% | 雷峰网 RGB-Mini LED电视普及风暴,海信正式发布小墨E5S Pro | 雷峰网 标配8255芯片与CDC,奇瑞试图终结“燃油车无智驾”时代 | 雷峰网 德赛西威也不相信,智驾能让Tier1躺着赚钱 | 雷峰网 找来刘翔做代言人,可能是智己LS8最好的一步棋 | 雷峰网 「中国版Grok上车」分水岭:阶跃交出首份量产答卷 | 雷峰网 百度Create大会双主论坛议程揭晓,多项重磅升级发布将集中亮相 | 雷峰网 泄露用户隐私!曝某AI助手将B用户简历发给A用户;苹果更换CEO原因曝光;微信宣布5国可用微信支付;航旅纵横「崩」了一天,借钱功能却正常 | 雷峰网 一季度交付1200件精益工具,希音深入技术创新提升按需时尚竞争力 | 雷峰网 从“替代”到“重构”:联想开天“1+2+N”如何重写信创AI PC逻辑? | 雷峰网 中山大学郭裕兰团队:数据充足却训练失败,多智能体到底卡在哪丨CVPR 2026 | 雷峰网 上交大 x vivo 团队:一个简单改动,让 diffusion 全面提升丨CVPR 2026 死亡率「99%」的芯片创业淘汰赛,为旌科技为何能活下来? | 雷峰网 清华段岳圻团队论文:从调参数到做控制,文生图迎来一次方法论升级丨CVPR 2026 | 雷峰网 东南大学耿新团队:模型不是不会做,而是被「挤掉了能力」丨CVPR 2026 | 雷峰网 西湖大学张驰团队:不重训,也能让视频生成更长更稳丨CVPR 2026 | 雷峰网 西湖大学张驰团队:从视觉合成到空间理解,视频 AI 正在「转向」丨CVPR 2026 | 雷峰网 21.0975 公里,是人形机器人的里程碑,也是 RISC-V 的新起点 | 雷峰网 独家 | 华为19级天才少年赵立晨离职创业,瞄准具身 Agentic OS 独家 | CMU系⼜诞⽣⼀家具⾝智能公司「Zeno AI」 | 雷峰网 Token消耗量翻10倍才算企业转型及格线?三位产业一线大佬教你用出性价比 | 雷峰网 阿里发布Qwen3.6-Max预览版,登顶最佳国产模型 | 雷峰网 郭达雅加入巨头背后:顶尖AI人才为何向大厂「回流」? | 雷峰网 解决机器人散热困境,华科冷芯高速悬浮泵液冷方案助力荣耀人形机器人“闪电”夺冠 | 雷峰网 智元邓泰华宣布:具身智能行业进入「部署态」 | 雷峰网 独家丨前安克研发总监丁准离职创业,获头部美元基金押注 | 雷峰网 曝DeepSeek V4将于本周发布,梁文锋对外融资20亿;雷军在服务区被堵车里维权?小米徐洁云回应;宇树H1半马被担架抬离赛道丨雷峰早报 | 雷峰网 广州一斗虾赛现场各路选手比拼蒸馏,现场诞生近50个“技能包” | 雷峰网 智元 ×Hitch Open|深耕具身智能,共建全球物理智能学术生态 | 雷峰网 2026广汽科技日重磅发布五大核心技术,以“科技向心”引领智能出行时代 | 雷峰网 一汽大众与卓驭科技的七年协同,交出一份燃油车智能化的成绩单 | 雷峰网 腾讯的长青游戏,今天又进化了一次 | 雷峰网 智己LS8上市:24.98万起售,刘翔站台的这台「最强8系」能打吗? | 雷峰网 全球1100万台出货,追觅打造最聪明的扫地机 | 雷峰网 阶跃率先跑通“中国版 Grok 上车”量产交付!超级 Eva 搭载极氪8X 今起上市 物理AI时代,为什么需要一颗“舱驾融合”芯片? | 雷峰网 逸安启欢迎问界加入,与宝马、梅赛德斯-奔驰携手, 共同推进中国豪华超充网络的发展 | 雷峰网 逐际动力开源 FluxVLA Engine:专为具身智能打造的标准化VLA工程底座 | 雷峰网 独家丨AWS大中华区多位L8高管迎来变动,SA部门负责人代闻离职 头部品牌 “加码”东南亚 泡泡玛特新品在Lazada发售 | 雷峰网 D19起售价21.98万元,零跑能成为9系SUV的“破局者”吗? | 雷峰网 全球首款!进迭时空 RISC-V AI CPU K3 成功适配 OpenHarmony 6.1 4小时闭门会,15位运动科技创业者聊透了哪些「不能公开说」的真相 | 雷峰网 在女性黑客松上,看见AI硬件的另一种可能 | 雷峰网 Plaud 爆火后,YoooClaw 要改写 AI 硬件的剧本 黄仁勋:DeepSeek在华为芯片上发布「很可怕」;抖音集团副总裁辟谣郭达雅亿元年薪入职字节;五角大楼与通用、福特等汽车制造商讨论造军火 | 雷峰网 正式官宣!佑驾创新与荣耀(HONOR)达成合作,以“无人车+机器人”打通全链路无人化闭环 | 雷峰网 解耦性能与厚重,英特尔AI高静Plus正在重写游戏本定义 | 雷峰网 独家丨Somnia Lab 完成千万美元天使轮融资,瞄准人机关系入口与万亿级具身情感生态 | 雷峰网 腾讯发布并开源混元世界模型 2.0,一句话造出3D世界,兼容游戏引擎! 阿里发布世界模型HappyOyster,与谷歌Genie3竞争 从「集体暴跌」到「双轨分化」:一篇论文误读如何撕开DDR真实行情? | 雷峰网 格力高管炮轰友商被狂怼:又当又立!「真铜实料」这四字不姓格;美国将退还超1万亿元关税;品牌GMV高速增长,速卖通将成品牌出海全新主场 全球线上首发!辉瑞新一代减重药先维盈®开启预售服务,美团买药又下一城 傲基「生死局」:绝地反杀与盈利迷途 | 雷峰网 阿里ATH发布AI开发工具Meoo,已打通阿里云核心产品 | 雷峰网 美团闪购升级闪电仓供应链服务平台:向全行业商家开放即时零售供应链基建 | 雷峰网 阿里云连续5年稳居游戏云市场份额第一! | 雷峰网 与阿里成立合资公司后,新世界旗下Gmarket商品交易额(GMV)实现双位数增长 | 雷峰网 度小满发布DXMClawPay 面向Skill开发者提供一站式支付接入方案 | 雷峰网 滴滴自动驾驶全球化布局加快,年内在阿联酋开展试点 | 雷峰网 金立创始人刘立荣消失8年后最新动向:疑在印尼卖家具;月薪3万,DeepSeek聘人去内蒙草原守机房;比亚迪坪山园区大火,公司回应火势已扑灭 | 雷峰网 水下绞杀:清洁机器人渠道里的生意与生死 | 雷峰网 墨腾报告:东南亚电商平台成交额五年翻三倍 三大平台瓜分万亿市场 | 雷峰网 火山引擎:Seedance 2.0 API 服务全面开放 | 雷峰网 中远海运特运X火山引擎:“数字员工”驶向智慧航运新蓝海 | 雷峰网 重新认识具身行业,从自变量的这封邀请函开始 | 雷峰网 做了5年3D打印机,我发现了世界模型的Scaling Law | 雷峰网 别克×火山引擎:至境E7行业首发搭载豆包大模型最新版 | 雷峰网 强强联手,追觅牵手阿里速卖通,将在海外加大投入 | 雷峰网 推理卡毛利率下滑超7%,天数智芯「降价换量」的买卖值不值? | 雷峰网 明日新程完成连续两轮融资,领跑Harness群体多智能体赛道 | 雷峰网 「作弊」内幕曝光!3DMark回应将某知名国产手机除名;李想朋友圈炮轰东风日产恶意拉踩,后者高管回应;美的空调又发行业首创产品 | 雷峰网 50万起步的蔚来ES9,能否站稳高端? | 雷峰网 汽车行业已在阿里云上使用超10万卡“真武”PPU研发智驾 | 雷峰网 百度智能云联合多家头部具身智能企业,打造具身智能数据超市 | 雷峰网 从汽车到物理 AI:何小鹏眼中的智能汽车下半场 | 雷峰网 首个跑通端到端闭环的全模态安全脱敏的龙虾盒子,无问芯穹InfiniClaw Box让本地龙虾也能放心用! | 雷峰网 当参数不再决定胜负,AI时代的企业级SSD靠什么「赢」?|MemoryS 2026 | 雷峰网 独家丨继大疆押注后,智能派再获数亿元融资,或与拓竹正面硬刚 | 雷峰网 阿里视频生成大模型Wan2.7登顶DesignArena榜单 | 雷峰网 KV Cache需求暴涨32倍,AI如何重写存储产业链的「旧分工」?| MemoryS 2026观察 | 雷峰网 微软小冰,生不逢时 | 雷峰网 豆包APP实时语音通话升级全双工模型 抗干扰与低时延能力提升 | 雷峰网 中国充电联盟与万勋科技联合发布《中国新能源汽车自动充电用户行为洞察报告》加速自动充电规模商用 | 雷峰网 继“同事.skill”走红,周鸿祎回应“把自己炼成AI分身”:这才是数字分身的正确未来 | 雷峰网 章鱼动力获得新加坡顶级风投 K3领投的数亿元投资 | 雷峰网 港中文薛天帆团队:实现 4K 全景视频生成,普通视频也能「长出空间」丨CVPR 2026 | 雷峰网 独家丨前大疆T4悍将谢博文:从具身机器人转战桌面CNC,深圳再启「无限工坊」 | 雷峰网 2026淘宝直播三大主线:提效新品,造优质主播差异化,增优质内容曝光 | 雷峰网 阿里云百炼上线Agent记忆库,让「龙虾」应用更懂用户 | 雷峰网 百度官宣!Create2026百度AI开发者大会定档5月13至14日 | 雷峰网 印度禁止中国大陆产摄像头监控:花高价大批替换,国产厂商回应;传宇树科技与阿里达成出海战略合作;DeepSeek上线专家模式 | 雷峰网 20分钟破1000万!首日破3000万!创想三维2026全球3D打印类目众筹王者!AI+生态双向助推,3D打印布道者重新定义3D打印生态! | 雷峰网
Agent时代的CPU军备竞赛,至强6+如何把Agentic AI变成生产力? | 雷峰网
2026-06-09 · via 雷峰网

今年的数据中心采购出现了一个反常情况,CPU开始缺货了。

英特尔市场营销集团副总裁、中国区总经理郭威在发布会上给出了一组数字:2026年一季度,中国AI算力需求同比爆涨417%;与此同时,CPU与GPU的配比已经从过去的1:8,逐步走向1:4、1:2,部分场景甚至达到了1:1。

这不是宏观预测,是正在发生的现实。英特尔数据中心集团副总裁、中国区总经理陈葆立透露,某国内头部大模型厂商从去年到今年,CPU需求增长了5倍。

Agent时代的CPU军备竞赛,至强6+如何把Agentic AI变成生产力?

英特尔数据中心集团副总裁、中国区总经理陈葆立

需求从哪里来?答案是Agent。

与传统推理不同,Agent不是完成一次问答就结束,而是持续执行任务——调度工具、查询数据库、管理记忆、创建子Agent。这些工作绝大多数落在CPU身上,不是GPU。Agent越多,CPU的压力越大,缺货也就不难理解了。

近期英特尔在北京举办数据中心创新日,发布首款基于Intel 18A制程的数据中心处理器至强6+。与Computex发布时侧重产品能力不同,这次发布会的重心更落地,英特尔用算力、存力、连接力、保障力,联合腾讯云、金山云、阿里云等合作伙伴,回答了至强6+究竟在中国如何把Agentic AI变成生产力?

其中还有两把很多人没注意到的「金钥匙」,是CPU缺货背景下让Agentic AI落地的关键,也是英特尔在Agentic AI时代独特竞争力的体现。

一颗至强6+能同时跑逾1000个Agent,靠的是什么?

陈葆立在发布会上给出了一个数字:单颗至强6+可以支持超过1000个智能体的稳定部署。

此前雷峰网(公众号:雷峰网)提到,按云服务常见配置(2核4GB或1核2GB),一颗至强6+可同时部署约400至500个Agent。而这次超过1000个,是基于单核运行3到4个Agent实例的软件调度优化方案——在更激进的密度配置下实现的上限,两个数字口径不同,并不矛盾。

背后的逻辑是核心密度。至强6+最高拥有288个能效核(E-Core),通过软件调度,每个物理核心可以同时分身运行3到4个Agent实例。对于"大量小步工作"这类典型的Agent任务——调度、路由、工具调用——高核密度恰恰是最合适的配置。

Agent时代的CPU军备竞赛,至强6+如何把Agentic AI变成生产力?

陈葆立点出了一个容易被忽略的问题:"单靠很多个轻量核是不够的。"

Agent时代的CPU军备竞赛,至强6+如何把Agentic AI变成生产力?

Agent本体在E核上运行,但当它真正开始执行任务时,触发的工作负载完全不同。比如Agent去调用数据库,数据库本身是极度消耗单核性能的应用,背后需要的是高性能P核。陈葆立举了一个例子:某家做SAP HANA的企业,用Agent大量调度SAP任务,瞬间触发的是密集的P核计算需求。

这是英特尔至强同时提供E核(至强6+)和P核(至强6)两条产品线的底层逻辑——Agent的工作负载是异构的,"单一架构打天下"在这里行不通。

支撑这套系统运转的,是英特尔为Agentic时代打造的算力、存力、连接力、保障力四力。当然在算力的部分,至强6+除了是首款采用Intel 18A的服务器CPU,以及拥有高达288个核心之外,有两个容易被忽略的"杀手锏"技术。

Agent时代的CPU军备竞赛,至强6+如何把Agentic AI变成生产力?

至强6+的两把「金钥匙」:QAT和IAA打开KV Cache瓶颈

英特尔中国区技术部总经理高宇强调:"至强6系列拥有的QAT(数据压缩加速引擎)和IAA(内存分析加速器),是打开真正普及Agentic AI的两把金钥匙。"

这两个技术在产品发布环节没有被重点解释,但Agent时代它们变成了刚需。

问题的根源在KV Cache。现在主流大模型都支持百万上下文,一个用户的KV Cache就能占到10GB以上(压缩后)。用户数一多,GPU显存很快被占满,必须把KV Cache卸载到内存甚至SSD上。内存贵、SSD也贵——这是当下AI基础设施的成本痛点之一。

陈葆立分享,“跟SSD厂商聊英特尔的QAT和IAA,本来以为对方会高兴,结果对方说,你们最好把至强的压缩功能发挥好,让需求控制一下,我现在每天被追着交不出货。”

Agent时代的CPU军备竞赛,至强6+如何把Agentic AI变成生产力?

QAT和IAA并非英特尔为应对这轮内存紧缺专门研发的新技术,而是多代产品里就有的能力——只是Agent时代来了,它们的价值才被充分激活。

QAT(数据压缩加速引擎)解决的是SSD的问题。通过硬件级压缩,KV Cache在存盘前先压缩,压缩比至少50%——10GB直接变5GB。阿里云给出的实测数据显示,使用QAT之后,压缩带宽提升400%,同时减少了75%的通用CPU核数占用。

IAA(内存分析加速器)解决的是内存的问题。它对内存中的数据做实时压缩,且解压是硬件级完成,重新加载时不增加延迟。IAA让Agent启动时占用的内存更小,同样的内存可以跑更多的Agent。英特尔给出的数据是,在沙箱场景中,IAA可以将snapshot延迟降低最高60%,沙箱冷启动时间提升30%。

高宇说,"这两个技术在没有智能体的时候英特尔就已经推出,只是以前大家觉得改软件麻烦,需求不迫切。今天Agentic时代来了,大家发现这个可以帮我们省下几千、几万块,就有了改软件的动力。"

新华三存储产品线首席产品经理王其勇分享了X20000存储平台借助至强6+的落地成绩:在推理场景中,TTFT(首Token时延)和TPOT(每Token生成时间)性能提升最高达10倍以上。存储成本方面,协议融合让存储成本下降60%,数据准备时间减少35%。

Agent时代的CPU军备竞赛,至强6+如何把Agentic AI变成生产力?

把Agentic AI从技术实力变成生产力

技术实力如何转换成最终的生产力,是数据中心创新日值得重点关注的内容。

腾讯云计算产品运营总监周驰分享,腾讯曾在腾讯大厦楼下举办免费帮大家"养虾"的活动。以往这类开发者活动来的大多数是程序员,但这一次,开发者反而是少数。

"我们看到有律师、有农民,上到七八十岁的老人,下到10岁的小朋友,他们都能讲出来我想用龙虾干什么。"周驰说。

这个破圈现象,是周驰解读CPU需求增长时反复强调的背景。他认为,CPU:GPU的比例变化不应该只看数据中心内部,而要看全球业务量——大量原本ROI不合算、开发商不屑于做的业务,正在因为AI被自动化搬上了云和各类计算平台。这些自动化工作不需要很多GPU,需要的是调度能力,以及持续的高并发去执行大量的小脚本。

腾讯云是英特尔至强6+(Sierra Forest系列)AP平台的全球独占合作伙伴,已将其广泛应用在微信、腾讯广告检索、腾讯会议等业务场景。新一代实例将充分利用至强6+在288核、576MB三级缓存方面的优势,支撑更高并发的Agent工作负载。

Agent时代的CPU军备竞赛,至强6+如何把Agentic AI变成生产力?

金山云给出的是更直接的数字。基于至强6+的第十代云服务器SE10,AI Agent应用部署密度提升80%以上,Nginx高并发场景吞吐提升最高33%,MySQL CPU性能提升52%,Redis时延降低约20%。金山云计算研发负责人杨峰说,"基于最新一代CPU实例,它重新定义了单服务器的性能边界。"

火山引擎则在安全维度给出了落地验证。依托英特尔至强处理器和TDX技术,火山引擎AICC机密计算平台实现了多租户环境中AI数据与计算资源的全生命周期隔离——对于把敏感业务数据搬上云的企业来说,这是数据安全的硬保障。

英特尔在Agent时代的独特竞争力

陈葆立说:"机会是留给有准备的人的。"

从GPU主导一切,到CPU在Agent时代重回C位,英特尔和腾讯云、金山云这批长期合作的伙伴,正在把这个判断变成可以量化的生产力数字。能够迅速抓住Agent时代的机遇,靠的不是押对了风口。

IAA做了多年,当年客户兴趣有限,因为应用场景不需要;QAT也是如此,用的人不多。但Agent时代来了,这两个技术突然变成了稀缺能力。多代积累,等到了它该被用起来的时候。

这种积累还在延续。雷峰网了解到,英特尔下一代至强CPU代号Diamond Rapids,将基于Intel 18A P工艺,2027年发布,与至强6+保持完整的Socket兼容性,客户不需要为升级重构整套基础设施。

Agent时代的CPU军备竞赛,至强6+如何把Agentic AI变成生产力?

高宇把今天AI数据中心里的超级工厂比喻成三台机器,"GPU集群、CPU集群、高性能存储集群。驱动这三台机器的,都是同一个东西——英特尔至强处理器。"

过去几年,AI行业最大的叙事是GPU统治世界。但Agent的出现,正在让产业重新发现CPU的价值。

腾讯云、金山云、阿里云这批中国伙伴给出的落地数字,是比PPT更有说服力的答案:至强6+能不能在Agent时代吃到这波红利,现在已经不只是趋势预测,而是正在发生的事实。

雷峰网原创文章,未经授权禁止转载。详情见转载须知