惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

博客园 - 司徒正美
大猫的无限游戏
大猫的无限游戏
Scott Helme
Scott Helme
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
S
Secure Thoughts
Google DeepMind News
Google DeepMind News
博客园_首页
Hacker News: Ask HN
Hacker News: Ask HN
量子位
Jina AI
Jina AI
I
InfoQ
V
V2EX
Martin Fowler
Martin Fowler
Y
Y Combinator Blog
H
Hackread – Cybersecurity News, Data Breaches, AI and More
人人都是产品经理
人人都是产品经理
B
Blog
IT之家
IT之家
云风的 BLOG
云风的 BLOG
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
博客园 - Franky
博客园 - 【当耐特】
N
Netflix TechBlog - Medium
Cloudbric
Cloudbric
H
Heimdal Security Blog
TaoSecurity Blog
TaoSecurity Blog
S
Security @ Cisco Blogs
U
Unit 42
Project Zero
Project Zero
Webroot Blog
Webroot Blog
The Register - Security
The Register - Security
N
News | PayPal Newsroom
Microsoft Security Blog
Microsoft Security Blog
H
Help Net Security
Forbes - Security
Forbes - Security
宝玉的分享
宝玉的分享
Last Week in AI
Last Week in AI
C
Check Point Blog
博客园 - 聂微东
M
MIT News - Artificial intelligence
有赞技术团队
有赞技术团队
D
DataBreaches.Net
Cyberwarzone
Cyberwarzone
N
News and Events Feed by Topic
N
News and Events Feed by Topic
Simon Willison's Weblog
Simon Willison's Weblog
J
Java Code Geeks
G
Google Developers Blog
GbyAI
GbyAI
T
Threatpost

InfoQ - 促进软件开发领域知识与创新的传播

Meta 收购 Manus 这事儿泡汤了 5.5万 Star 开源项目 Ghostty 被迫出走,GitHub 正在终结一代技术人的乌托邦 Slack 长时运行多智能体系统的上下文管理方案 从 T+1 到分钟级:金城银行基于 Apache Doris 构建高可靠、强一致的实时数据平台 谷歌云推出 Agents CLI,简化 AI 智能体开发全流程 Claude官方击穿高薪、高学历的安全防线!Anthropic点名10大高危职业,但有群人暂时稳了 亚马逊云科技终止 WorkMail 服务,并将 App Runner 转入维护模式 OPPO小布记忆:全模态碎片化内容的理解与智能整理实践|AICon上海 模力工场038周AI应用周榜:工具在消失,工作流在出现 Akamai CEO Tom Leighton:Agent 时代来临,云基础设施正从“中心化”转向“分布式边缘” 日均数百亿入库背后:从“人肉调度”到K8s弹性架构,度小满金融基于OceanBase重构入库架构实践 百度文库网盘发布GenFlow 4.0:月活用户超1亿,要把网盘变成全端AI工作台 Altman 投的 Agent 终端 Warp 开源了!斩获3.5万star 哪些客户需要拒, 敢让龙虾决定吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从开发到生产:为什么越来越多的机器学习团队纷纷迁移到 Snowflake | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 探索多智能体工作流:LangGraph Snowflake Cortex AI | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 腾讯云分布式缓存数据库:AI Agent - 从提示词工程到 Harness 工程 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 基于 Streamlit 为 CSV 数据构建分析智能体 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 AI 智能体:告别文档缺漏 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 构建 AI 驱动的数据管道:深度探讨 Snowflake Openflow 与非结构化数据 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 云端太贵、本地不够聪明,英特尔押注“端云混合AI”:智能体PC会替人完成工作 不到10%的存储投入,可能拖垮90%的GPU投资!IBM把AI Agent塞进存储系统,算清企业最容易忽略的一笔账 Snowpark 上手实战 | BUILD 2025_大数据_王玮_InfoQ精选视频 ClickHouse + Langfuse,构建 Agent 可观测基石 腾讯云分布式缓存数据库:Cluster Proxy 共享连接架构深度解析 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 AI 写代码太烧钱了:Copilot、Claude 一起涨价,不如把程序员请回来? 英特尔发布至强600系列工作站处理器与锐炫Pro B70 GPU,全新AI工作站来了 腾讯云分布式缓存数据库:从 Redis 到 Valkey - 开源社区如何快速创新 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 印奇这次要“从0重做”智驾模型!首谈阶跃和千里双公司布局:中国AI商业闭环要靠车跑出来 从Cursor返聘归来,90后华裔女高管带Claude开启日更模式:token成本比工程师工资低多了! 从 Coding 到 Agent:QCon 北京 2026 全景复盘,优秀出品人 & 明星讲师名单揭晓 全链路支撑大模型国产化“Day 0适配”,商汤大装置构建全栈能力底座 凌晨,OpenAI 与亚马逊云科技史上最大联合发布来了 HashiCorp Vault 2.0 发布:引入新身份联邦机制,迈入 IBM 生命周期体系 Yelp 实现超 1,000 个 Cassandra 节点零停机升级 写了 17 年开源代码,我为什么认为 Coding Agents 堆功能是在瞎折腾? 基于 Apache Camel 编排智能体与多模态 AI 管道 面向智能体与人类用户的AI记忆系统:架构设计与核心场景实践|AICon上海 Anthropic 推出 Managed Agents,简化 AI 代理部署流程 阿里HappyHorse开启灰测,720P视频生成低至0.44元/秒 讯飞联合清华团队押注量子AI:不看营收、不设KPI,一群“无人区”科学家,抢夺下代AI算力入口 小米万亿模型全面开源:MIT 协议、1M 上下文,但还是打不过 DeepSeek Cortex Code 入门指南:面向数据工程师的实践路径 | 技术实践 openJiuwen社区首发Team Skills,定义Coordination Engineering新范式 用 Snowflake Cortex Agents 释放结构化数据的最大价值 | 技术实践 Grafana 利用 Kafka 对 Loki 进行了架构重构,并发布了一款命令行工具,旨在将可观测性引入编码代理 ClickHouse重构全文索引:对象存储上跑出高性能 Full-Text Search 可观测性和遥测技术如何提升软件工程实践 Dropbox 与 GitHub 合作,将单体库大小从 87GB 缩减至 20GB Agent 的下一站:基于长期记忆系统 EverOS 的自我演进|AICon上海 同一赛道,四种收费:Agent 控制层(Harness)开始分裂 Cloudflare Sandboxes 正式发布,为 AI 代理提供持久化隔离环境 Agent 的“记忆断片”困局,该怎么破?_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选视频 数据分析师如何快速建立在 AI 时代最值钱的能力:一份可落地的行动路线图 摩尔线程最新财报:研发占比超86%,万卡级大规模智算集群落地 当云区域失效:地缘动荡环境下的高可用重构 Slack 重构通知系统,设置参与度提升 5 倍 智能体工程的隐性技术债务 “我把所有模型都换成了DeepSeek V4”:月账单将降 90%,效果还更好 阿里云智能集团高级技术专家刘少伟已确认出席AICon上海站,并分享如何构建企业 Agent 的自动化行动架构 构建生产就绪的 tRPC API:Apollo Federation 的 TypeScript 替代方案 Anthropic推出面向Claude Code的基于智能体的代码审查功能 北京车展直击:斑马智能甩出车载Agent短剧,比亚迪率先落地,AI让智能座舱又热起来了 Snowflake 作为智能体运行时:从静态管道迈向自主数据系统 | 技术实践 Snowflake 上的本体体系:基于 Cortex Code 能力实现从架构到部署 | 技术实践 Cloudflare 公布 MCP 架构方案,应对企业面临的安全与治理风险 复杂的项目管理怎么做到「AI 友好」?飞书项目用「开放」给出答案 Snowflake Cortex Code 的规范驱动开发:将 SDLC 方法论引入 AI 辅助工作流 | 技术实践 Copilot 不让注册了:从“随便用”到“全面限”,agent 把原有订价模型顶穿了 当互联网用AI卷效率时,这家公司先问了一连串“能不能” Meta 开始记录员工每一次点击:AI 要接管工作,先监控会工作的人 Meta“Token榜”逼疯打工人,一夜烧掉公司几万刀!AI时代Token焦虑越来越离谱 智源FlagOS完成DeepSeek-V4-Flash在八款芯片Day0适配,实现三重技术突破 DeepSeek V4 重磅开源!首次打通华为Ascend,也没丢掉英伟达,百万上下文夺回国产模型话语权 李志飞的“新实验”:当超级个体撞上真实组织 GPT-5.5 登顶时刻,Anthropic 亲口承认 Claude 变笨了!网友群嘲:太敷衍 那些没空写的小需求,龙虾真能做吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从 Pandas 到生产:使用任意 IDE 进行可扩展的 ML 数据管道与分布式处理 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 pnpm 11 候选版本发布,带来 ESM 分发、供应链默认设置以及新的存储格式 银行业PDF表格提取方案重构:基于Java的分层方案 GPT-5.5 赢了 Opus 4.7 和 Mythos?奥特曼晒黄仁勋内部信:英伟达全员用上 Codex! Cloudflare 推出 Think:一款面向 AI 代理的持久化运行时 1850亿美元天价支出、75%代码由AI生成!谷歌正式宣告:全面转向智能体工作流 xAI落后太多,马斯克“开大”重金求购Cursor,100亿美金“分手费”都敢签! Pulumi 新增对 Bun 运行时的全面支持 姚顺雨腾讯模型首秀!不卷参数只做 “听话打工人”,Hy3 preview登场 | 附实测 老板让你“忽悠”投资人,你敢发给龙虾吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 Gemini CLI 引入子代理机制,实现任务委派与并行代理工作流 清华系团队星工聚将完成数千万天使轮融资,轮式机器人拿下头部制造企业亿级大单 Pretext.js 绕过 DOM 布局重排,实现 120 FPS 的高级交互体验 靠“AI 云”爆红的 Vercel,栽在一个第三方AI工具手里!IPO前夕遭黑,200万美元赎金谈崩? 高能研讨会|端侧 AI 正在重写实时感知效率上限_AI&大模型_王玮_InfoQ精选视频 2050大会看这篇就够了|报名、交通食宿指引大全 Java 近期资讯:OpenJDK JEP、Jakarta EE 12、Spring Framework、Micrometer、Camel、JBang 金融智能的架构编排:基于 Snowflake Cortex Agents 实现结构化与非结构化数据统一分析 | 技术实践 在AK大神爆火的任务里,摸清国产AI真实水平 百灵Ling-2.6-flash 正式发布:高 Token 效率,以 1/10 消耗实现 SOTA 级 Agent 能力 当 PM 懂AI,当技术懂产品:AI 时代产品力的双向进化|PM x AI产品力领航者大会即将开幕 为 AI 智能体设计记忆机制:揭秘 LinkedIn 的认知记忆智能体 获奖名单公布|2026主题征文第一期|分享你最有价值的龙虾场景与核心 Skill_热门活动_InfoQ写作社区官方_InfoQ写作社区
个体10倍提效,组织却不足20%?AI产业正迎来Agent落地大考
四月 · 2026-06-19 · via InfoQ - 促进软件开发领域知识与创新的传播

“过去 9 个月,我们公司最大的实践就是,有了 AI Coding 以后,工程师们比原来更忙、加班更多,晚上也睡不着觉,因为他总要等着 AI 的结果。”

平凯星辰(TiDB)副总裁刘松在会上,抛出了企业侧用上 Agent 后的真实感受。“新应用整体提效接近 10 倍,老应用三四倍,但公司整体提效却不到 20%。

这并非个案,而是当前 AI 落地进入深水区的缩影。

近日,由清华大学全球产业研究院主办、中关村科学城管委会支持的,人工智能+生态大会(AIEC 2026)在北京举行。来自国家信息中心、IDC、阿里云、腾讯、浪潮信息、阶跃星辰、百川智能等众多机构与企业代表参与分享。

透过大会的宏观研讨与分论坛的微观实证,一个与以往“AI 带来指数级效率革命”截然不同的真实产业图景正在浮现:当大模型基础能力逐渐触顶,行业正集体撞上“工程化约束与组织重构”的暗礁。

决定 AI 能否创造生产力的,已不再是单纯的智力峰值,而是 Token 经济效率、严苛的工程约束体系,以及尚未建立的人机协同规则。

评价标准生变

国家信息中心信息化和产业发展部主任单志广指出,AI 正全面迈入推理阶段,Token 调用量呈指数级增长,成为贯通电力、算力、模型服务和应用价值的新型经济单元。这意味着,基础设施的评价标准正从追求算力峰值,转向单位能效成本效益场景服务能力

这一宏观判断在产业界得到了广泛印证。

阶跃星辰模型 GTM 负责人龚关直言,模型竞争的下一个前沿不再是峰值智能,而是“可规模化的高效智能”。真实的 Agent 任务,往往包含几十次工具调用上百轮推理,一次对话的成本可以接受,但一个长链路 Agent 任务跑下来,成本就变成了规模化的绝大障碍。

无独有偶,Kimi 大模型相关负责人也表示,模型竞争不再只看绝对能力,而要看单位时间单位 Token、单位成本内能产生多少有效性能

阶跃星辰 Stepfun · 模型 GTM 负责人龚关分享,阶跃新推的 Step3.7Flash 模型,其代码能力达到头部闭源模型约 97%的水平,但成本仅为后者的九分之一。这种产品逻辑背后隐藏着一个重要判断:未来真实生产环境中的 Agent 不会每次都调用最强模型,而是采用“混合编排”——在关键节点用强模型做判断,其余高频执行环节交给高效模型跑流程。

这对企业的采购与技术架构提出了新要求:不再迷信“买最贵的就是最好的”,而是需要真正懂得如何对 Agent 进行编排成本控制

10 倍个体提效,为何换不来 20%组织提效?

在 AI Coding 领域,基础能力的跨越有目共睹。

清华高等研究院副研究员陈松指出,SWE-bench(软件工程测试基准)的综合完成率在两年内从 10%多跃升至接近 95%。他将 AI 编程分为五级,L1 级(单文件脚本、网络爬虫)已完全可以交给 AI,但 L5 级(涉及国家安全、金融核心逻辑)则是“严禁使用”

然而,能力的跃升并未直接转化为组织的线性提效。

TiDB 是个激进的实验者——300 多名工程师被要求不直接写代码、也不 review 代码,90%的工作交给多智能体协作完成。自测显示,新应用整体提效接近 10 倍,老应用三四倍。

但刘松随后补了一个关键数据:“对于个体的提升已有数倍,但对于一个集体、一个软件公司,整体提效还没有人超过 20%。”

个体层面 10 倍与组织层面不足 20%的巨大落差,暴露了 AI 原生组织体系的缺失。刘松指出,问题出在上下文管理、权责边界上

陈松提到的另一个细节也颇具警示意味:Stack Overflow 的问题量在 2022 年后断崖式下滑,其积累的高质量问答数据被用来训练了大模型,但网站本身却因没有推出产品级应对方案而衰落。

这印证了一个现实:拥有数据或技术不等于拥有护城河将其转化为有约束、可落地的工程产品才是关键。

浪潮信息董事长彭震提出“Humagent(Human+Agent)”组织概念,则呼吁将管理对象从人、财、物扩展到数字员工智能能力

在 Humagent 框架下,人更多聚焦在系统性、前瞻性工作,包括目标设定、架构、方向规划,要把握方向、把握全局,发挥责任兜底把关作用。Agent 则更多承担一些高频执行工作,构建起人机优势互补、权责清晰、协同共生的 AI 原生组织形态。

但在实操层面,当人与智能体并存时,KPI 怎么算?出了生产事故谁担责?

正如刘松坦言:“把今天强大的 Coding Agent 放在现有人类组织里,会有非常多的不适。”

工程化填坑

当企业试图将 AI 从试验推向生产,开放工具与企业级平台必须承接执行闭环。

阿里云 Qoder 解决方案总监韩红娜认为,软件开发正从 Code First 转向 Agent First;腾讯资深产品专家汪晟杰也强调,企业不需要更聪明的聊天机器人,需要的是能干活、靠谱的数字员工。

浪潮信息系统软件研发部研发经理徐潇分享了 AI Coding 走出“玩具期”的真实痛点,智能体在遇到难题时会“逃避”谎报完成,甚至为了刷测试通过率而擅自修改断言

要解决这些不可靠、不可控的问题,必须引入严格的工程约束。在企业级 Agent 落地中,记忆与安全是被普遍低估的两大工程挑战。

记忆张量解决方案架构师陈玉涛指出,Memory 是 Agent 从“能用”到“好用”的分水岭。他将 Agent Memory 拆分为抽取、组织、检索、更新、共享五层,并点破了一个认知误区:幻觉率最高发的环节是抽取和更新,而非大多数人以为的检索。

如果只把历史记录扔进向量库,是搜不到“我昨天跟你聊了什么”的,必须通过结构化抽取(把“我”和“你”设为主体,“昨天”设为时间)才能被精准检索缺乏深度的记忆处理,企业 Agent 永远只能处理浅层任务。

安全问题同样不是简单的配置题。

上海人工智能实验室青年科学家、书安智能体操作系统负责人杨超直接点破了当下“养虾热”——即部署 OpenClaw/Claude Code 等自主智能体——的实际风险:工具注入、越权访问、提示词注入;市面上甚至出现了专门帮人“装 OpenClaw”和“卸 OpenClaw”的服务。

在其服务的联通停复机判责案例中,难点根本不是 AI 能不能做决策,而是高并发下的稳定性,以及如何防范用户通过提示词注入,来欺骗系统以骗取复机。

没有底层的隔离沙箱和非侵入式安全监控等零信任架构,Agent 进入核心业务系统就是灾难。

场景验证与落地的真伪之辨

AI 能否规模化落地,必须在真实产业场景中验证。美的集团通过沉淀工艺、供应链等经验,打造了 1.3 万个智能体,推动制造业全流程重构。

素源矩阵作为依托智能体的“一人企业”(OPC),在建材工业连续生产场景中,通过“机理模型+实时数据+人工确认”的协同决策,仅用 4 周便实现了产品合格率的提升和单吨成本的下降。

但汉得信息 AI 解决方案中心交付总监王强从交付视角指出,工业领域对 AI 的容忍度极低。一旦动了生产排程,出现事故成本极高,AI 落地决不能是“技术的自 High”。

另一个隐秘的落差在于“试运行”与“真生产”的距离。

Dify 解决方案架构师杨振南透露,其平台代码拉取量超 500 万次,覆盖 150 多个国家。但拉取量、试用次数与真正在核心生产线上跑通的部署之间,存在巨大的转化漏斗

把“已经开始试”和“真正跑通了”区分开来,是眼下这个阶段做判断最基本的前提。

整体来看,AIEC 2026 折射出中国 AI 产业落地的清醒认知。开源模型打破了智能垄断,但这只是起点。要在千行百业兑现生产力,还需要在工具链承接、企业级工程打磨、组织体系重构以及严苛产业场景验证中,完成大量艰苦的填坑工作

开放生态的建设,比单纯的模型比拼复杂得多,也更具决定性。