惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

GbyAI
GbyAI
博客园_首页
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
阮一峰的网络日志
阮一峰的网络日志
酷 壳 – CoolShell
酷 壳 – CoolShell
博客园 - 司徒正美
V
V2EX
Cloudbric
Cloudbric
Hugging Face - Blog
Hugging Face - Blog
腾讯CDC
量子位
博客园 - 三生石上(FineUI控件)
博客园 - 叶小钗
K
Kaspersky official blog
博客园 - 【当耐特】
T
Tenable Blog
L
Lohrmann on Cybersecurity
The Cloudflare Blog
S
Schneier on Security
A
Arctic Wolf
Latest news
Latest news
C
Cyber Attacks, Cyber Crime and Cyber Security
罗磊的独立博客
T
The Exploit Database - CXSecurity.com
Cisco Talos Blog
Cisco Talos Blog
小众软件
小众软件
P
Privacy & Cybersecurity Law Blog
WordPress大学
WordPress大学
Simon Willison's Weblog
Simon Willison's Weblog
雷峰网
雷峰网
NISL@THU
NISL@THU
人人都是产品经理
人人都是产品经理
月光博客
月光博客
J
Java Code Geeks
V
Visual Studio Blog
S
Security Affairs
博客园 - Franky
T
Tailwind CSS Blog
Apple Machine Learning Research
Apple Machine Learning Research
H
Heimdal Security Blog
有赞技术团队
有赞技术团队
V2EX - 技术
V2EX - 技术
AWS News Blog
AWS News Blog
G
GRAHAM CLULEY
T
Troy Hunt's Blog
SecWiki News
SecWiki News
Spread Privacy
Spread Privacy
宝玉的分享
宝玉的分享
www.infosecurity-magazine.com
www.infosecurity-magazine.com
博客园 - 聂微东

InfoQ - 促进软件开发领域知识与创新的传播

Meta 收购 Manus 这事儿泡汤了 5.5万 Star 开源项目 Ghostty 被迫出走,GitHub 正在终结一代技术人的乌托邦 Slack 长时运行多智能体系统的上下文管理方案 从 T+1 到分钟级:金城银行基于 Apache Doris 构建高可靠、强一致的实时数据平台 谷歌云推出 Agents CLI,简化 AI 智能体开发全流程 Claude官方击穿高薪、高学历的安全防线!Anthropic点名10大高危职业,但有群人暂时稳了 亚马逊云科技终止 WorkMail 服务,并将 App Runner 转入维护模式 OPPO小布记忆:全模态碎片化内容的理解与智能整理实践|AICon上海 模力工场038周AI应用周榜:工具在消失,工作流在出现 Akamai CEO Tom Leighton:Agent 时代来临,云基础设施正从“中心化”转向“分布式边缘” 日均数百亿入库背后:从“人肉调度”到K8s弹性架构,度小满金融基于OceanBase重构入库架构实践 百度文库网盘发布GenFlow 4.0:月活用户超1亿,要把网盘变成全端AI工作台 Altman 投的 Agent 终端 Warp 开源了!斩获3.5万star 哪些客户需要拒, 敢让龙虾决定吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从开发到生产:为什么越来越多的机器学习团队纷纷迁移到 Snowflake | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 探索多智能体工作流:LangGraph Snowflake Cortex AI | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 腾讯云分布式缓存数据库:AI Agent - 从提示词工程到 Harness 工程 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 基于 Streamlit 为 CSV 数据构建分析智能体 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 AI 智能体:告别文档缺漏 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 构建 AI 驱动的数据管道:深度探讨 Snowflake Openflow 与非结构化数据 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 云端太贵、本地不够聪明,英特尔押注“端云混合AI”:智能体PC会替人完成工作 不到10%的存储投入,可能拖垮90%的GPU投资!IBM把AI Agent塞进存储系统,算清企业最容易忽略的一笔账 Snowpark 上手实战 | BUILD 2025_大数据_王玮_InfoQ精选视频 ClickHouse + Langfuse,构建 Agent 可观测基石 腾讯云分布式缓存数据库:Cluster Proxy 共享连接架构深度解析 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 AI 写代码太烧钱了:Copilot、Claude 一起涨价,不如把程序员请回来? 英特尔发布至强600系列工作站处理器与锐炫Pro B70 GPU,全新AI工作站来了 腾讯云分布式缓存数据库:从 Redis 到 Valkey - 开源社区如何快速创新 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 印奇这次要“从0重做”智驾模型!首谈阶跃和千里双公司布局:中国AI商业闭环要靠车跑出来 从Cursor返聘归来,90后华裔女高管带Claude开启日更模式:token成本比工程师工资低多了! 从 Coding 到 Agent:QCon 北京 2026 全景复盘,优秀出品人 & 明星讲师名单揭晓 全链路支撑大模型国产化“Day 0适配”,商汤大装置构建全栈能力底座 凌晨,OpenAI 与亚马逊云科技史上最大联合发布来了 HashiCorp Vault 2.0 发布:引入新身份联邦机制,迈入 IBM 生命周期体系 Yelp 实现超 1,000 个 Cassandra 节点零停机升级 写了 17 年开源代码,我为什么认为 Coding Agents 堆功能是在瞎折腾? 基于 Apache Camel 编排智能体与多模态 AI 管道 面向智能体与人类用户的AI记忆系统:架构设计与核心场景实践|AICon上海 Anthropic 推出 Managed Agents,简化 AI 代理部署流程 阿里HappyHorse开启灰测,720P视频生成低至0.44元/秒 讯飞联合清华团队押注量子AI:不看营收、不设KPI,一群“无人区”科学家,抢夺下代AI算力入口 小米万亿模型全面开源:MIT 协议、1M 上下文,但还是打不过 DeepSeek Cortex Code 入门指南:面向数据工程师的实践路径 | 技术实践 openJiuwen社区首发Team Skills,定义Coordination Engineering新范式 用 Snowflake Cortex Agents 释放结构化数据的最大价值 | 技术实践 Grafana 利用 Kafka 对 Loki 进行了架构重构,并发布了一款命令行工具,旨在将可观测性引入编码代理 ClickHouse重构全文索引:对象存储上跑出高性能 Full-Text Search 可观测性和遥测技术如何提升软件工程实践 Dropbox 与 GitHub 合作,将单体库大小从 87GB 缩减至 20GB Agent 的下一站:基于长期记忆系统 EverOS 的自我演进|AICon上海 同一赛道,四种收费:Agent 控制层(Harness)开始分裂 Cloudflare Sandboxes 正式发布,为 AI 代理提供持久化隔离环境 Agent 的“记忆断片”困局,该怎么破?_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选视频 数据分析师如何快速建立在 AI 时代最值钱的能力:一份可落地的行动路线图 摩尔线程最新财报:研发占比超86%,万卡级大规模智算集群落地 当云区域失效:地缘动荡环境下的高可用重构 Slack 重构通知系统,设置参与度提升 5 倍 智能体工程的隐性技术债务 “我把所有模型都换成了DeepSeek V4”:月账单将降 90%,效果还更好 阿里云智能集团高级技术专家刘少伟已确认出席AICon上海站,并分享如何构建企业 Agent 的自动化行动架构 构建生产就绪的 tRPC API:Apollo Federation 的 TypeScript 替代方案 Anthropic推出面向Claude Code的基于智能体的代码审查功能 北京车展直击:斑马智能甩出车载Agent短剧,比亚迪率先落地,AI让智能座舱又热起来了 Snowflake 作为智能体运行时:从静态管道迈向自主数据系统 | 技术实践 Snowflake 上的本体体系:基于 Cortex Code 能力实现从架构到部署 | 技术实践 Cloudflare 公布 MCP 架构方案,应对企业面临的安全与治理风险 复杂的项目管理怎么做到「AI 友好」?飞书项目用「开放」给出答案 Snowflake Cortex Code 的规范驱动开发:将 SDLC 方法论引入 AI 辅助工作流 | 技术实践 Copilot 不让注册了:从“随便用”到“全面限”,agent 把原有订价模型顶穿了 当互联网用AI卷效率时,这家公司先问了一连串“能不能” Meta 开始记录员工每一次点击:AI 要接管工作,先监控会工作的人 Meta“Token榜”逼疯打工人,一夜烧掉公司几万刀!AI时代Token焦虑越来越离谱 智源FlagOS完成DeepSeek-V4-Flash在八款芯片Day0适配,实现三重技术突破 DeepSeek V4 重磅开源!首次打通华为Ascend,也没丢掉英伟达,百万上下文夺回国产模型话语权 李志飞的“新实验”:当超级个体撞上真实组织 GPT-5.5 登顶时刻,Anthropic 亲口承认 Claude 变笨了!网友群嘲:太敷衍 那些没空写的小需求,龙虾真能做吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从 Pandas 到生产:使用任意 IDE 进行可扩展的 ML 数据管道与分布式处理 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 pnpm 11 候选版本发布,带来 ESM 分发、供应链默认设置以及新的存储格式 银行业PDF表格提取方案重构:基于Java的分层方案 GPT-5.5 赢了 Opus 4.7 和 Mythos?奥特曼晒黄仁勋内部信:英伟达全员用上 Codex! Cloudflare 推出 Think:一款面向 AI 代理的持久化运行时 1850亿美元天价支出、75%代码由AI生成!谷歌正式宣告:全面转向智能体工作流 xAI落后太多,马斯克“开大”重金求购Cursor,100亿美金“分手费”都敢签! Pulumi 新增对 Bun 运行时的全面支持 姚顺雨腾讯模型首秀!不卷参数只做 “听话打工人”,Hy3 preview登场 | 附实测 老板让你“忽悠”投资人,你敢发给龙虾吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 Gemini CLI 引入子代理机制,实现任务委派与并行代理工作流 清华系团队星工聚将完成数千万天使轮融资,轮式机器人拿下头部制造企业亿级大单 Pretext.js 绕过 DOM 布局重排,实现 120 FPS 的高级交互体验 靠“AI 云”爆红的 Vercel,栽在一个第三方AI工具手里!IPO前夕遭黑,200万美元赎金谈崩? 高能研讨会|端侧 AI 正在重写实时感知效率上限_AI&大模型_王玮_InfoQ精选视频 2050大会看这篇就够了|报名、交通食宿指引大全 Java 近期资讯:OpenJDK JEP、Jakarta EE 12、Spring Framework、Micrometer、Camel、JBang 金融智能的架构编排:基于 Snowflake Cortex Agents 实现结构化与非结构化数据统一分析 | 技术实践 在AK大神爆火的任务里,摸清国产AI真实水平 百灵Ling-2.6-flash 正式发布:高 Token 效率,以 1/10 消耗实现 SOTA 级 Agent 能力 当 PM 懂AI,当技术懂产品:AI 时代产品力的双向进化|PM x AI产品力领航者大会即将开幕 为 AI 智能体设计记忆机制:揭秘 LinkedIn 的认知记忆智能体 获奖名单公布|2026主题征文第一期|分享你最有价值的龙虾场景与核心 Skill_热门活动_InfoQ写作社区官方_InfoQ写作社区
Anthropic在Code With Claude上发布托管式智能体、主动式工作流与能力曲线
作者: Andrew Hoblitzell张卫滨 · 2026-06-01 · via InfoQ - 促进软件开发领域知识与创新的传播

Anthropic 于 5 月 6 日在旧金山举办了Code with Claude 2026会议,并将直播内容发布到了 YouTube。相关分享覆盖了Claude Code、Claude Developer Platform,以及在GitHubVercelDatadogBun和多家 AI 原生创业公司中的合作部署案例。贯穿全天的主线话题是:模型能力的阶段性跃迁,会如何影响产品架构、组织设计与基础设施经济性。

Anthropic Claude Code 团队的 Dickson Tsai 展示了 Claude Code 的最新更新。在开发者体验方面,远程控制功能允许会话在一台机器上开始、随后在手机上继续;重新设计的桌面 GUI 则加入了分栏视图、将助手消息固定为章节并自动生成目录的能力,以及内联 diff 评论。在自主能力方面,Auto 模式把权限决策交给分类器,由其筛查破坏性操作和提示词注入;worktrees 则为 Claude 提供进入与退出工具,使其能够自行创建和销毁隔离分支。Tsai 还演示了 routines,这一能力可基于 cron 计划、GitHub webhook 或 API 端点触发提示词的执行。

随后,GitHub 首席产品官 Mario Rodriguez 与 Anthropic 的 Brad Abrams 共同进行了分享。Rodriguez 将缓存命中率视为任何向平台发送数十亿条消息的团队都必须关注的基础指标。他表示:“这有点像高频交易,哪怕只提升 1%的效率,整体上都意味着数百万的价值。”GitHub 的目标是将缓存命中率维持在 94%以上,而一旦跌到 70%左右,通常就意味着提示词组装环节出现了缺陷。Rodriguez 还列举了 GitHub 在工程实践中必须应对的 3 类缓存失效的原因。

Abrams 借此介绍了一种 advisor 策略,也就是,由较小的执行模型(比如,Haiku)仅在遇到困难场景时才调用更大的 advisor 模型(比如,Opus)。Abrams 表示:“我们能以远低于 Opus 级别的全面调用成本,获得接近 Opus 级别的智能,因为我们对 advisor 实际发送的 token 非常克制。”Rodriguez 还提到,GitHub 内部配合使用了一个 critic 模块,内部昵称为 Rubber Duck,它会在规划之后、复杂实现完成之后,以及测试编写完成但尚未运行之前进行检查。

Anthropic Managed Agents 的产品经理 Jess Yan 和 Anthropic 的技术团队成员 Lance Martin 在午间时段演示了Claude Managed Agents,并认为当前生产级智能体的瓶颈已经不再是智能本身,而是基础设施。他们重点介绍了沙箱代码执行、检查点和凭据作用域控制等底层原语。

下午 1 点,Anthropic 联合创始人兼 CEO Dario Amodei 以及联合创始人兼总裁 Daniela Amodei 登上主舞台。Daniela Amodei 表示,开发者“是 Claude 最重要的用户”,并介绍了 Anthropic 内部的一项文化价值观:同时掌控光明与阴暗面(hold light and shade),用以指导公司如何在交付强大模型的同时配套安全护栏。Dario Amodei 则透露,以年化口径计算,Anthropic 在 2026 年第一季度的收入和使用量增长达到了 80 倍,而不是原计划的 10 倍;他认为,这正是近期算力压力的根本原因,而公司当天早些时候宣布的与SpaceX的合作则在一定程度上缓解了这一问题。

他再次重申了此前的预测:2026 年将出现一家“一个人就能创造十亿美元价值”的公司,并指出,借助 AI 构建的两人公司实际上已经突破了十亿美元估值。他认为,下一个拐点将是智能体团队以组织而非个人的层级开展工作。当前真正拖慢进展的,是软件工程中那些不可验证的部分,例如设计质量与安全审查,而 Anthropic 如今正专注于训练模型来处理这些环节。

Anthropic Claude Code 负责人 Boris Cherny 与 Bun 创建者 Jarred Sumner 通过一场现场编程展示了 Bun 如何借助 Robobun 机器人实现自维护:它会复现每一个 issue,只有当自动生成的回归测试在旧版 Bun 上失败、而在修复分支上通过时,才会创建 pull request。Datadog 工程副总裁 Sesh Nalla 则介绍了一种叫做机器工具的概念,即让智能体输出“对意图和问题域的精确规格说明”,而不是为每个局部需求临时创造出彼此割裂的工具。

随后,Vercel CEO Guillermo Rauch 与 Anthropic 平台产品负责人 Angela Jiang 进行了对谈。Rauch 表示,Opus token 大约占 Vercel AI Gateway 使用量的百分之二十几,但却占到了超过 70%的支出;此外,自 Anthropic 最近一次升级以来,V0上的信用花费已经翻倍。他表示,更聪明的模型让 Vercel 得以简化 harness;模型“品味”的提升,也让 V0 能够吸收 Vercel 十年来积累的设计判断,而不是与之对抗。与此同时,由于模型能够在沙箱中编写中间代码,而不再依赖预定义的子智能体,工具的范围也在收缩。Rauch 表示:“我们现在更多是在围绕工具批准(tool approval)做工程设计,本质上是在构建正确的安全护栏。”

在由 Anthropic 创业合作负责人 Beth Robertson 主持的一场圆桌中,Cognition 联合创始人 Walden Yan、Gamma AI 产品负责人 Deeni Fatiha 以及 Harvey 应用研究负责人 Niko Grupen 共同探讨了在模型指数级进步下的产品架构。Cognition开发的是可自主编程、能够操作自己计算机的 Devin;Gamma是一款拥有超过 7000 万用户的 AI 原生演示文档工具;Harvey则面向法律和专业服务领域提供生成式 AI 平台。每位嘉宾都提到,自己都曾因为模型能力拐点而不得不重写产品架构。

Brad Abrams 在当天稍晚时候再次登台,单独介绍了 Claude Platform,重点讨论了提示词缓存、结构化输出以及在大规模工作负载客户中观察到的工具设计模式。Anthropic 开发者关系负责人 Alex Albert 则在收官环节提到,一年前 Claude 配合 Sonnet 3.7 在SWE-bench Verified上的成绩是 62%,而如今使用 Opus 4.7 已达到 87%;他还借助能力曲线,对未来的一年给出了预期。

Anthropic 的营收增速也在迅猛攀升。截至 4 月初,在公司调整了定价模式,改为按照企业客户实际使用的 AI 量收费,而非仅收取固定费用之后,其年化销售额已达到 300 亿美元。与此同时,ServiceNow、Uber 等公司也报告称,它们在年初几个月内就已用满全年的 token 预算。

有兴趣进一步了解的开发者,可以前往 Anthropic 的 YouTube 频道观看完整会议录像,浏览 claude.com 上的 Code with Claude 专题页面,或报名参加5月19日的伦敦场6月10日的东京场活动。

查看英文原文: Anthropic's Code With Claude Announces Managed Agents, Proactive Workflows, Capability Curve