惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

N
News and Events Feed by Topic
Malwarebytes
Malwarebytes
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
C
Cybersecurity and Infrastructure Security Agency CISA
F
Future of Privacy Forum
C
Cisco Blogs
T
The Exploit Database - CXSecurity.com
A
Arctic Wolf
S
Securelist
K
Kaspersky official blog
S
Schneier on Security
T
ThreatConnect
T
Tenable Blog
Spread Privacy
Spread Privacy
T
True Tiger Recordings
AWS News Blog
AWS News Blog
F
Fox-IT International blog
量子位
T
Threatpost
V
Vulnerabilities – Threatpost
C
CERT Recently Published Vulnerability Notes
Cisco Talos Blog
Cisco Talos Blog
GbyAI
GbyAI
宝玉的分享
宝玉的分享
腾讯CDC
G
Google Developers Blog
aimingoo的专栏
aimingoo的专栏
Cyberwarzone
Cyberwarzone
有赞技术团队
有赞技术团队
S
SegmentFault 最新的问题
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
V
Visual Studio Blog
U
Unit 42
雷峰网
雷峰网
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Simon Willison's Weblog
Simon Willison's Weblog
O
OpenAI News
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
The GitHub Blog
The GitHub Blog
The Register - Security
The Register - Security
MyScale Blog
MyScale Blog
小众软件
小众软件
A
About on SuperTechFans
Last Week in AI
Last Week in AI
Y
Y Combinator Blog
博客园 - 三生石上(FineUI控件)
美团技术团队
Google Online Security Blog
Google Online Security Blog
P
Proofpoint News Feed
MongoDB | Blog
MongoDB | Blog

博客园 - iTech

不用 Embedding 也能做知识 Agent?Vercel 用文件系统干掉了向量检索管线 AI 技术日报 - 2026-05-25 Hermes Agent 接入 Microsoft Teams 全指南:6 步让你的 AI Agent 进群聊 Understand Anything:把任何代码库变成可交互知识图谱,23k star 的 AI 编程理解神器 腾讯开源 openclaw-weixin:让你的 AI Agent 直连微信,扫码即用 什么是 Agent-Native?如何把你的网站升级成面向 AI Agent 的网站 AI 技术日报 - 2026-05-24 Claude Code 为什么放弃 RAG 用 Grep 搜索代码?大型代码库最佳实践全解析 DeepSeek V4 Pro 永久降价 75%:旗舰推理模型进入白菜价时代 Runtime (YC P26):给每个团队配一个沙盒 AI Agent,产品经理也能提 PR Models.dev:查 AI 模型价格不用再开十几个网页了,4,844 个模型一站式对比 Superset (YC P26):Agent 时代的全新 IDE,同时跑 10 个 Claude Code 互不干扰 AI 技术日报 - 2026-05-23 3.5 个月 4.3 万 Star:nanobot 凭什么成为最火的开源 AI Agent CodeGraph:给 AI 编程助手装上代码知识图谱,省 35% 费用、减少 70% 工具调用 AI Engineering from Scratch:435 节课从线性代数到自主 Agent,每个算法手写一遍 Lucarne:不用盯着电脑也能掌控 AI Agent,微信/Telegram 远程遥控本地编码助手 财富正在向 AI 集中:三个万亿级 IPO 同场竞技,一场前所未有的造富运动 程序员必备核心技能手册:从 Linux 到 Docker 的实战速查 Deep:DeepSeek 版的 Aider / Claude Code,开源 CLI 编程工具新选择 AI 技术日报 - 2026-05-22 PUA vs NoPUA:用恐惧还是用爱驱动 AI Agent?一场 17000 Star 的路线之争 Anthropic 停招 L6 以下:当最强 AI 公司自己都不招初级工程师了 CLI for Microsoft 365 实战:用命令行操控 Teams 收发消息 面试 AI Agent 工程师会被问什么?40+ 真题 + 知识图谱全梳理 7 个标准正在重塑 AI 开发:从 MCP 到 AG-UI,一文看懂 Agent 时代的协议栈 SpaceX IPO:史上最大上市案,1.75万亿到2万亿美元的估值到底买了什么? DeepSeek 悄悄挂出 Agent Harness 岗位:Model + Harness = Agent,要做智能体产品了? AI 技术日报 - 2026-05-21 Claw 和 Hermes 精选 10 个零成本 Skills:让 AI Agent 能力翻倍 Stainless:AI 时代最被低估的幕后公司,你用的每个 SDK 可能都出自他们之手 飞书 CLI vs 企业微信 CLI vs 钉钉 CLI:三大办公平台终端工具横评 12-Factor Agents:从 21k Star 的开源项目看 AI Agent 的正确构建姿势 AI 技术日报 - 2026-05-20 Semble:让 AI Agent 搜代码的 Token 消耗直降 98%,怎么做到的 CloakBrowser:15k Star 的隐形浏览器,49 个 C++ 补丁干翻所有反爬检测 AI 技术日报 - 2026-05-19 面向 Agent 的软件开发:当软件的第一用户不再是人类 8MB 内存跑 AI 编程代理?Zerostack 用纯 Rust 证明:Agent 不需要那么重 AI 技术日报 - 2026-05-18 AI 技术日报 - 2026-05-17 AI 技术日报 - 2026-05-16 Anthropic 发布创始人手册:AI Native 公司不是多招几个工程师,是换一种活法 "不用 AI 就会被淘汰"——这是我听过最懒惰的恐吓 0.79ms 创建一个安全沙箱:zeroboot 用 COW 打穿 AI Agent 隔离的性能天花板 2000+ API 一把梭:agentic-ai-apis 让你少写 80% 的基础设施代码 AI 技术日报 - 2026-05-15 OpenHuman:一个让你在几分钟内拥有 AI 超级智能的开源项目 开源项目怎么选 License?个人免费、企业收费的 6 种方案全对比 browser-use vs browser-harness vs agent-browser:AI Agent 浏览器自动化工具终极选型指南 AI 技术日报 - 2026-05-14 一个 Deep Agent 到底能干什么?从功能视角拆解它的全部能力 Deep Agents SDK 功能全清单:我逐行读了源码,整理出这份完整参考手册 7MB 干翻 200MB?开源终端 Terax AI 能不能替代 Warp,我替你试了 Deep Agents vs Claude Code vs Cursor:2026 年 AI 编程 Agent 终极对比 15 个 Deep Agents 实战案例:从 Deep Research 到 Text-to-SQL,看看这个框架能做什么 用 Deep Agents CLI 替代 Claude Code:一条命令装好,任意模型驱动的终端 Agent 拆解 Deep Agents 架构:中间件、后端、Profile 三板斧,这设计比我想的还深 Deep Agents:LangChain 出品的 2026 年最强开源 Agent 框架,3 行代码搞定一切 AI 时代,我辞掉了大厂工作去做独立开发者——血泪换来的 7 条生存法则 中国 AI 六小虎估值大盘点:谁在泡沫上跳舞,谁在价值里扎根 AI 技术日报 - 2026-05-13 写好 AGENTS.md 相当于白嫖一次模型升级(写错了还不如不写) GitHub 49K Star!Ruflo 让 Claude 多 Agent 协作像带团队一样简单 AI 技术日报 - 2026-05-12 罗福莉访谈深度解析:Agent 时代普通人还能干什么 AWS DevOps Agent:亚马逊的自主运维 Agent 来了 Vercel vs Netlify vs Cloudflare Pages:2026 静态托管三巨头实测对比 AI 时代,为什么中国出不了英伟达、三星、海力士? Vercel 开源 Open Agents:把 Claude Code 搬上云,关机也能干活 黄仁勋 CMU 毕业演讲全文解读:计算范式 60 年来首次被重写,每个人都是程序员 AI 技术日报 - 2026-05-11 nuwa-skill 18K Star:16 个思维 Skill 全拆解 - iTech Hermes Web UI:把 AI Agent 装进浏览器,一个面板管到底 AI Agent 工具多到选不过来?Agent MGMT 帮你一次性看清全局 营收创新高却裁员 20%:Cloudflare 用 AI Agent 告诉我们,替代已经开始了 AI 技术日报 - 2026-05-10 23K Star 的 DeepSeek TUI,真能代替 Claude Code 吗? Gumroad创始人把《极简创业》做成AI技能包:10个斜杠命令,让Claude当你的创业顾问 Open Design:3.4万星的开源AI设计工作室,让你的编程Agent秒变设计师 免费搭一个 AI 新闻雷达:Horizon 开源项目部署实战 Cloudflare Agent Setup:一行指令让 AI Agent 帮你配好整个开发环境 AI 技术日报 - 2026-05-09 AI Agent 写完代码谁来测?这个开源沙箱把 CI/CD 和多 Agent 协作全包了 7万星的AI交易框架:让大模型模拟投行多空辩论,自动做交易决策 71000颗星的AI交易团队:让大模型模拟投行分工,自动做交易决策 13400颗星的开源项目:输入一句话,AI全自动帮你做短视频 102颗星的沙盒:当AI学会自己写代码、跑测试、做部署 AI 技术日报 - 2026-05-08 29k 星的 PageIndex:不用向量数据库,靠推理就能做 RAG 每天花两小时刷信息?这个开源项目帮你全自动搞定 读源码像读小说?试了 DeepWiki 和 Zread,我再也不想裸读 GitHub 了 Matt Pocock 开源的这套 .claude 技能,为什么让工程师集体上头? Cursor Team Kit:Cursor 官方团队在用的 17 个 AI 工作流 AI 技术日报 - 2026-05-07 AI 技术日报 - 2026-05-06 - iTech AI 技术日报 - 2026-05-05 Anthropic CEO 说 12 个月内程序员要失业,我扒完他的底牌,发现事情没那么简单 把工程师的肌肉记忆装进 Claude Code,这个 4300 Star 的项目我后悔没早用 AI 技术日报 - 2026-05-04
Google 开源分布式 Agent 运行时 AX:让 AI Agent 像微服务一样可靠
iTech · 2026-05-25 · via 博客园 - iTech

Google 开源分布式 Agent 运行时 AX:让 AI Agent 像微服务一样可靠

AI Agent 的 Demo 越来越酷,但生产环境里最让人头疼的问题一直没变:Agent 跑到一半崩了怎么办? 任务执行到第 7 步突然网络断了,或者 LLM 超时了,或者工具调用挂了——整个状态全丢了,只能从头再来。

Google 刚开源了一个叫 AX(Agent eXecutor) 的项目,专门解决这个痛点。它是一个分布式 Agent 运行时,核心理念是把微服务架构里已经验证过的可靠性模式——事件溯源、单写者、可恢复执行——搬到 Agent 世界里来。

项目还非常早期(v0.1.0),但设计思路值得关注。主贡献者是 rakyll(Jaana Burcu Daşdamiroğlu),Google 内部 Go 语言团队的核心成员,之前主导了 OpenTelemetry Go SDK 和许多知名开源项目。

本文提纲

  1. AX 是什么——定位与核心设计
  2. 架构拆解:Controller、Event Log、Registry
  3. 关键特性:可恢复执行与分叉
  4. Agent 接入方式:从远程 Agent 到 A2A 协议
  5. 与现有方案的差异
  6. 现状与风险

AX 是什么——定位与核心设计

AX 的定位非常明确:它不是 Agent 框架,而是 Agent 的运行时基础设施。

什么意思?LangChain、CrewAI、Google ADK 这些框架帮你定义 Agent 的行为(用什么 prompt、调什么工具、怎么编排流程)。AX 不管这些——它管的是 Agent 跑起来之后的事:状态管理、故障恢复、分布式协调、审计追踪。

用微服务的类比:框架是你的业务代码,AX 是你的 Kubernetes。

AX 的几个设计决策很有意思:

设计决策 含义
Single-Writer Architecture 一个 Controller 拥有所有状态的写权限,避免分布式状态冲突
Event Log(事件日志) 每个动作都记录为不可变事件,状态通过事件回放重建
Resumable Stream 客户端断开后可以从上次看到的序列号恢复,不丢事件
Agent-agnostic 不绑定特定的 Agent 框架或 LLM 模型
Kubernetes-native 虽然计算层无关,但针对 K8s 做了最优体验

MERMAID_BLOCK_0

从单体 Agent 走向分布式 Agent 是必然趋势——工具、技能、子 Agent 各自部署为隔离的 Actor,通过协议通信。AX 就是这个分布式架构的协调层。

架构拆解:Controller、Event Log、Registry

Controller(控制器)

Controller 是整个系统的"大脑"。它是唯一的 State Writer——所有 Agent 的执行状态、工具调用、事件记录都通过 Controller 协调。

这种单写者设计牺牲了水平扩展性,换来了一致性保证。在 Agent 场景下这是合理的:一个对话的状态本身就不需要分片到多个节点。

Event Log(事件日志)

这是 AX 最核心的数据结构。每个 Agent 动作(接收消息、调用工具、返回结果)都被追加到 Event Log 里,形成一条不可变的时间线。

Event Log 的存储后端目前是 SQLite(单机模式),但设计上可以替换。每条事件有一个单调递增的序列号(sequence number),客户端和 Agent 都用这个序列号来追踪进度。

好处是显而易见的:
- 可回放:任何时刻的状态都能通过事件回放重建
- 可审计:谁调了什么工具、用了什么参数,全有据可查
- 可恢复:崩溃后从最后一个 checkpoint 继续执行

Registry(注册表)

Registry 管理所有可用的 Agent、Tool 和 Skill。配置在 ax.yaml 里声明:

server:
  address: ":8494"

eventlog:
  sqlite:
    filename: "eventlog/log.sqlite"

planner:
  gemini:
    model: "gemini-3.5-flash"
    timeout: "60s"
    skills_dir: "./examples/skills"

registry:
  remote_agents:
    - id: "medical-deep-researcher"
      name: "Medical Deep Researcher"
      description: "Performs deep medical research using various resources"
      address: "localhost:50051"

这个声明式配置让整个 Agent 集群的状态一目了然。

关键特性:可恢复执行与分叉

断线恢复

这是 AX 解决的第一个痛点。假设 Agent 正在执行一个 10 步任务,第 5 步时客户端断开连接:

# 客户端重连后,从序列号 12 开始恢复
ax exec \
  --conversation d85a4b4e-c53b-4c84-b879-f10d905bce40 \
  --last-seq 12 \
  --resume

Controller 会把序列号 12 之后的所有事件重放给客户端。注意这不是回滚——Agent 的执行在服务端一直在继续,客户端只是"追赶"自己错过的部分。

分叉(Fork)

更有意思的是 ax fork 命令。你可以从一个对话的某个 checkpoint 分叉出一个新的对话:

# 从序列号 12 的位置分叉出新对话
ax fork \
  --src-conversation 38460323-9a78-41cb-8991-022b0ff2c19c \
  --dest-conversation e5e26e38-53a2-4f22-b1cb-ae867357df83 \
  --src-seq 12

这个特性在 Agent 开发中非常实用。比如 Agent 在第 7 步走了弯路,你可以从第 5 步分叉出来,换一个 Agent 或调整参数重新执行——原始对话不受影响。

可视化追踪

ax trace --conversation 1a6e0b29-87c2-4af0-81ac-0c73bf8fa293

自动启动一个本地 Web UI,展示整个执行过程的时间线。调试 Agent 行为时,这种可视化比翻日志高效得多。

Agent 接入方式:从远程 Agent 到 A2A 协议

AX 目前支持四种 Agent 接入方式:

1. 远程 Agent(gRPC)

最直接的方式——你的 Agent 作为一个 gRPC 服务运行,实现 AX 的 AgentService 接口:

# 启动远程 Agent
go run examples/remote_agent/main.go

# AX Controller 通过 gRPC 调用
ax serve

2. ADK Agent(Python)

Google ADK(Agent Development Kit)是 Google 的 Python Agent 框架。AX 提供了桥接层,让 ADK Agent 可以作为远程 Agent 接入。

3. A2A Agent

A2A(Agent-to-Agent)是 Google 主推的 Agent 间通信协议。AX 内置了 A2A 桥接,支持任何实现了 A2A 协议的 Agent 直接接入。

4. Colab Agent(实验性)

可以直接在 Google Colab 里运行 Python 脚本或 Notebook 作为 Agent。这个对快速原型验证很方便。

关键点:AX 不强迫你用特定的框架。 不管你的 Agent 是用 LangChain 写的、ADK 写的、还是裸 Python 写的,只要能通过某种协议(gRPC、A2A)和 Controller 通信就行。

与现有方案的差异

维度 AX LangGraph CrewAI AutoGen
定位 分布式运行时 编排框架 多 Agent 框架 多 Agent 框架
语言 Go Python Python Python
可靠性 事件溯源 + 自动恢复 Checkpoint(可选) 无原生支持 无原生支持
分布式 原生支持,Agent 隔离部署 主要单进程 主要单进程 主要单进程
审计 全链路事件日志 部分支持
K8s 原生 ✅ 设计目标
框架耦合 LangChain 自有框架 自有框架

AX 和这些框架不是竞争关系,而是互补——你完全可以用 LangChain 写 Agent 逻辑,然后用 AX 做运行时托管。

真正和 AX 有竞争关系的是 Temporal(分布式工作流引擎)。两者的设计理念非常相似:事件溯源、可恢复执行、单写者。区别在于 AX 专门为 Agent 场景优化——理解 tool call、skill selection、agent delegation 这些 Agent 特有的概念。

现状与风险

需要诚实地说,AX 目前还很粗糙:

  • v0.1.0,官方明确说会在稳定版之前引入"major breaking changes"
  • 核心贡献者只有 5 人(rakyll 个人贡献了 371 commits,占 80%+)
  • 文档不完整,很多设计还在讨论中
  • 不接受外部贡献(代码还在重构中)
  • 只内置了 Gemini Agent,其他模型需要自己接入

但设计思路是扎实的。rakyll 在分布式系统和可观测性领域的经验(OpenTelemetry、gRPC)让 AX 在可靠性设计上比大多数 Agent 框架成熟得多。

如果你在做需要长时间运行的 Agent(自动化运维、数据处理管线、多步骤研究 Agent),AX 的可恢复执行和审计能力值得提前关注。如果只是做简单的对话式 Agent,现阶段用 LangGraph 的 Checkpoint 就够了。


作者: itech001
来源: 公众号:AI人工智能时代
网站: https://www.theaiera.cn/
每日分享最前沿的AI新闻资讯和技术研究。

本文首发于 AI人工智能时代,转载请注明出处。