惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

U
Unit 42
S
Securelist
小众软件
小众软件
WordPress大学
WordPress大学
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
B
Blog
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
The GitHub Blog
The GitHub Blog
Apple Machine Learning Research
Apple Machine Learning Research
博客园 - 司徒正美
博客园 - Franky
Hugging Face - Blog
Hugging Face - Blog
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
酷 壳 – CoolShell
酷 壳 – CoolShell
O
OpenAI News
Cloudbric
Cloudbric
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
TaoSecurity Blog
TaoSecurity Blog
MongoDB | Blog
MongoDB | Blog
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
V
V2EX
PCI Perspectives
PCI Perspectives
T
Troy Hunt's Blog
Schneier on Security
Schneier on Security
P
Palo Alto Networks Blog
M
MIT News - Artificial intelligence
V2EX - 技术
V2EX - 技术
阮一峰的网络日志
阮一峰的网络日志
Hacker News - Newest:
Hacker News - Newest: "LLM"
G
Google Developers Blog
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
The Last Watchdog
The Last Watchdog
The Register - Security
The Register - Security
腾讯CDC
N
News and Events Feed by Topic
C
Check Point Blog
爱范儿
爱范儿
T
Tailwind CSS Blog
Webroot Blog
Webroot Blog
P
Proofpoint News Feed
S
Schneier on Security
MyScale Blog
MyScale Blog
N
News | PayPal Newsroom
Recorded Future
Recorded Future
T
Tenable Blog
I
InfoQ
www.infosecurity-magazine.com
www.infosecurity-magazine.com
Microsoft Security Blog
Microsoft Security Blog
Simon Willison's Weblog
Simon Willison's Weblog
Engineering at Meta
Engineering at Meta

翔宇工作流

Hermes SOUL.md 人设工程 + 三层记忆深度解析:让 Agent 精确遵循你的人格 Hermes 语音模式完全攻略:CLI + Telegram + Discord 三表面免费搭建 Hermes Skill 自我进化系统:让 AI 助手越用越聪明 循环工程 Loop Engineering 指南:Skill 解决终止条件难题 用 Hermes Agent 搭建跨平台 AI 消息助手:一个 Agent 同时管 Telegram + Discord + 微信 Ghost 建站最佳实践:一人公司从零到有订阅者的完整手册 Hermes Agent Cron 定时自动化:任务链 + 预运行门控 + 零成本触发 Agent 工作流完全指南 2026:一人公司如何用多 Agent 自动化运营 Claude Code + Hermes MCP 消息桥接实战:任务完成自动通知手机 AI 知识库最佳实践:CLAUDE.md 多级路由 + 纯文件系统完整指南 零基础 AI 编程入门 2026:不会写代码,也能用 AI 做出产品 Runway Gen-4.5 提示词怎么写?八层框架从零到电影级 2026 AI 编程工具横评:Cursor vs Claude Code vs Codex vs Windsurf 深度对比 Codex 最佳实践完整指南 Hermes Agent Docker 部署实战:VPS 24/7 运行完整方案 Veo 3.1 视频提示词怎么写?八层框架从零到电影级 Claude Code 完全指南 2026:安装到 Agent 工作流 | 翔宇工作流 AI 配图不用找参考图:GPT Image 2 + 100 种风格方案 | 翔宇工作流 Hermes Agent 完全指南:架构、部署、成本对比与 14 篇实战教程导航 可灵 AI 视频提示词怎么写?八层框架从零到电影级 MCP 最佳实践:8 大场景推荐 + 安装提示词 Vibe Coding 完全指南 2026:氛围编程入门到进阶 | 翔宇工作流 即梦 Seedance 2.0 提示词怎么写?八层框架从零到电影级 Claude Code /loop 实战指南:十个场景让 AI 替你干活 | 翔宇工作流 Claude Code 最佳实践完整指南 CLAUDE.md 最佳实践 | 6 套完整模板直接复制 小红书 AI 运营完全指南(2026):选品到批量发布 Agent 工作流实战指南(2026):从单 Agent 到多 Agent 协作 Agent 编程方法论(2026):从驾驭工程到上下文工程 AI 知识库构建指南(2026):从文档到 Agent 可用的知识资产 自媒体 AI 自动化指南(2026):从手动创作到 Agent 驱动 AI 图片与视频生成指南(2026):提示词、工具、工作流 一人公司 AI 创收指南(2026):从副业到全职的完整路径 Claude Code Skill 开发指南(2026):从零开发到变现 Claude Code 动态工作流(Dynamic Workflows)+ ultracode 实战 | 翔宇工作流 什么是 Harness Engineering(驾驭工程)?概念到实战(2026)| 翔宇工作流 多Agent协作完全指南:SSH+tmux 跨机器 AI 调度 AI 编程工具中文教程到底去哪学?我做了 aiworkflowtutorials.com Claude Code thinking modes 新手指南 | 翔宇工作流 Claude Code Subagents 新手指南 | 翔宇工作流 Claude Code Slash Commands 新手指南 | 翔宇工作流 Claude Code Plugins 新手指南 插件生态 | 翔宇工作流 Claude Code 权限新手指南:6 模式 + 沙箱 Claude Code MCP 怎么装新手指南 | 翔宇工作流 Claude Code Hooks 新手指南 | 翔宇工作流 Claude Code 上下文窗口新手指南 1M context | 翔宇 OpenAI Codex 团队协作指南:单人到小团队 | 翔宇工作流 怎么给 OpenAI Codex 派活不跑偏?7 步任务拆解 | 翔宇工作流 Codex Skills/Subagents/Hooks 新手指南 | 翔宇工作流 OpenAI Codex 沙箱与审批怎么配?双层防线新手指南 | 翔宇工作流 OpenAI Codex 模型怎么选?任务×推理档位速查表 | 翔宇工作流 OpenAI Codex MCP 服务器怎么装?新手指南 | 翔宇工作流 AI 副业实战中文教程站:8 条路怎么选 | 翔宇工作流 AI 自媒体运营中文教程站:6 平台怎么选 | 翔宇工作流 vibe coding 第一个项目手把手 | 翔宇工作流 OpenCode 安装教程:Claude Code、Codex 的第三条后路 Q-Day OpenClaw AI 销售介绍:Agent 销售闭环 | 翔宇工作流 vibe coding 工具怎么选?按身份选 | 翔宇工作流 SEO工具实战指南:用112条命令完成网站SEO诊断、GEO优化与AI搜索优化全流程 GoodTrans 介绍:长文档翻译交付可审校成果 | 翔宇工作流 AI 编程入门:零基础别再先学语法 | 翔宇工作流 学员实践:openbili AI 接入驾驶舱介绍 | 翔宇工作流 学员实践:42织序播客介绍 | 翔宇工作流 AI 编程中文教程哪里找?10 大主流工具公开站完整指南 vibe coding 是什么?能不能用、适合谁 | 翔宇工作流 Animaker Dev 介绍:头像照片+参考视频生成 AI 动画的学员实践 | 翔宇工作流 2026 RSS 订阅源大全:开源 1745 个源 + Claude Code 工作流
2026 年 8 大 AI Agent 横评:从 OpenClaw 到 Hermes,谁最适合你?
翔宇 · 2026-06-16 · via 翔宇工作流

三个哲学,八种选择,一张表说清楚。

Claude Code 说:「让我成为你代码库不可或缺的存在」——深度专注。OpenClaw 说:「成为你数字生活的自动化层」——网关优先。Hermes 说:「与你一同成长,用得越多越强」——自我进化。

下面这张表是结论。正文是证据。

首屏结论:你的场景选哪个

8 大 AI Agent 选型导航面板:八个产品卡片呈扇形排列,按核心需求指向最佳选择
你的核心需求 首选 备选 一句话理由
跨平台消息自动化(Telegram / Discord / 微信 / Slack 全覆盖) Hermes OpenClaw 两者有消息网关;Hermes 自我进化 + 安全记录更优
Agent 随使用变强(长期复利) Hermes 无替代 唯一具备完整学习回路的 Agent
纯编码天花板(SWE-bench 最高分) Claude Code OpenHands Claude Code SWE-bench 70-75%,编码绝对领先
开源 + 模型自由的编码(无供应商锁定) OpenCode Aider OpenCode MIT + 75+ provider + LSP 诊断回路
沙箱安全最高的编码(默认网络隔离) Codex CLI OpenHands Codex CLI 默认禁网 + 三档自治
MCP 生态驱动(连接 1700+ 工具) Goose Hermes Goose 是 MCP 标准的试验场
Git 原生配对编程(最干净的 commit 历史) Aider OpenCode 每改一行自动原子 commit + 架构师模式
企业级自主软件工程(修漏洞 / 迁移 / 审 PR) OpenHands 唯一提供 Cloud + SDK + Web UI + K8s 部署的全自主 SWE Agent
预算极低(月均 5-20 元) Hermes Aider / OpenCode 软件免费 + GLM / DeepSeek 免费额度覆盖日常
多 Agent 编排 + 确定性调度 OpenClaw Hermes OpenClaw 的 Cron 是确定性的,不由大模型驱动

不是「谁更好」,是「何时选谁」。30% 的经验用户甚至不做二选一——OpenClaw 做编排,Hermes 做执行,Claude Code 做编码。三者正交。


8 大 Agent 逐个介绍

1. OpenClaw(353K Stars)——网关优先型

OpenClaw 是目前 GitHub Stars 最高的开源 Agent 项目。它的核心命题是「你的 AI 应该住在你住的地方——所有消息平台、所有自动化场景」。

基础档案:TypeScript / Node.js 编写,MIT 协议,社区基金会治理,137+ 个正式发布版本。25+ 消息渠道原生内置——Telegram、Discord、Slack、WhatsApp、iMessage、Signal 等,Gateway 是「会话、路由和频道连接的单一真值源」。

核心优势:ClawHub 社区市场 44,000+ 第三方 Skill(Skill 文件格式),多 Agent 架构(每个 Agent 独立频道、独立 Bot 身份、独立人设),Cron 定时系统是确定性调度(非大模型驱动),可信赖的子 Agent 定时触发。

值得注意的风险:历史累计 138+ CVE,其中两个 CVSS 9.9(WebSocket 注入 + 权限提升至 Admin + RCE)。Shodan 上有 135,000+ 暴露实例使用默认配置直接面向公网。ClawHub 341+ 恶意 Skill 已被标记。社区最高赞投诉(305 赞)是「每次更新带来的 bug 比修复的还多」。

适合谁:需要从 25+ 平台访问 AI 的团队;需要多 Agent 编排和确定性调度的自动化场景;看重最大 Skill 生态系统的用户。

不适合谁:对安全要求高的场景(138+ CVE 是客观事实);运维能力有限的个人(社区共识是「自建运维才是真正的门槛」);需要 Agent 随时间变强的用户(Skill 是静态的,永远不自动改进)。


2. Hermes Agent(189K Stars)——自我进化型

Hermes Agent GitHub 仓库首页截图:190K Stars、1,397 位贡献者、Apache-2.0 许可证

Hermes 在 2026 年 5 月 GitHub Stars 超越 OpenClaw,成为增速最快的开源 Agent 框架。核心命题是「Agent 应该复利化——你用得越多,它越懂你」。

基础档案:Python 编写,Apache-2.0 协议,Nous Research 开发,最新版本 v0.16.0(2026-06-05)。15+ 消息平台原生内置(包括微信 iLink Bot 官方协议),一个 Gateway 进程同时连接所有平台。

核心优势:完整学习回路(Self-Improving)——完成复杂任务后自动创建 Skill,遇错自动存解决路径,用户纠正自动存新做法。Honcho 辩证用户建模 + FTS5 全文检索会话搜索 + 自主记忆周期性自检。六个月的 Hermes 实例与新装实例表现截然不同。300+ 模型支持,hermes model 一键切换。6 种终端后端(local / Docker / SSH / Daytona / Singularity / Modal)。检查点回滚——修改文件前自动快照,出错可 /rollback 恢复。MCP 反向服务——hermes mcp serve 可被 Claude Code / Codex CLI 调用。

安全记录:截至 2026-04-10 零 Agent 级 CVE。v0.8.0 曾有一个 gateway 相关低危 CVE(CVE-2026-7396),非 Agent 逻辑层。

社区批评(公平呈现):自我评估过度乐观——Agent 几乎总觉得自己做得好,需要外部验证机制(107 赞批评帖)。自动覆盖手动编辑是部分用户的 dealbreaker。曾有推广账号水军疑虑。

适合谁:需要 Agent 随时间变强的长期使用者;跨多平台消息交互场景;模型成本敏感的个人开发者(GLM / DeepSeek 免费额度可覆盖日常);数据完全自控需求(全部数据在本机 ~/.hermes/)。

不适合谁:需要绝对可预测行为的场景(自我进化意味着行为会变化);只在终端写代码不需要消息网关的纯编码用户(杀鸡用牛刀)。


3. OpenCode(172K Stars)——开源版 Claude Code

OpenCode 是 2026 年上半年增长最快的编码 Agent,定位「开源 + 模型无关的终端编码 Agent」。

基础档案:Go 编写(TUI 核心)+ JavaScript/Bun(HTTP 服务端),MIT 协议,Anomaly 团队主导。安装一行命令 curl -fsSL https://opencode.ai/install | bash

核心优势:75+ 模型供应商支持(通过 Models.dev 注册表),一行配置切换,零供应商锁定。LSP 诊断回路——启动语言服务器,每次编辑后将编译器诊断反馈给模型自修正(2026 年编码 Agent 中唯一实现此能力)。客户端-服务器分离架构——Go TUI + Bun/Hono HTTP 服务器通过 HTTP 通信,可跨机器部署。Git 快照回滚——/undo 回退、/redo 重做。完全离线能力——搭配 Ollama 本地模型无需任何外部 API 调用。

性能数据:Builder.io 同模型对照测试(Claude Sonnet 4.5),Claude Code 9 分 9 秒完成 vs OpenCode 16 分 20 秒完成(慢 78%),但 OpenCode 写了 94 个测试 vs Claude Code 73 个——产出更彻底。

适合谁:看重模型自由和开源的编码用户;涉密/合规场景需要完全离线运行;喜欢 TUI 体验的终端党。

不适合谁:需要消息网关或自我进化;对编码速度而非覆盖度有极致要求;需要 IDE 深度集成(虽有 VS Code 扩展但不如 Claude Code 原生)。


4. Claude Code(131K Stars)——编码天花板型

Claude Code 是 Anthropic 的官方编码 Agent,只做一件事——代理式软件工程——做到任何其他工具无法企及的水平。

基础档案:TypeScript 编写,专有协议(源码可读但非 MIT/Apache),与 Anthropic 生态深度绑定。安装 2 分钟,三者中最快入门体验。

核心优势:SWE-bench Verified 70-75%(Opus 4.6 + 完整 Agent 脚手架),HumanEval 92%——纯软件工程任务绝对领先。VS Code / JetBrains 深度集成,不是「能在 IDE 里跑」而是「和 IDE 是同一个体验」。CLAUDE.md 项目记忆通过文件管理上下文。行为完全可预测——每次一样,不会自我修改。

约束:仅支持 Anthropic 三档模型(Opus $5/$25 MTok / Sonnet $3/$15 MTok / Haiku $1/$5 MTok),零模型灵活性——Anthropic API 宕机时无备用方案。无消息网关。不自动生成 Skill。无检查点回滚。每次会话从零开始,无跨会话持久记忆。月费 $20-200。

适合谁:需要编码天花板的职业开发者;信任 Anthropic 生态愿意为最强模型付费的团队;需要零配置即用的场景。

不适合谁:预算敏感;需要消息网关或自动化;需要模型灵活切换。


5. Codex CLI(90K Stars)——沙箱安全型

Codex CLI 是 OpenAI 的官方终端编码 Agent,核心架构区分是默认沙箱隔离——禁用网络访问、文件操作限定在当前目录树内。

基础档案:TypeScript / Node.js 编写,Apache 2.0 协议,OpenAI 开发。安装 npm install -g @openai/codex,运行要求 Node.js 22+。

核心优势:三档自治模式——Suggest(全审批)→ Auto-Edit(文件自动改、命令需审批)→ Full-Auto(完全自主,沙箱内运行)。codex.md 项目约定文件 + 全局配置形成分层体系。2026 年新增 Windows 原生沙箱 + PowerShell 支持。v0.116.0 加入企业功能——自定义策略、多 Agent 协调、仓库理解。

约束:仅支持 OpenAI 模型(o4-mini / o3 / gpt-4.1),零模型灵活性。无消息网关。无自我进化。

适合谁:对安全默认值要求极高的企业环境;OpenAI 生态深度用户;需要严格审批流程的合规场景。

不适合谁:需要模型自由度;需要消息网关;需要自我进化。


6. OpenHands(76K Stars)——企业自主 SWE 型

OpenHands(原 OpenDevin)是企业级全自主软件工程 Agent——不是代码补全工具,是完成整个工程任务的 AI 软件工程师。

基础档案:Python 编写,MIT 协议,All Hands AI 开发($18.8M Series A 融资)。三入口:Cloud(Web UI)+ CLI + SDK。

核心优势:完成整个工程任务——跨整个代码库规划、编写、应用变更。「当日自主修复 87% 的 Bug 工单」(官网数据)。Docker 或 Kubernetes 隔离环境部署,代码永不离开控制范围。Python SDK 嵌入应用和工作流。预设工作流覆盖修复漏洞→开 PR、审查 PR、代码迁移(COBOL→Java)、事故分级排障。企业客户包括 TikTok、VMware、Roche、Amazon、Netflix 等。

适合谁:大型企业代码库维护;需要 AI 自主完成从 issue 到 PR 全流程;需要 K8s 私有化部署的合规环境。

不适合谁:个人开发者日常配对编程(过度设计);需要消息网关;需要自我进化。


7. Goose(48K Stars)——MCP 原生驱动型

Goose 是 MCP(Model Context Protocol,模型上下文协议)标准的试验场,定位通用 AI Agent 而非仅编码。

基础档案:Rust 编写(核心)+ TypeScript(界面),Apache 2.0 协议。原 Block(前 Square)开发,2026 年 4 月捐赠给 Linux Foundation 旗下 AAIF(Agentic AI Foundation,代理式 AI 基金会)。三入口:桌面应用 + CLI + API。

核心优势:MCP 原生优先设计,连接 1700+ MCP 扩展(Jira、GitHub、Notion、PostgreSQL、文件系统、Shell 等)。通用 Agent——研究、写作、自动化、数据分析全覆盖。15+ 模型供应商支持。Linux Foundation 开放治理,社区贡献不受单一公司控制。2026 路线图聚焦本地推理和主权工作流(Sovereign Workflow,数据不离开本机)。

适合谁:已有大量 MCP 工具需要统一编排的团队;需要通用桌面助手而非仅编码 Agent;看重 Linux Foundation 开放治理的用户。

不适合谁:需要消息网关或自我进化;纯编码场景(编码能力不如 Claude Code / OpenCode / Aider 专注)。


8. Aider(46K Stars)——Git 原生配对型

Aider 是最干净的版本历史制造者——每次修改自动生成原子 Git commit,带大模型生成的描述性 commit message。

基础档案:Python 编写,Apache 2.0 协议,Paul Gauthier 创建。安装 curl -LsSf https://aider.chat/install.sh | sh。每周处理 150 亿 token(官网数据)。

核心优势:Git 原生——git log --oneline 直接读如 changelog。架构师/编辑器双模式(Architect Mode)——强推理模型规划方案,快速模型精准执行 diff,两轮设计减少多文件重构错误。70+ 模型支持,会话内 /model 一键切换。Watch 模式——后台运行 aider --watch-files,在任意文件写 AI! 注释触发自动编辑。39 个斜杠命令覆盖网页抓取、语音转写、截图理解、Shell 执行、测试自动修复。Prompt 缓存支持长会话节省 30-70% 成本。编辑器无关——VS Code、JetBrains、Vim、Emacs、SSH 终端都行。

Polyglot 基准数据:GPT-5(high)88.0% 领先,DeepSeek V3.2 Reasoner 74.2%(每次基准运行约 $1.30,性价比之王)。

适合谁:重视 Git commit 历史整洁的开发者;需要架构师模式处理多文件重构;偏好编辑器无关的终端工具。

不适合谁:需要消息网关或自我进化;需要 Web UI;需要 MCP 生态集成(Aider 的 MCP 支持尚在 RFC 阶段)。


10 维度对比矩阵

维度 Hermes OpenClaw Claude Code OpenCode Codex CLI OpenHands Goose Aider
GitHub Stars 189K 353K 131K 172K 90K 76K 48K 46K
消息网关 15+ 平台 25+ 平台
自我进化 完整学习回路 静态 Skill
模型自由度 300+ 多 provider 仅 Anthropic 75+ 仅 OpenAI 模型无关 15+ 70+
安全记录 1 低危 CVE 138+ CVE(2x CVSS 9.9) 闭源不公开 无公开 CVE 沙箱默认隔离 Docker/K8s 沙箱 标准 标准
月度成本 0-20 元 + LLM 0 + LLM $20-200 0 + LLM 0 + OpenAI API 0 + LLM / Cloud 0 + LLM 0 + LLM
IDE 集成 终端 + MCP 反向 终端 VS Code / JetBrains 深度 TUI + 桌面 + VS Code 终端 + VS Code Web UI + CLI + SDK 桌面 + CLI + API 终端(编辑器无关)
MCP 支持 MCP Server(反向暴露) 部分 MCP Client 无原生 MCP 原生 1700+ RFC 阶段
语音能力 转写 + TTS + 语音频道 /voice Whisper
部署方式 6 种 本地/Docker 本地 本地 本地/WSL2 Docker/K8s/Cloud 本地 本地

Hermes 独有能力深度分析

Hermes 自我进化学习回路示意图:任务执行到技能创建到记忆存储的正反馈闭环

在 8 大 Agent 中,以下能力仅 Hermes 具备

完整学习回路

其他 7 个 Agent 全部是「你配置了什么就是什么」——Hermes 是唯一一个会随使用时间变强的。机制包括:

  • 完成复杂任务(5+ 工具调用)后自动创建 Skill
  • 遇到错误自动存储解决路径(下次不会犯同样的错)
  • 用户纠正行为自动存储新做法
  • Honcho 辩证用户建模——不是简单记录偏好,而是辩证式理解你的意图
  • FTS5 全文检索会话搜索——所有历史对话可按关键词检索

实测效果:一个运行六个月的 Hermes 实例和一个全新安装的实例在执行相同任务时,成功率和响应质量存在可量化差异。这在其他 Agent 中不可能发生。

跨平台会话连续性

Hermes 不仅有消息网关(这一点 OpenClaw 也有),还有跨平台会话连续性——在 Telegram 开始的对话可以在 Discord 无缝继续,上下文完整保留。OpenClaw 的 25+ 平台是割裂的独立频道,不共享对话状态。

MCP 反向服务

hermes mcp serve 让 Hermes 不仅是 Agent,还是其他 Agent 的工具提供者。Claude Code 和 Codex CLI 可以通过 MCP 协议调用 Hermes 暴露的 10 个工具(conversations_list、messages_send 等)。典型场景:Claude Code 跑完长任务后通过 Hermes 推送消息到 Discord 通知用户。

检查点回滚

修改文件前自动快照整个工作目录,出错可 /rollback 恢复到任意检查点。OpenCode 有 Git 快照但限于仓库层面,Hermes 的检查点是工作目录级别——即使非 Git 管理的文件也被保护。


安全维度深度对比

AI Agent 安全对比示意图:完整盾牌与破裂盾牌对照展示不同框架的 CVE 安全记录

安全不是可选项。以下是硬数据:

安全维度 Hermes OpenClaw Claude Code Codex CLI
历史 CVE 总数 1(低危,gateway 层) 138+ 闭源不公开 无公开数据
CVSS 9.0+ 漏洞 0 2(WebSocket 注入 + RCE) N/A 0
恶意 Skill 风险 低(155 内置为主) 高(341+ 恶意已标记) N/A N/A
公网暴露实例 无公开数据 135,000+(Shodan) N/A N/A
沙箱隔离 Docker / Singularity / Modal Docker(手动配置) 内置沙箱 默认沙箱(禁网)
命令审批 smart 模式(AI 判断高风险暂停) 手动或关闭 内置审批 三档自治

OpenClaw 的 CVE-2026-25253(WebSocket 劫持)和 CVE-2026-32922(权限提升至 Admin + RCE)是 CVSS 9.9 的严重漏洞。如果你的场景涉及敏感数据或面向公网部署,这是选型的硬约束。


真实成本核算

AI Agent 月度成本阶梯图:从免费方案到高端订阅的价格递增对比

套餐价格不等于实际成本。以下是 30 任务/天场景的月度估算:

方案 月度成本 说明
Hermes + GLM-5.1 免费额度 0-5 元 99% 时间免费额度覆盖
Hermes + DeepSeek V4 Pro(兜底) 5-20 元 仅额度耗尽时启用
Hermes + Claude Sonnet 4.6 ~160 元/月 同模型同价
OpenClaw + Claude Haiku ~25 元/月 功能对等
Claude Code Pro 订阅 $20/月(~145 元) 有日用上限
Claude Code Max $100/月(~725 元) 高频使用
Claude Code Max Plus $200/月(~1450 元) 接近无限

社区成本警告:自主 Agent 的 Token 成本远超预期。根本原因是每条消息都发送完整对话历史到 API,成本在会话内指数复利。社区有 $131/天的极端案例(Claude Opus 重度使用)。

省钱策略:Hermes 的模型自由度是成本控制的核心杠杆。日常任务路由到 GLM / DeepSeek 可省 90% 以上,只在复杂编码任务时切到 Claude / GPT-5。


社区真实选择数据

Kilo.ai 分析了 r/openclaw 的 25 个高互动帖子、1300+ 条评论(按赞数排序),得出四方分裂格局:

阵营 占比 特征
坚守 OpenClaw ~35% 认可无可匹敌的集成广度和最大 Skill 生态
迁移到 Hermes ~30% 赞扬更简单的安装和更好的记忆默认值
双修(两者并用) ~20% OpenClaw 做编排,Hermes 做执行
对 Hermes 持怀疑 ~15% 怀疑有组织推广

迁移信号:从 OpenClaw 迁移到 Hermes 的最大推动力是记忆不可靠(42 赞帖)、更新破坏功能(305 赞帖)、安装调试时间超过实际使用时间。Hermes 内置 hermes claw migrate 命令——单向迁移 OpenClaw 的对话历史、工作区配置、Skill、记忆文件。OpenClaw 不提供反向迁移工具。


生产实践:翔宇的选型决策

以下不是推荐,是一个真实用户在 Mac mini 上同时跑 OpenClaw 和 Hermes 后做出的决策过程。

Hermes Agent 官方网站首页:The Agent That Grows With You 标语,展示安装与功能概览

为什么最终选了 Hermes

决策逻辑(按权重排序):

  1. 指针架构需求:知识库由 Claude Code 每天持续更新。需要 Agent 配置不硬编码内容,而是每次对话动态读取文件。SOUL / MEMORY / USER / channel_prompts 只放路径指针,内容通过 read_file 现场读——Claude Code 改了任何文件,Hermes 下次对话自动感知。这个架构 OpenClaw 不原生支持。
  1. 品牌分区频道需求:两个品牌的内容风格完全不同,需要进入 Discord 频道就自动确定品牌上下文。Hermes 的 channel_prompts 按频道 ID 指向不同目录——12 个频道覆盖两个品牌运营区和共用区。
  1. 辅助模型独立配置:生产中遇到过「压缩风暴」——主模型 429 限流 → 压缩也 429 → Agent 丢失整个对话上下文。Hermes 支持 auxiliary.compression 显式配置独立 provider。
  1. MCP 反向服务:Claude Code 跑完长任务后需要通知用户。hermes mcp serve 暴露工具,Claude Code 通过 SSH stdio 调用 Hermes 推送消息到 Discord。
  1. 成本:GLM-5.1 共享额度 + DeepSeek V4 Pro 按量兜底 = 月均 5-20 元。

双 Bot 冲突踩坑(一手经验)

问题:Mac mini 上 OpenClaw 网关和 Hermes 网关同时连接同一 Discord 服务器,每条消息两个 Bot 都抢着回复。OpenClaw 模型挂了还会在频道里贴出错误堆栈。

根本原因:两个 Bot 共享同一消息源,且都设置 require_mention: false(免提及即响应),导致双重响应。

解法:停掉 OpenClaw 网关,plist 改名 .disabled 防止 launchd 自动重启。

教训:同一台机器跑两个 Agent 网关时,必须确保它们不监听同一个消息源,或至少一个设置 require_mention: true。双 Bot 冲突不是理论问题——是生产中亲历的事故。

真实优劣势

生产中验证的优势

  • 知识库集成零维护——Claude Code 每天更新知识库,Hermes 零配置感知(每次现场读文件)
  • 模型切换 30 秒——改配置两行 + hermes gateway restart
  • 单进程运维—— launchd 一行管理
  • 工具延迟加载——72 个工具 Schema 从 19,210 token 降到 2,200 token(减少 89%)

生产中验证的劣势

  • 首条消息慢——冷启动自动探测端点(3 次 HTTPS),首条约 20 秒
  • plist 被覆盖——hermes gateway install 每次重新生成 plist,覆盖手工修改
  • Skill 自创建需要红线——不设边界会建「野生 Skill」,与既有工作流产生平行路径
  • Discord 表格不渲染——需要自己开发 PNG 渲染器 + 打适配器补丁

「何时选哪个」决策树

AI Agent 选型决策树:从消息网关需求出发分叉到 8 个框架的推荐路径
你需要消息网关吗?
├── 需要 →
│   ├── 需要 Agent 随时间变强 → Hermes
│   ├── 需要 25+ 平台最广覆盖 + 多 Agent 编排 → OpenClaw
│   └── 两者都要 → 双修(OpenClaw 编排 + Hermes 执行)
│
└── 不需要(纯编码/自动化)→
    ├── 编码天花板(不在乎锁定) → Claude Code
    ├── 开源 + 模型自由(编码) → OpenCode
    ├── 沙箱安全最高 → Codex CLI
    ├── MCP 生态驱动(通用自动化) → Goose
    ├── Git 原生配对 → Aider
    └── 企业级自主 SWE → OpenHands

双修方案:不是选不出来,是定位正交

Hermes Desktop 桌面应用下载页面:全平台支持的原生桌面 Agent 客户端

20% 的经验用户已经不再把这当「二选一」的问题。推荐架构:

OpenClaw(编排层)
├── 规划、分解、排序
├── 多频道路由
├── Cron 确定性定时触发
└── 通过 ACP 协议 → Hermes

Hermes(执行层)
├── 快速、可重复的任务循环
├── 自动创建/改进 Skill
├── 检查点 + 回滚
└── 长期记忆复利

Claude Code(编码层,按需调用)
├── 复杂代码重构
├── 多文件 Bug 修复
└── 通过 MCP 被 Hermes 调用

典型流程:Hermes 收到 Telegram 消息 → 判断是编码任务 → 委派给 Claude Code 执行 → 结果通过 OpenClaw 消息层回传 → Hermes 学习回路记录本次经验。


常见问题

Hermes 和 OpenClaw 哪个更好?

不存在绝对更好。OpenClaw 的优势是 25+ 平台最广覆盖 + ClawHub 44,000+ Skill 生态 + 确定性 Cron 调度。Hermes 的优势是自我进化学习回路 + 安全记录(1 CVE vs 138+)+ 模型自由度(300+ vs 多 provider)。你的场景决定选择。

Hermes 和 Claude Code 有什么区别?

定位完全不同。Claude Code 是纯编码 Agent(SWE-bench 70-75%),不连接任何消息平台,不自我进化,仅支持 Anthropic 模型。Hermes 是跨平台消息 Agent + 自我进化系统,编码能力取决于后端模型(40-72%)。二者可以组合——Hermes 通过 MCP 调用 Claude Code 处理编码任务。详见 Claude Code + Hermes MCP 消息桥接

OpenClaw 的安全问题严重吗?

客观数据:138+ CVE(历史累计),两个 CVSS 9.9,Shodan 上 135,000+ 暴露实例。如果你只在本地使用不暴露公网,风险可控。如果需要面向互联网部署或处理敏感数据,建议认真评估。IronClaw(OpenClaw 的零信任重写版)是一个替代方案,但尚不成熟。

AI Agent 选型应该看 GitHub Stars 吗?

Stars 反映关注度,不反映质量。OpenClaw 353K Stars 最高但安全问题也最多。Hermes 189K 增速最快但存在水军质疑。建议综合看:Stars 趋势(增速 > 存量)+ CVE 记录 + 社区活跃度 + 是否匹配你的场景。

月度成本到底多少?

取决于模型选择和使用频率。最省方案:Hermes + GLM/DeepSeek 免费额度 = 0-20 元/月。中等方案:Claude Code Pro = $20/月。重度方案:Claude Code Max Plus = $200/月或自主 Agent + Opus 可达 $100+/天。关键变量是对话长度——自主 Agent 每条消息发送完整历史,成本指数增长。

Hermes 的学习回路会不会导致行为不可预测?

确实会。Hermes 六个月后的行为和第一天不同。这是设计意图——「复利化」。但对需要确定性输出的场景(如金融交易触发),建议使用 OpenClaw 的 Cron 系统或 Claude Code 的可预测行为。Hermes 可以通过 SOUL.md 红线限制自动创建 Skill 的范围来缓解。

能不能同时用多个 Agent?

可以,20% 的经验用户就是这么做的。关键是明确分工:编排层(OpenClaw)+ 执行层(Hermes)+ 编码层(Claude Code)。避免让多个 Agent 监听同一个消息源——否则会出现双重响应冲突。

从 OpenClaw 迁移到 Hermes 难吗?

Hermes 内置 hermes claw migrate 命令,单向迁移对话历史、工作区配置、Skill、记忆文件。社区反馈「并行跑了一天,Hermes 做得好得多」。主要适应成本不是技术迁移,而是从「配置驱动」思维转向「让 Agent 自己学习」的思维。


总结

8 大 Agent 代表 8 种设计哲学,没有通用最优解。你的场景决定选择:

  • 需要消息网关 + 自我进化 → Hermes Agent 完全指南
  • 需要编码天花板 → Claude Code
  • 需要开源模型自由 → OpenCode / Aider
  • 需要企业级 SWE → OpenHands
  • 需要 MCP 生态 → Goose
  • 需要沙箱安全 → Codex CLI
  • 需要最广平台覆盖 + 多 Agent 编排 → OpenClaw

30% 用户选择双修不是因为「选不出来」,而是因为消息网关、自我进化、编码天花板是三个正交维度——一个工具不可能同时做到最好。明确分工,各取所长。

相关阅读Hermes Kanban 多 Agent 编排 | 我替翔宇测了 Hermes Agent | 多 Agent 协作完全指南