2026 年 8 大 AI Agent 横评：从 OpenClaw 到 Hermes，谁最适合你？

三个哲学，八种选择，一张表说清楚。

Claude Code 说：「让我成为你代码库不可或缺的存在」——深度专注。OpenClaw 说：「成为你数字生活的自动化层」——网关优先。Hermes 说：「与你一同成长，用得越多越强」——自我进化。

下面这张表是结论。正文是证据。

首屏结论：你的场景选哪个

8 大 AI Agent 选型导航面板：八个产品卡片呈扇形排列，按核心需求指向最佳选择

你的核心需求	首选	备选	一句话理由
跨平台消息自动化（Telegram / Discord / 微信 / Slack 全覆盖）	Hermes	OpenClaw	两者有消息网关；Hermes 自我进化 + 安全记录更优
Agent 随使用变强（长期复利）	Hermes	无替代	唯一具备完整学习回路的 Agent
纯编码天花板（SWE-bench 最高分）	Claude Code	OpenHands	Claude Code SWE-bench 70-75%，编码绝对领先
开源 + 模型自由的编码（无供应商锁定）	OpenCode	Aider	OpenCode MIT + 75+ provider + LSP 诊断回路
沙箱安全最高的编码（默认网络隔离）	Codex CLI	OpenHands	Codex CLI 默认禁网 + 三档自治
MCP 生态驱动（连接 1700+ 工具）	Goose	Hermes	Goose 是 MCP 标准的试验场
Git 原生配对编程（最干净的 commit 历史）	Aider	OpenCode	每改一行自动原子 commit + 架构师模式
企业级自主软件工程（修漏洞 / 迁移 / 审 PR）	OpenHands	—	唯一提供 Cloud + SDK + Web UI + K8s 部署的全自主 SWE Agent
预算极低（月均 5-20 元）	Hermes	Aider / OpenCode	软件免费 + GLM / DeepSeek 免费额度覆盖日常
多 Agent 编排 + 确定性调度	OpenClaw	Hermes	OpenClaw 的 Cron 是确定性的，不由大模型驱动

不是「谁更好」，是「何时选谁」。30% 的经验用户甚至不做二选一——OpenClaw 做编排，Hermes 做执行，Claude Code 做编码。三者正交。

8 大 Agent 逐个介绍

1. OpenClaw（353K Stars）——网关优先型

OpenClaw 是目前 GitHub Stars 最高的开源 Agent 项目。它的核心命题是「你的 AI 应该住在你住的地方——所有消息平台、所有自动化场景」。

基础档案：TypeScript / Node.js 编写，MIT 协议，社区基金会治理，137+ 个正式发布版本。25+ 消息渠道原生内置——Telegram、Discord、Slack、WhatsApp、iMessage、Signal 等，Gateway 是「会话、路由和频道连接的单一真值源」。

核心优势：ClawHub 社区市场 44,000+ 第三方 Skill（Skill 文件格式），多 Agent 架构（每个 Agent 独立频道、独立 Bot 身份、独立人设），Cron 定时系统是确定性调度（非大模型驱动），可信赖的子 Agent 定时触发。

值得注意的风险：历史累计 138+ CVE，其中两个 CVSS 9.9（WebSocket 注入 + 权限提升至 Admin + RCE）。Shodan 上有 135,000+ 暴露实例使用默认配置直接面向公网。ClawHub 341+ 恶意 Skill 已被标记。社区最高赞投诉（305 赞）是「每次更新带来的 bug 比修复的还多」。

适合谁：需要从 25+ 平台访问 AI 的团队；需要多 Agent 编排和确定性调度的自动化场景；看重最大 Skill 生态系统的用户。

不适合谁：对安全要求高的场景（138+ CVE 是客观事实）；运维能力有限的个人（社区共识是「自建运维才是真正的门槛」）；需要 Agent 随时间变强的用户（Skill 是静态的，永远不自动改进）。

2. Hermes Agent（189K Stars）——自我进化型

Hermes Agent GitHub 仓库首页截图：190K Stars、1,397 位贡献者、Apache-2.0 许可证

Hermes 在 2026 年 5 月 GitHub Stars 超越 OpenClaw，成为增速最快的开源 Agent 框架。核心命题是「Agent 应该复利化——你用得越多，它越懂你」。

基础档案：Python 编写，Apache-2.0 协议，Nous Research 开发，最新版本 v0.16.0（2026-06-05）。15+ 消息平台原生内置（包括微信 iLink Bot 官方协议），一个 Gateway 进程同时连接所有平台。

核心优势：完整学习回路（Self-Improving）——完成复杂任务后自动创建 Skill，遇错自动存解决路径，用户纠正自动存新做法。Honcho 辩证用户建模 + FTS5 全文检索会话搜索 + 自主记忆周期性自检。六个月的 Hermes 实例与新装实例表现截然不同。300+ 模型支持，hermes model 一键切换。6 种终端后端（local / Docker / SSH / Daytona / Singularity / Modal）。检查点回滚——修改文件前自动快照，出错可 /rollback 恢复。MCP 反向服务——hermes mcp serve 可被 Claude Code / Codex CLI 调用。

安全记录：截至 2026-04-10 零 Agent 级 CVE。v0.8.0 曾有一个 gateway 相关低危 CVE（CVE-2026-7396），非 Agent 逻辑层。

社区批评（公平呈现）：自我评估过度乐观——Agent 几乎总觉得自己做得好，需要外部验证机制（107 赞批评帖）。自动覆盖手动编辑是部分用户的 dealbreaker。曾有推广账号水军疑虑。

适合谁：需要 Agent 随时间变强的长期使用者；跨多平台消息交互场景；模型成本敏感的个人开发者（GLM / DeepSeek 免费额度可覆盖日常）；数据完全自控需求（全部数据在本机 ~/.hermes/）。

不适合谁：需要绝对可预测行为的场景（自我进化意味着行为会变化）；只在终端写代码不需要消息网关的纯编码用户（杀鸡用牛刀）。

3. OpenCode（172K Stars）——开源版 Claude Code

OpenCode 是 2026 年上半年增长最快的编码 Agent，定位「开源 + 模型无关的终端编码 Agent」。

基础档案：Go 编写（TUI 核心）+ JavaScript/Bun（HTTP 服务端），MIT 协议，Anomaly 团队主导。安装一行命令 curl -fsSL https://opencode.ai/install | bash。

核心优势：75+ 模型供应商支持（通过 Models.dev 注册表），一行配置切换，零供应商锁定。LSP 诊断回路——启动语言服务器，每次编辑后将编译器诊断反馈给模型自修正（2026 年编码 Agent 中唯一实现此能力）。客户端-服务器分离架构——Go TUI + Bun/Hono HTTP 服务器通过 HTTP 通信，可跨机器部署。Git 快照回滚——/undo 回退、/redo 重做。完全离线能力——搭配 Ollama 本地模型无需任何外部 API 调用。

性能数据：Builder.io 同模型对照测试（Claude Sonnet 4.5），Claude Code 9 分 9 秒完成 vs OpenCode 16 分 20 秒完成（慢 78%），但 OpenCode 写了 94 个测试 vs Claude Code 73 个——产出更彻底。

适合谁：看重模型自由和开源的编码用户；涉密/合规场景需要完全离线运行；喜欢 TUI 体验的终端党。

不适合谁：需要消息网关或自我进化；对编码速度而非覆盖度有极致要求；需要 IDE 深度集成（虽有 VS Code 扩展但不如 Claude Code 原生）。

4. Claude Code（131K Stars）——编码天花板型

Claude Code 是 Anthropic 的官方编码 Agent，只做一件事——代理式软件工程——做到任何其他工具无法企及的水平。

基础档案：TypeScript 编写，专有协议（源码可读但非 MIT/Apache），与 Anthropic 生态深度绑定。安装 2 分钟，三者中最快入门体验。

核心优势：SWE-bench Verified 70-75%（Opus 4.6 + 完整 Agent 脚手架），HumanEval 92%——纯软件工程任务绝对领先。VS Code / JetBrains 深度集成，不是「能在 IDE 里跑」而是「和 IDE 是同一个体验」。CLAUDE.md 项目记忆通过文件管理上下文。行为完全可预测——每次一样，不会自我修改。

约束：仅支持 Anthropic 三档模型（Opus $5/$25 MTok / Sonnet $3/$15 MTok / Haiku $1/$5 MTok），零模型灵活性——Anthropic API 宕机时无备用方案。无消息网关。不自动生成 Skill。无检查点回滚。每次会话从零开始，无跨会话持久记忆。月费 $20-200。

适合谁：需要编码天花板的职业开发者；信任 Anthropic 生态愿意为最强模型付费的团队；需要零配置即用的场景。

不适合谁：预算敏感；需要消息网关或自动化；需要模型灵活切换。

5. Codex CLI（90K Stars）——沙箱安全型

Codex CLI 是 OpenAI 的官方终端编码 Agent，核心架构区分是默认沙箱隔离——禁用网络访问、文件操作限定在当前目录树内。

基础档案：TypeScript / Node.js 编写，Apache 2.0 协议，OpenAI 开发。安装 npm install -g @openai/codex，运行要求 Node.js 22+。

核心优势：三档自治模式——Suggest（全审批）→ Auto-Edit（文件自动改、命令需审批）→ Full-Auto（完全自主，沙箱内运行）。codex.md 项目约定文件 + 全局配置形成分层体系。2026 年新增 Windows 原生沙箱 + PowerShell 支持。v0.116.0 加入企业功能——自定义策略、多 Agent 协调、仓库理解。

约束：仅支持 OpenAI 模型（o4-mini / o3 / gpt-4.1），零模型灵活性。无消息网关。无自我进化。

适合谁：对安全默认值要求极高的企业环境；OpenAI 生态深度用户；需要严格审批流程的合规场景。

不适合谁：需要模型自由度；需要消息网关；需要自我进化。

6. OpenHands（76K Stars）——企业自主 SWE 型

OpenHands（原 OpenDevin）是企业级全自主软件工程 Agent——不是代码补全工具，是完成整个工程任务的 AI 软件工程师。

基础档案：Python 编写，MIT 协议，All Hands AI 开发（$18.8M Series A 融资）。三入口：Cloud（Web UI）+ CLI + SDK。

核心优势：完成整个工程任务——跨整个代码库规划、编写、应用变更。「当日自主修复 87% 的 Bug 工单」（官网数据）。Docker 或 Kubernetes 隔离环境部署，代码永不离开控制范围。Python SDK 嵌入应用和工作流。预设工作流覆盖修复漏洞→开 PR、审查 PR、代码迁移（COBOL→Java）、事故分级排障。企业客户包括 TikTok、VMware、Roche、Amazon、Netflix 等。

适合谁：大型企业代码库维护；需要 AI 自主完成从 issue 到 PR 全流程；需要 K8s 私有化部署的合规环境。

不适合谁：个人开发者日常配对编程（过度设计）；需要消息网关；需要自我进化。

7. Goose（48K Stars）——MCP 原生驱动型

Goose 是 MCP（Model Context Protocol，模型上下文协议）标准的试验场，定位通用 AI Agent 而非仅编码。

基础档案：Rust 编写（核心）+ TypeScript（界面），Apache 2.0 协议。原 Block（前 Square）开发，2026 年 4 月捐赠给 Linux Foundation 旗下 AAIF（Agentic AI Foundation，代理式 AI 基金会）。三入口：桌面应用 + CLI + API。

核心优势：MCP 原生优先设计，连接 1700+ MCP 扩展（Jira、GitHub、Notion、PostgreSQL、文件系统、Shell 等）。通用 Agent——研究、写作、自动化、数据分析全覆盖。15+ 模型供应商支持。Linux Foundation 开放治理，社区贡献不受单一公司控制。2026 路线图聚焦本地推理和主权工作流（Sovereign Workflow，数据不离开本机）。

适合谁：已有大量 MCP 工具需要统一编排的团队；需要通用桌面助手而非仅编码 Agent；看重 Linux Foundation 开放治理的用户。

不适合谁：需要消息网关或自我进化；纯编码场景（编码能力不如 Claude Code / OpenCode / Aider 专注）。

8. Aider（46K Stars）——Git 原生配对型

Aider 是最干净的版本历史制造者——每次修改自动生成原子 Git commit，带大模型生成的描述性 commit message。

基础档案：Python 编写，Apache 2.0 协议，Paul Gauthier 创建。安装 curl -LsSf https://aider.chat/install.sh | sh。每周处理 150 亿 token（官网数据）。

核心优势：Git 原生——git log --oneline 直接读如 changelog。架构师/编辑器双模式（Architect Mode）——强推理模型规划方案，快速模型精准执行 diff，两轮设计减少多文件重构错误。70+ 模型支持，会话内 /model 一键切换。Watch 模式——后台运行 aider --watch-files，在任意文件写 AI! 注释触发自动编辑。39 个斜杠命令覆盖网页抓取、语音转写、截图理解、Shell 执行、测试自动修复。Prompt 缓存支持长会话节省 30-70% 成本。编辑器无关——VS Code、JetBrains、Vim、Emacs、SSH 终端都行。

Polyglot 基准数据：GPT-5（high）88.0% 领先，DeepSeek V3.2 Reasoner 74.2%（每次基准运行约 $1.30，性价比之王）。

适合谁：重视 Git commit 历史整洁的开发者；需要架构师模式处理多文件重构；偏好编辑器无关的终端工具。

不适合谁：需要消息网关或自我进化；需要 Web UI；需要 MCP 生态集成（Aider 的 MCP 支持尚在 RFC 阶段）。

10 维度对比矩阵

维度	Hermes	OpenClaw	Claude Code	OpenCode	Codex CLI	OpenHands	Goose	Aider
GitHub Stars	189K	353K	131K	172K	90K	76K	48K	46K
消息网关	15+ 平台	25+ 平台	无	无	无	无	无	无
自我进化	完整学习回路	静态 Skill	无	无	无	无	无	无
模型自由度	300+	多 provider	仅 Anthropic	75+	仅 OpenAI	模型无关	15+	70+
安全记录	1 低危 CVE	138+ CVE（2x CVSS 9.9）	闭源不公开	无公开 CVE	沙箱默认隔离	Docker/K8s 沙箱	标准	标准
月度成本	0-20 元 + LLM	0 + LLM	$20-200	0 + LLM	0 + OpenAI API	0 + LLM / Cloud	0 + LLM	0 + LLM
IDE 集成	终端 + MCP 反向	终端	VS Code / JetBrains 深度	TUI + 桌面 + VS Code	终端 + VS Code	Web UI + CLI + SDK	桌面 + CLI + API	终端（编辑器无关）
MCP 支持	MCP Server（反向暴露）	部分	MCP Client	无原生	无	无	MCP 原生 1700+	RFC 阶段
语音能力	转写 + TTS + 语音频道	无	无	无	无	无	无	/voice Whisper
部署方式	6 种	本地/Docker	本地	本地	本地/WSL2	Docker/K8s/Cloud	本地	本地

Hermes 独有能力深度分析

在 8 大 Agent 中，以下能力仅 Hermes 具备：

完整学习回路

其他 7 个 Agent 全部是「你配置了什么就是什么」——Hermes 是唯一一个会随使用时间变强的。机制包括：

完成复杂任务（5+ 工具调用）后自动创建 Skill
遇到错误自动存储解决路径（下次不会犯同样的错）
用户纠正行为自动存储新做法
Honcho 辩证用户建模——不是简单记录偏好，而是辩证式理解你的意图
FTS5 全文检索会话搜索——所有历史对话可按关键词检索

实测效果：一个运行六个月的 Hermes 实例和一个全新安装的实例在执行相同任务时，成功率和响应质量存在可量化差异。这在其他 Agent 中不可能发生。

跨平台会话连续性

Hermes 不仅有消息网关（这一点 OpenClaw 也有），还有跨平台会话连续性——在 Telegram 开始的对话可以在 Discord 无缝继续，上下文完整保留。OpenClaw 的 25+ 平台是割裂的独立频道，不共享对话状态。

MCP 反向服务

hermes mcp serve 让 Hermes 不仅是 Agent，还是其他 Agent 的工具提供者。Claude Code 和 Codex CLI 可以通过 MCP 协议调用 Hermes 暴露的 10 个工具（conversations_list、messages_send 等）。典型场景：Claude Code 跑完长任务后通过 Hermes 推送消息到 Discord 通知用户。

检查点回滚

修改文件前自动快照整个工作目录，出错可 /rollback 恢复到任意检查点。OpenCode 有 Git 快照但限于仓库层面，Hermes 的检查点是工作目录级别——即使非 Git 管理的文件也被保护。

安全维度深度对比

AI Agent 安全对比示意图：完整盾牌与破裂盾牌对照展示不同框架的 CVE 安全记录

安全不是可选项。以下是硬数据：

安全维度	Hermes	OpenClaw	Claude Code	Codex CLI
历史 CVE 总数	1（低危，gateway 层）	138+	闭源不公开	无公开数据
CVSS 9.0+ 漏洞	0	2（WebSocket 注入 + RCE）	N/A	0
恶意 Skill 风险	低（155 内置为主）	高（341+ 恶意已标记）	N/A	N/A
公网暴露实例	无公开数据	135,000+（Shodan）	N/A	N/A
沙箱隔离	Docker / Singularity / Modal	Docker（手动配置）	内置沙箱	默认沙箱（禁网）
命令审批	smart 模式（AI 判断高风险暂停）	手动或关闭	内置审批	三档自治

OpenClaw 的 CVE-2026-25253（WebSocket 劫持）和 CVE-2026-32922（权限提升至 Admin + RCE）是 CVSS 9.9 的严重漏洞。如果你的场景涉及敏感数据或面向公网部署，这是选型的硬约束。

真实成本核算

套餐价格不等于实际成本。以下是 30 任务/天场景的月度估算：

方案	月度成本	说明
Hermes + GLM-5.1 免费额度	0-5 元	99% 时间免费额度覆盖
Hermes + DeepSeek V4 Pro（兜底）	5-20 元	仅额度耗尽时启用
Hermes + Claude Sonnet 4.6	~160 元/月	同模型同价
OpenClaw + Claude Haiku	~25 元/月	功能对等
Claude Code Pro 订阅	$20/月（~145 元）	有日用上限
Claude Code Max	$100/月（~725 元）	高频使用
Claude Code Max Plus	$200/月（~1450 元）	接近无限

社区成本警告：自主 Agent 的 Token 成本远超预期。根本原因是每条消息都发送完整对话历史到 API，成本在会话内指数复利。社区有 $131/天的极端案例（Claude Opus 重度使用）。

省钱策略：Hermes 的模型自由度是成本控制的核心杠杆。日常任务路由到 GLM / DeepSeek 可省 90% 以上，只在复杂编码任务时切到 Claude / GPT-5。

社区真实选择数据

Kilo.ai 分析了 r/openclaw 的 25 个高互动帖子、1300+ 条评论（按赞数排序），得出四方分裂格局：

阵营	占比	特征
坚守 OpenClaw	~35%	认可无可匹敌的集成广度和最大 Skill 生态
迁移到 Hermes	~30%	赞扬更简单的安装和更好的记忆默认值
双修（两者并用）	~20%	OpenClaw 做编排，Hermes 做执行
对 Hermes 持怀疑	~15%	怀疑有组织推广

迁移信号：从 OpenClaw 迁移到 Hermes 的最大推动力是记忆不可靠（42 赞帖）、更新破坏功能（305 赞帖）、安装调试时间超过实际使用时间。Hermes 内置 hermes claw migrate 命令——单向迁移 OpenClaw 的对话历史、工作区配置、Skill、记忆文件。OpenClaw 不提供反向迁移工具。

生产实践：翔宇的选型决策

以下不是推荐，是一个真实用户在 Mac mini 上同时跑 OpenClaw 和 Hermes 后做出的决策过程。

Hermes Agent 官方网站首页：The Agent That Grows With You 标语，展示安装与功能概览

为什么最终选了 Hermes

决策逻辑（按权重排序）：

指针架构需求：知识库由 Claude Code 每天持续更新。需要 Agent 配置不硬编码内容，而是每次对话动态读取文件。SOUL / MEMORY / USER / channel_prompts 只放路径指针，内容通过 read_file 现场读——Claude Code 改了任何文件，Hermes 下次对话自动感知。这个架构 OpenClaw 不原生支持。

品牌分区频道需求：两个品牌的内容风格完全不同，需要进入 Discord 频道就自动确定品牌上下文。Hermes 的 channel_prompts 按频道 ID 指向不同目录——12 个频道覆盖两个品牌运营区和共用区。

辅助模型独立配置：生产中遇到过「压缩风暴」——主模型 429 限流 → 压缩也 429 → Agent 丢失整个对话上下文。Hermes 支持 auxiliary.compression 显式配置独立 provider。

MCP 反向服务：Claude Code 跑完长任务后需要通知用户。hermes mcp serve 暴露工具，Claude Code 通过 SSH stdio 调用 Hermes 推送消息到 Discord。

成本：GLM-5.1 共享额度 + DeepSeek V4 Pro 按量兜底 = 月均 5-20 元。

双 Bot 冲突踩坑（一手经验）

问题：Mac mini 上 OpenClaw 网关和 Hermes 网关同时连接同一 Discord 服务器，每条消息两个 Bot 都抢着回复。OpenClaw 模型挂了还会在频道里贴出错误堆栈。

根本原因：两个 Bot 共享同一消息源，且都设置 require_mention: false（免提及即响应），导致双重响应。

解法：停掉 OpenClaw 网关，plist 改名 .disabled 防止 launchd 自动重启。

教训：同一台机器跑两个 Agent 网关时，必须确保它们不监听同一个消息源，或至少一个设置 require_mention: true。双 Bot 冲突不是理论问题——是生产中亲历的事故。

真实优劣势

生产中验证的优势：

知识库集成零维护——Claude Code 每天更新知识库，Hermes 零配置感知（每次现场读文件）
模型切换 30 秒——改配置两行 + hermes gateway restart
单进程运维—— launchd 一行管理
工具延迟加载——72 个工具 Schema 从 19,210 token 降到 2,200 token（减少 89%）

生产中验证的劣势：

首条消息慢——冷启动自动探测端点（3 次 HTTPS），首条约 20 秒
plist 被覆盖——hermes gateway install 每次重新生成 plist，覆盖手工修改
Skill 自创建需要红线——不设边界会建「野生 Skill」，与既有工作流产生平行路径
Discord 表格不渲染——需要自己开发 PNG 渲染器 + 打适配器补丁

「何时选哪个」决策树

你需要消息网关吗？
├── 需要 →
│   ├── 需要 Agent 随时间变强 → Hermes
│   ├── 需要 25+ 平台最广覆盖 + 多 Agent 编排 → OpenClaw
│   └── 两者都要 → 双修（OpenClaw 编排 + Hermes 执行）
│
└── 不需要（纯编码/自动化）→
    ├── 编码天花板（不在乎锁定） → Claude Code
    ├── 开源 + 模型自由（编码） → OpenCode
    ├── 沙箱安全最高 → Codex CLI
    ├── MCP 生态驱动（通用自动化） → Goose
    ├── Git 原生配对 → Aider
    └── 企业级自主 SWE → OpenHands

双修方案：不是选不出来，是定位正交

Hermes Desktop 桌面应用下载页面：全平台支持的原生桌面 Agent 客户端

20% 的经验用户已经不再把这当「二选一」的问题。推荐架构：

OpenClaw（编排层）
├── 规划、分解、排序
├── 多频道路由
├── Cron 确定性定时触发
└── 通过 ACP 协议 → Hermes

Hermes（执行层）
├── 快速、可重复的任务循环
├── 自动创建/改进 Skill
├── 检查点 + 回滚
└── 长期记忆复利

Claude Code（编码层，按需调用）
├── 复杂代码重构
├── 多文件 Bug 修复
└── 通过 MCP 被 Hermes 调用

典型流程：Hermes 收到 Telegram 消息 → 判断是编码任务 → 委派给 Claude Code 执行 → 结果通过 OpenClaw 消息层回传 → Hermes 学习回路记录本次经验。

常见问题

Hermes 和 OpenClaw 哪个更好？

不存在绝对更好。OpenClaw 的优势是 25+ 平台最广覆盖 + ClawHub 44,000+ Skill 生态 + 确定性 Cron 调度。Hermes 的优势是自我进化学习回路 + 安全记录（1 CVE vs 138+）+ 模型自由度（300+ vs 多 provider）。你的场景决定选择。

Hermes 和 Claude Code 有什么区别？

定位完全不同。Claude Code 是纯编码 Agent（SWE-bench 70-75%），不连接任何消息平台，不自我进化，仅支持 Anthropic 模型。Hermes 是跨平台消息 Agent + 自我进化系统，编码能力取决于后端模型（40-72%）。二者可以组合——Hermes 通过 MCP 调用 Claude Code 处理编码任务。详见 Claude Code + Hermes MCP 消息桥接。

OpenClaw 的安全问题严重吗？

客观数据：138+ CVE（历史累计），两个 CVSS 9.9，Shodan 上 135,000+ 暴露实例。如果你只在本地使用不暴露公网，风险可控。如果需要面向互联网部署或处理敏感数据，建议认真评估。IronClaw（OpenClaw 的零信任重写版）是一个替代方案，但尚不成熟。

AI Agent 选型应该看 GitHub Stars 吗？

Stars 反映关注度，不反映质量。OpenClaw 353K Stars 最高但安全问题也最多。Hermes 189K 增速最快但存在水军质疑。建议综合看：Stars 趋势（增速 > 存量）+ CVE 记录 + 社区活跃度 + 是否匹配你的场景。

月度成本到底多少？

取决于模型选择和使用频率。最省方案：Hermes + GLM/DeepSeek 免费额度 = 0-20 元/月。中等方案：Claude Code Pro = $20/月。重度方案：Claude Code Max Plus = $200/月或自主 Agent + Opus 可达 $100+/天。关键变量是对话长度——自主 Agent 每条消息发送完整历史，成本指数增长。

Hermes 的学习回路会不会导致行为不可预测？

确实会。Hermes 六个月后的行为和第一天不同。这是设计意图——「复利化」。但对需要确定性输出的场景（如金融交易触发），建议使用 OpenClaw 的 Cron 系统或 Claude Code 的可预测行为。Hermes 可以通过 SOUL.md 红线限制自动创建 Skill 的范围来缓解。

能不能同时用多个 Agent？

可以，20% 的经验用户就是这么做的。关键是明确分工：编排层（OpenClaw）+ 执行层（Hermes）+ 编码层（Claude Code）。避免让多个 Agent 监听同一个消息源——否则会出现双重响应冲突。

从 OpenClaw 迁移到 Hermes 难吗？

Hermes 内置 hermes claw migrate 命令，单向迁移对话历史、工作区配置、Skill、记忆文件。社区反馈「并行跑了一天，Hermes 做得好得多」。主要适应成本不是技术迁移，而是从「配置驱动」思维转向「让 Agent 自己学习」的思维。

总结

8 大 Agent 代表 8 种设计哲学，没有通用最优解。你的场景决定选择：

需要消息网关 + 自我进化 → Hermes Agent 完全指南
需要编码天花板 → Claude Code
需要开源模型自由 → OpenCode / Aider
需要企业级 SWE → OpenHands
需要 MCP 生态 → Goose
需要沙箱安全 → Codex CLI
需要最广平台覆盖 + 多 Agent 编排 → OpenClaw

30% 用户选择双修不是因为「选不出来」，而是因为消息网关、自我进化、编码天花板是三个正交维度——一个工具不可能同时做到最好。明确分工，各取所长。

推荐订阅源

翔宇工作流