惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
Cisco Talos Blog
Cisco Talos Blog
T
Threat Research - Cisco Blogs
P
Privacy International News Feed
S
Schneier on Security
P
Privacy & Cybersecurity Law Blog
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
云风的 BLOG
云风的 BLOG
P
Proofpoint News Feed
Scott Helme
Scott Helme
人人都是产品经理
人人都是产品经理
G
GRAHAM CLULEY
O
OpenAI News
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
PCI Perspectives
PCI Perspectives
GbyAI
GbyAI
宝玉的分享
宝玉的分享
Y
Y Combinator Blog
T
Troy Hunt's Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
C
CXSECURITY Database RSS Feed - CXSecurity.com
腾讯CDC
C
Check Point Blog
Spread Privacy
Spread Privacy
L
LINUX DO - 最新话题
Recent Announcements
Recent Announcements
大猫的无限游戏
大猫的无限游戏
P
Palo Alto Networks Blog
Hacker News: Ask HN
Hacker News: Ask HN
M
MIT News - Artificial intelligence
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
The Hacker News
The Hacker News
H
Hacker News: Front Page
Microsoft Azure Blog
Microsoft Azure Blog
I
InfoQ
T
Tor Project blog
Martin Fowler
Martin Fowler
博客园 - 叶小钗
罗磊的独立博客
C
Cyber Attacks, Cyber Crime and Cyber Security
H
Heimdal Security Blog
V
Vulnerabilities – Threatpost
Simon Willison's Weblog
Simon Willison's Weblog
Latest news
Latest news
WordPress大学
WordPress大学
G
Google Developers Blog
N
Netflix TechBlog - Medium
S
Security Affairs
S
Secure Thoughts
Know Your Adversary
Know Your Adversary

博客园_首页

Linux实操--组管理、权限管理和定时任务 Java + EasyExcel 实现单个接口导出多个Excel Mem0 源码解析系列(二):提示词工程的深度剖析 Openclaw TaskFlow究竟是什么?和普通Skill技能有什么区别 博文阅读密码验证 - 博客园 嘉立创开源:应该是全网MicroPython教程最多的开发板 Hermes Agent 集成实践:从协议到生产 2026年AI编程工具横评:Cursor、Codex、Claude Code、Zed、Windsurf Java程序员必看的RAG入门教程 2026 AI效率神器:Superpowers + Claude Code 保姆级教程 本地大模型部署全攻略:从 0 到 1 玩转 Ollama 【从0到1构建一个ClaudeAgent】内存管理-上下文压缩 .NET 高级开发 | 设计、实现一个事件总线框架 电子小白入门之NE555 3. WorkBuddy:隐藏玩法,一键召唤专家,让 AI 以"专家身份"给你干活 和AI一起搞事情#3:Claude Teammate 游戏开发翻车实录 【OpenClaw】通过 Nanobot 源码学习架构---(7)Memory C# .NET 周刊|2026年3月3期 我在 Debian 11 上把 K8s 单机搭起来了,过程没你想的那么顺(/opt 目录版) 深度学习进阶(七)Data-efficient Image Transformer CLI+Skill搭建浏览器AI自动化框架,告别一切重复枯燥任务 告别Token账单无底洞:OpenClaw本地部署,重塑企业数据主权的唯一解 FastAPI+Vue:文件分片上传+秒传+断点续传,这坑我帮你踩平了! SBTI 爆火后,我做了个程序员版的 CBTI。。已开源 + 附开发过程 多模态检索开始进入工程期:用 Sentence Transformers 搭建可落地的 Multimodal RAG 100多行代码实现一个最简单的Agent(用ReAct) Claude Code 通关手册(八):推荐 5 个 Hooks,代码质量提升 3 倍 老板:“有人截图了!”。安全部门:“收到,马上查暗水印!” - why技术 技术之外,皆是人间 C#/.NET/.NET Core技术前沿周刊 | 第 69 期(2026年4.01-4.12) Snack JSONPath 项目架构分析 Claude Code Buddy 小析:一个非核心功能,如何体现产品的细节完成度 AI新时代下的图床管理方案-Cloudflare图床+MCP+Skills方案指南 化繁为简:顺丰速运App如何通过 HarmonyOS SDK实现专业级空间测量 从零实现富文本编辑器#13-React非编辑节点的内容渲染 AI开发-python-langchain框架(3-23-OpenAI Functions风格Tool Calling智能助手) .NET + AI 进阶实战:基于类的技能开发 - 打造可治理的 Agent 能力模块 【从0到1构建一个ClaudeAgent】规划与协调-技能 上周热点回顾(4.6-4.12) 电子小白的工具三件套:面包板、杜邦线、万能板 单表五亿数据的查询优化 | Mysql、StarRocks 2. WorkBuddy:从“我是谁”到“帮我干活” C# 如何减少代码运行时间:7 个实战技巧 基于HelixToolkit.SharpDX 渲染3D模型 - 笺上知微 从零开始的双臂具身VLA起源及现阶段发展综述 - SkyXZ 记对 xonsh shell 的使用, 脚本编写, 迁移及调优 - pluvium27 受够了Vibe Coding的失控?换个起点,让AI事半功倍 从开始配置漏洞环境到漏洞复现流程 - 難しい 关于10年工作经验的程序员对OpenClaw的实战经验分享以及看法 - 虚无境 Any metadata 的内存布局 C# .NET 周刊|2026年3月2期 - InCerry 我帮你测过了,测试圈排名第二的 Skill 依然很牛逼 Skill Discovery | 无监督技能发现的经典工作总结 - MoonOut PbootCMS 网站内容数量多导致访问慢?这些实用优化方案帮你提速! - 家兴网络技术工作室 上下文工程是什么?过时了么?一文讲明白! - 一枫说码 网站漏洞怎么发现并修复?一篇实用指南(附完整流程) - 家兴网络技术工作室 开了 TUN 模式还是直连?90% 的人都踩过这个坑 Github日报|2026年04月12日 - AI一族 AScript扩展多种脚本语言 - rockey627 AI 学习笔记:Agent 的记忆机制 你能被装进一个文件里吗?——7 万人把同事"蒸馏"成了 AI - 我没有三颗心脏 Claude Code 通关手册(七):给 AI 装上技能包——Skills 完全指南 - 暮色之狐 在浏览器中快速编辑代码:VSCode Web 集成实践 - Newbe36524 蒸馏自己 skill?基于 Deepseek 的蒸馏器,丐版蒸馏方式,简单便捷 - To_Carpe_Diem Spring AI Aliababa和AgentScope,哪个更好? - 苏三说技术 Etsy 把 1000 个 MySQL 分片迁进 Vitess:425TB 数据背后的真正问题不是性能,而是运维规模 MicroPython LVGL基础知识和概念:底层渲染与性能优化 - FreakStudio 数据库草图算法 Python 潮流周刊#146:CPython 引入 Rust 的进展 - 豌豆花下猫 最小生成树 - mofei1116 红日靶场七:从外网入口、容器逃逸到 AD 接管的完整利用链复盘 - YouDiscovered1t 分享四款开源且实用的 Kafka 管理工具 - 追逐时光者 vLLM 权重加载机制全解析:从挑战到理想架构 LCT 学习笔记 - ACehomoxue Avalonia UI 12.0.0 正式发布:架构演进和性能飞跃 - 张善友 当 AI Agent 把调用链拉长,延迟开始成为一门生意 conhost.exe 无法显示 U+2717 - 145a 太秀了,我把自己蒸馏成了 Skill!已开源 - 程序员鱼皮 ASP.NET Core 内存缓存实战:一篇搞懂该怎么配、怎么避坑 基于 Ghostty 带有分割标签页和为 Claude 编程设计的通知终端 - BugShare AI 焊死入口:教育的“操作系统级”重塑 - 郝hai 初级Java开发工程师使用sql脚本编写代码的过程是简单而且不糊涂 - CoderOilStation Claude Code通关手册(六):MCP协议完全指南 - 暮色之狐 边框灯光环绕动画特效实现指南 - Newbe36524 开源:子木蒸馏版的 SEO 审计工具 seo-audit-skill v1.0 我所理解的Python元模型 【从0到1构建一个ClaudeAgent】规划与协调-TodoWrite - 程序员Seven Claude 和 Codex 在审计 Skill 上性能差异探究 - ACai_sec AScript如何实现中文脚本引擎 - rockey627 【渗透测试】HTB Season10 Garfield 全过程wp - dynasty_chenzi Android 开发者为什么必须掌握 AI 能力?端侧视角下的技术变革 树状数组正确性证明 - AC-wyr 你的 AI 焦虑,可能比 AI 本身更危险——ATM 机没有消灭银行柜员,但恐慌消灭了你的判断力 - 我没有三颗心脏 一个拉胯的分库分表方案有多绝望?整个部门都在救火! - 冰河团队 动态规划入门必学之走方格问题 - Ofnoname PostgREST 与 PostgreSQL 角色权限配置全解析(生产级实践) - SheepDog1998 使用 UEFI 图形输出协议 GOP 在屏幕上显示图像的方法 - 阿源- Claude Code通关手册(五):组建你的AI专家团队,子代理系统 - 暮色之狐 一个程序员到架构师的催婚路之感悟(整整10年后的催婚相亲感悟) - MisterLip 用 Agent Skill 自动生成工作周报 - 赵康
Hermes Agent:从聊天助手到可持续进化的个人 AI 智能体
CN-尼克狐尼克 · 2026-04-30 · via 博客园_首页

Hermes Agent:从聊天助手到可持续进化的个人 AI 智能体

Hermes Agent 是 Nous Research 开源的自主 AI 智能体框架。它的核心价值不在于“多一个聊天入口”,而在于把大语言模型、工具调用、长期记忆、技能沉淀、消息网关和定时任务组合成一个可以长期运行的个人工作系统。

过去我们使用 AI,最常见的方式是打开一个聊天窗口:输入问题,等待回答。

这种交互方式已经足够高效,但它有一个明显边界:AI 往往停留在“回答”和“建议”层面。对于真实工作而言,仅有建议并不够。一个完整任务通常还需要读取文件、运行命令、修改代码、查看日志、操作浏览器、处理异常、保存结果,并在下一次任务中继续复用已有经验。

Hermes Agent 试图解决的正是这个问题。

它不是单纯的聊天机器人,而是一个可以部署在本地或服务器上的开源 AI Agent。它通过工具系统连接真实执行环境,通过记忆系统保存长期偏好,通过技能系统沉淀可复用流程,并通过消息网关和定时任务进入日常工作流。

换句话说,Hermes Agent 的目标不是让 AI “更会聊天”,而是让 AI 能够稳定参与真实任务。

1. Hermes Agent 是什么

Hermes Agent 是 Nous Research 开发的开源自主 AI 智能体框架,采用 MIT 许可证,支持 Linux、macOS 和 WSL2,自托管运行。

官网给它的定位是:

随你成长的 AI 智能体。

这句话可以拆成两个部分理解:

  1. 智能体:它不只生成文本,还可以调用终端、文件系统、浏览器、定时任务、消息平台等工具;

  2. 成长:它可以通过长期记忆和技能系统,把用户偏好、项目背景和操作流程保存下来,在后续任务中复用。

Hermes Agent 可以接入的能力包括:

  • 终端命令执行;

  • 文件读取、写入、搜索和修改;

  • 浏览器自动化控制;

  • 网页搜索与内容提取;

  • 图片识别与媒体处理;

  • cron 定时任务;

  • 微信、Telegram、Discord、Slack 等消息平台;

  • 长期记忆和用户画像;

  • 技能系统;

  • 子智能体并行任务。

因此,它更接近一个围绕大语言模型构建的“个人工作流层”,而不是传统意义上的聊天工具。

2. Chatbot 与 Agent 的区别

Chatbot 和 Agent 的差别,不在于交互入口是否都是对话,而在于系统是否具备执行能力和反馈闭环。

普通 Chatbot 的基本流程是:

用户输入 → 模型生成回答 → 对话结束

它擅长解释、总结、生成文本和提供建议。

Agent 的流程则更接近:

用户提出目标
  ↓
模型理解任务
  ↓
选择工具
  ↓
执行动作
  ↓
读取结果
  ↓
根据结果继续修正
  ↓
完成并验证

例如,当用户要求“设置一个周期性数据处理任务”时,普通聊天 AI 可能会给出 cron 配置示例;而 Hermes Agent 可以进一步检查脚本路径、创建执行文件、安装依赖、运行测试、创建定时任务,并复查任务是否真正生效。

这里的关键是:

Agent 不只是生成方案,而是能够把方案落实到真实环境中,并根据执行结果持续调整。

这也是 AI Agent 相比普通聊天工具更适合工程类、数据类和自动化任务的原因。

3. Hermes Agent 的核心架构

从架构上看,Hermes Agent 可以分为三层:模型层、Agent 主循环和工具层。

3.1 模型层

大语言模型负责理解用户意图、分析上下文、制定下一步动作。Hermes Agent 支持多种模型提供商,包括 OpenRouter、Nous Portal、OpenAI 兼容接口、本地 vLLM 等。

这意味着模型本身可以替换,而 Agent 的工具系统、记忆系统和技能系统仍然保持一致。

3.2 Agent 主循环

Agent 主循环是 Hermes Agent 的核心。

它负责在每一轮中判断:

  • 当前任务是否已经完成;

  • 是否需要调用工具;

  • 需要调用哪个工具;

  • 工具参数应该如何构造;

  • 工具返回结果后下一步如何处理。

因此,Hermes Agent 的执行过程不是一次性输出,而是一个持续的“观察—决策—行动—反馈”循环。

3.3 工具层

工具层负责把模型的决策转化为真实动作。

常见工具包括:

  • Terminal:运行 shell 命令、启动进程、执行测试;

  • File:读取、写入、搜索、修改文件;

  • Browser:打开网页、点击、输入、截图;

  • Web:搜索和提取网页内容;

  • Vision:分析图片;

  • Cron:创建和管理定时任务;

  • Messaging Gateway:连接消息平台;

  • Memory:保存长期记忆;

  • Skills:加载和维护可复用技能;

  • Delegation:创建子智能体并行处理任务。

这套结构让 Hermes Agent 不再依赖模型“凭空回答”,而是可以基于真实执行结果继续推理。

4. “进化”的真正含义

Hermes Agent 所说的“成长”或“进化”,并不是指每次使用后都会重新训练底层大模型参数。

更准确地说,它是一种工程化的进化:通过外部记忆、技能文档和执行反馈,让系统越来越贴合用户的工作方式。

这个过程可以概括为:

用户偏好 → 写入记忆
复杂流程 → 沉淀技能
执行错误 → 修正流程
周期任务 → 自动化运行
项目经验 → 后续复用

这种进化不依赖模型微调,而是依赖上下文、流程和工具能力的持续积累。

对于个人或团队来说,这种方式更轻量,也更可控。它不需要重新训练一个模型,却可以让 AI 在具体工作环境中越来越熟悉任务边界、输出偏好和执行流程。

5. 记忆系统:保存长期上下文

普通 AI 对话通常只保留当前会话上下文。一旦会话结束,很多偏好和项目背景就需要重新说明。

Hermes Agent 的持久记忆用于保存长期稳定的信息,例如:

用户偏好使用中文交流。
用户自己的周报通常使用 Markdown。
某个项目目录位于 /tmp/business_collect_linux。
某个浏览器登录态目录不能删除。
某个每日定时任务正常运行时不需要主动汇报。

这些信息会在未来会话中被加载,从而减少重复沟通。

记忆系统主要解决三个问题:

  1. 用户偏好复用:例如语言风格、文件格式、通知方式;

  2. 项目环境复用:例如路径、脚本、配置、登录态位置;

  3. 长期规则复用:例如哪些文件可清理、哪些操作需要谨慎。

有了记忆之后,Hermes Agent 不再是每次都从零开始,而是能够基于已有上下文继续工作。

6. 技能系统:沉淀可复用方法

记忆保存的是事实和偏好,技能保存的是方法和流程。

Hermes Agent 的技能通常以 SKILL.md 的形式存在。它可以记录某类任务的触发场景、执行步骤、常见坑点和验证方式。

例如,当 Agent 完成一次复杂的自动化迁移任务后,可以沉淀出类似技能:

  • 如何将本地脚本迁移到服务器环境;

  • 如何配置运行依赖和环境变量;

  • 如何处理无桌面服务器上的浏览器自动化;

  • 如何在遇到需要人工介入的页面时安全停止;

  • 如何创建周期性运行和结果输出任务;

  • 如何验证定时任务是否生效。

这类技能的价值在于:

AI 不只记住“做过什么”,还记住“下次应该怎么做”。

对于经常重复的任务,技能系统可以显著降低试错成本。第一次任务中的排查、修复和验证,会变成下一次任务的起点。

7. 工具执行闭环:让 AI 从建议走向交付

Agent 能否真正落地,关键不只是模型能力,而是是否能形成执行闭环。

一个典型闭环是:

读取文件 → 分析问题 → 修改代码 → 运行检查 → 读取错误 → 继续修复 → 验证通过

这个过程看起来简单,但它决定了 AI 能否处理真实工程问题。

真实环境中经常会出现:

  • 依赖缺失;

  • 路径不一致;

  • 权限不足;

  • 页面结构变化;

  • 接口返回异常;

  • 输出结果不符合预期。

如果 AI 只能生成文本,它很难确认自己的方案是否可执行。Hermes Agent 通过工具调用直接接触环境,并把执行结果反馈给模型,从而不断修正下一步动作。

这也是它适合处理脚本、数据、服务配置、自动化流程和文档生成任务的重要原因。

8. 定时任务:从一次性执行到长期运行

很多工作并不是一次性的,而是周期性的。

例如:

  • 每天采集数据;

  • 每周整理报表;

  • 每晚备份文件;

  • 定期检查网页变化;

  • 周期性生成项目总结。

Hermes Agent 内置 cron 调度能力,可以让这些任务长期自动运行。

传统 cron 只负责“到点执行脚本”。Hermes 的定时任务可以在此基础上加入 Agent 能力:

  • 执行脚本;

  • 读取日志;

  • 判断成功或失败;

  • 失败时总结原因;

  • 需要人工处理时发送消息;

  • 正常完成时保持静默。

这种机制特别适合数据采集、报表生成、监控提醒等长期任务。

例如,一个采集任务可以被配置为:

按固定周期自动运行。
正常完成不通知。
遇到登录失效或脚本失败时再提醒用户。

这比单纯执行脚本更接近真实工作需求。

9. 消息网关:让 Agent 进入日常入口

Hermes Agent 支持多平台消息网关,可以接入微信、Telegram、Discord、Slack、WhatsApp、Signal 等平台。

这意味着用户不一定需要打开终端或网页,也可以直接通过常用聊天工具调用 Agent。

例如:

把今天生成的压缩包发我。

Agent 可以在服务器上查找文件、执行命令,并把结果通过消息窗口返回。

再例如:

按固定周期自动整理并发送。

Agent 可以创建定时任务,并在指定时间执行。

消息网关的意义在于降低使用门槛。AI 不再只存在于某个网页或 IDE 中,而是可以成为一个随时可触达的工作服务。

10. 子智能体:复杂任务的并行拆解

Hermes Agent 支持子智能体机制。

当任务比较复杂时,主 Agent 可以把任务拆分给多个子 Agent 并行处理。例如:

  • 一个子 Agent 分析后端代码;

  • 一个子 Agent 阅读文档;

  • 一个子 Agent 检查测试;

  • 一个子 Agent 汇总日志;

  • 主 Agent 负责整合结论并做最终决策。

每个子 Agent 拥有独立上下文和执行环境,最后只把结果摘要返回给主 Agent。

这种方式有两个优势:

  1. 多个方向可以并行推进;

  2. 主上下文不会被大量中间日志占满。

对于代码审查、系统调试、研究整理、多文件分析等任务,这种机制比较实用。

11. 自托管与数据控制

Hermes Agent 是自托管的,数据默认保存在用户自己的机器上,例如 ~/.hermes/ 目录。

官网强调了几个特性:

  • 无遥测;

  • 无追踪;

  • 本地数据存储;

  • MIT 开源;

  • 代码可审计;

  • 支持容器和权限隔离。

对于 AI Agent 来说,这一点非常重要。

当 AI 只是聊天工具时,它处理的主要是文本输入输出;而当 AI 能操作终端、文件、浏览器和消息平台时,它接触的就是更真实的工作环境,包括项目代码、业务数据、自动化脚本、登录态和运行日志。

因此,数据在哪里、权限如何控制、日志如何查看、配置如何管理,都会变得很关键。

自托管并不等于没有风险,但它至少让用户对数据位置和系统边界有更明确的控制权。

12. 一个典型使用场景:长期数据采集项目

可以用一个更通用的数据自动化场景来理解 Hermes Agent 的实际价值。

假设一个团队需要长期处理周期性数据任务:

定期从多个来源获取数据。
对原始数据进行清洗和校验。
按周期生成汇总结果。
正常运行时保持静默。
只有在任务失败或需要人工介入时才通知。...[truncated]
​
---
​
## 13. Hermes Agent 的本质
​
如果用一句话概括,Hermes Agent 更像是一个围绕大语言模型构建的个人工作流操作层。
​
它把以下能力组合在一起:
​
```text
模型:理解和推理
工具:执行真实动作
记忆:保存长期上下文
技能:沉淀可复用流程
网关:连接日常入口
定时任务:承接周期工作
子智能体:并行拆解复杂任务

因此,它的重点不只是模型本身有多强,而是能否把模型能力稳定接入真实工作环境。

Hermes Agent 的“越用越聪明”,本质上是把用户的偏好、项目经验和重复流程逐步沉淀进系统。

14. 适合哪些场景

Hermes Agent 并不适合所有需求。

如果只是偶尔问答、改写文本或生成一段内容,普通聊天 AI 已经足够。

但如果存在以下需求,它会更有价值:

  • 经常处理代码、脚本、服务器和文件;

  • 有周期性的报表、采集、监控和整理任务;

  • 希望 AI 记住项目背景和个人偏好;

  • 希望通过微信或其他聊天软件直接调用 AI;

  • 希望 AI 不只提供建议,而是执行、验证并交付结果;

  • 希望构建一个长期运行的个人 AI 助理。

它更适合把 AI 纳入工作流,而不是只把 AI 当作问答工具。

15. 总结

AI Agent 的价值,不只是模型回答得更好,而是模型能否稳定进入真实任务环境。

Hermes Agent 提供了一套比较完整的开源实现:

用工具连接真实系统;
用记忆保存长期偏好;
用技能沉淀可复用流程;
用网关连接日常聊天入口;
用定时任务承接周期性工作;
用自托管保留数据控制权。

这套组合让 AI 从“对话窗口”进一步变成“长期协作的工作系统”。

它的进化不是神秘的模型自训练,而是持续积累上下文、流程和执行经验。对于需要长期自动化、工程协作和个人工作流管理的人来说,这正是 Hermes Agent 最值得关注的地方。