這是一份提交給Hermes Agent Challenge的內容:寫關於Hermes Agent
每一個AI示範都看起來很令人印象深刻。問它一個問題,得到一個聰明的答案。問一個追問——仍然很好。關閉標籤頁,明天再回來——它完全不知道你是誰.
那不是一個代理。那是一個帶有長系統提示的聊天機器人。
工具與合作夥伴之間的區別在於記憶.
無狀態性扼殺了承諾
我們一直在建立基本上是健忘的「代理」.
每個主要框架 — LangChain、LlamaIndex,甚至 OpenAI 的 Assistants API — 不是要求你明確傳遞對話歷史,就是管理你自己建立和維護的向量存儲。
結果:開發者花費更多時間工程記憶,而非建立實際產品。而且記憶仍然淺薄。是提取。不是理解.
人類的合作夥伴不僅僅從筆記本中提取事實。他們已經經歷過 這個背景。他們還記得上週冲刺會議中關於 Redis 的爭論。他們知道你為什麼嘗試並放棄了 GraphQL 的遷移。他們承載著所有導致你現在處境的制度的知識.
這不是通過分割文件和計算餘弦相似度來複製的東西.
检索陷阱
RAG (檢索增強生成) 成為記憶問題的預設答案。它對特定類型的問題效果很好: "文件 X 有關主題 Y 的說法是什麼?"
但它對另一類型的問題失效了: "發生了什麼變化,為什麼會變化,以及這種模式告訴我們關於未來的方向是什麼?"
差異在於時間推理。RAG 是一個帶有 LLM 的搜尋引擎。它找出相關文本。它不懂順序,因果,或反轉。
若一個團隊在三月從 PostgreSQL 迁移到 MongoDB,然後在九月又回歸到 PostgreSQL,一個 RAG 系統會看到兩份關於資料庫的文件。Hermes,憑藉持續性會話記憶,理解一個決定被做出、重新考慮,並且被反轉——而且能夠告訴你這種模式代表什麼意思.
持續性會話記憶帶來的變化
Hermes Agent 引進了一個看似簡單的功能:一個跨請求持續的會話 ID,並累積理解。
X-Hermes-Session-Id: my-repo-brain
透過那個會話在三個月內發送一百個事件,Hermes 不僅僅是儲存它們。它建立了一個它正在觀察的系統的模型。每個新的信息都在之前所有信息的背景中降落。
第十次的提交並非獨立處理。赫爾墨斯知道它推翻了六週前所做的決定。它知道引入變更的 Pull Request 充滿爭議。它知道作者之前已經兩次執行過類似的撤回操作。
這是一種質性上不同的知識。
更深層次的含義
我們正處於從AI作為查詢介面到AI作為長期參與者的轉變開端.
不是:「向AI提個問題。」
而是:「AI一直在觀察,將會告訴你它注意到的事。」
這改變了可構建的內容:
- 一個能解釋自身架構歷史的代碼庫
- 一位能記得所有過往互動,無需被告知的客戶支援代理
- 一個能夠知道三個月前「正常」狀態的監控系統,而不僅僅是現在
- 一位能夠追蹤每個決策並自動發現矛盾的项目經理
這些都無法透過無狀態的大型語言模型呼叫來實現,無論提示工程多麼精妙。它們需要一個積累的代理,一個隨著運行時間越來越聰明的代理,而不是一個在每次 API 呼叫時都重置為零的代理。
自動層
完成這張圖片的拼塊是排程。Hermes 的內建 cron 工作排程器註冊意味著一個持續的代理也可以是一個 主動的 代理.
await hermes.create_job(
name="weekly-risk-report",
schedule="0 9 * * 1",
prompt="Review what you've learned this week. Identify the three biggest risks.",
)
這不是一個cron工作呼叫無狀態API。這是同一個代理,使用相同的累積記憶,在排程上自行運行。記憶和自主性存於同一系統中.
那就是產生一種感覺像真實參與者,而不是複雜自動完成感的架構。
開放是另一部分
Nous Research 讓赫尔墨斯開放。這超出了通常的開源爭論範圍。
對於一個 AI 代理,持續記憶是敏感的。如果一個代理記得你代碼庫的所有信息,你的團隊,你的客戶——你想要確切知道那個記憶存放在哪裡,誰控制它,以及當你停止支付訂閱時會發生什麼。
開啟 + 持續性 + 本地可執行是讓這個可以嚴肅地建立在上面,而不僅僅是實驗的組合。你擁有記憶體。這是沒有封閉式雲服務實際能保證的屬性.
我們正在填補的差距
任何組織中最寶貴的知識都不在文件裡。它存在於那些待得夠久、足以了解事情為何如此的人腦中 — 那位記得你三次嘗試重構認證系統的資深工程師,那位知道哪些賬戶在不同名稱下抱怨過同一個錯誤的客戶成功經理。
當知識存在時它無可取代,當它離開門口時則毀滅性
具備持續記憶的AI代理是第一種能實際持有那種知識的技術——並使其可查詢、可擴展且永恆
這不是一個功能。這是整個遊戲。












