持續記憶是 AI 代理的缺失拼塊

這是一份提交給Hermes Agent Challenge的內容：寫關於Hermes Agent

每一個AI示範都看起來很令人印象深刻。問它一個問題，得到一個聰明的答案。問一個追問——仍然很好。關閉標籤頁，明天再回來——它完全不知道你是誰.

那不是一個代理。那是一個帶有長系統提示的聊天機器人。

工具與合作夥伴之間的區別在於記憶.

無狀態性扼殺了承諾

我們一直在建立基本上是健忘的「代理」.

每個主要框架 — LangChain、LlamaIndex，甚至 OpenAI 的 Assistants API — 不是要求你明確傳遞對話歷史，就是管理你自己建立和維護的向量存儲。

結果：開發者花費更多時間工程記憶，而非建立實際產品。而且記憶仍然淺薄。是提取。不是理解.

人類的合作夥伴不僅僅從筆記本中提取事實。他們已經經歷過 這個背景。他們還記得上週冲刺會議中關於 Redis 的爭論。他們知道你為什麼嘗試並放棄了 GraphQL 的遷移。他們承載著所有導致你現在處境的制度的知識.

這不是通過分割文件和計算餘弦相似度來複製的東西.

检索陷阱

RAG (檢索增強生成) 成為記憶問題的預設答案。它對特定類型的問題效果很好： "文件 X 有關主題 Y 的說法是什麼？"

但它對另一類型的問題失效了： "發生了什麼變化，為什麼會變化，以及這種模式告訴我們關於未來的方向是什麼？"

差異在於時間推理。RAG 是一個帶有 LLM 的搜尋引擎。它找出相關文本。它不懂順序，因果，或反轉。

若一個團隊在三月從 PostgreSQL 迁移到 MongoDB，然後在九月又回歸到 PostgreSQL，一個 RAG 系統會看到兩份關於資料庫的文件。Hermes，憑藉持續性會話記憶，理解一個決定被做出、重新考慮，並且被反轉——而且能夠告訴你這種模式代表什麼意思.

持續性會話記憶帶來的變化

Hermes Agent 引進了一個看似簡單的功能：一個跨請求持續的會話 ID，並累積理解。

X-Hermes-Session-Id: my-repo-brain

透過那個會話在三個月內發送一百個事件，Hermes 不僅僅是儲存它們。它建立了一個它正在觀察的系統的模型。每個新的信息都在之前所有信息的背景中降落。

第十次的提交並非獨立處理。赫爾墨斯知道它推翻了六週前所做的決定。它知道引入變更的 Pull Request 充滿爭議。它知道作者之前已經兩次執行過類似的撤回操作。

這是一種質性上不同的知識。

更深層次的含義

我們正處於從AI作為查詢介面到AI作為長期參與者的轉變開端.

不是：「向AI提個問題。」
而是：「AI一直在觀察，將會告訴你它注意到的事。」

這改變了可構建的內容：

一個能解釋自身架構歷史的代碼庫
一位能記得所有過往互動，無需被告知的客戶支援代理
一個能夠知道三個月前「正常」狀態的監控系統，而不僅僅是現在
一位能夠追蹤每個決策並自動發現矛盾的项目經理

這些都無法透過無狀態的大型語言模型呼叫來實現，無論提示工程多麼精妙。它們需要一個積累的代理，一個隨著運行時間越來越聰明的代理，而不是一個在每次 API 呼叫時都重置為零的代理。

自動層

完成這張圖片的拼塊是排程。Hermes 的內建 cron 工作排程器註冊意味著一個持續的代理也可以是一個 主動的 代理.

await hermes.create_job(
    name="weekly-risk-report",
    schedule="0 9 * * 1",
    prompt="Review what you've learned this week. Identify the three biggest risks.",
)

這不是一個cron工作呼叫無狀態API。這是同一個代理，使用相同的累積記憶，在排程上自行運行。記憶和自主性存於同一系統中.

那就是產生一種感覺像真實參與者，而不是複雜自動完成感的架構。

開放是另一部分

Nous Research 讓赫尔墨斯開放。這超出了通常的開源爭論範圍。

對於一個 AI 代理，持續記憶是敏感的。如果一個代理記得你代碼庫的所有信息，你的團隊，你的客戶——你想要確切知道那個記憶存放在哪裡，誰控制它，以及當你停止支付訂閱時會發生什麼。

開啟 + 持續性 + 本地可執行是讓這個可以嚴肅地建立在上面，而不僅僅是實驗的組合。你擁有記憶體。這是沒有封閉式雲服務實際能保證的屬性.

我們正在填補的差距

任何組織中最寶貴的知識都不在文件裡。它存在於那些待得夠久、足以了解事情為何如此的人腦中 — 那位記得你三次嘗試重構認證系統的資深工程師，那位知道哪些賬戶在不同名稱下抱怨過同一個錯誤的客戶成功經理。

當知識存在時它無可取代，當它離開門口時則毀滅性

具備持續記憶的AI代理是第一種能實際持有那種知識的技術——並使其可查詢、可擴展且永恆

這不是一個功能。這是整個遊戲。

推薦訂閱源

DEV Community