慣性聚合 高效追蹤和閱讀你感興趣的部落格、新聞、科技資訊
閱讀原文 在慣性聚合中打開

推薦訂閱源

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

DEV Community

Authentication Security Deep Dive: From Brute Force to Salted Hashing (With Java Examples) Why AI Systems Don’t Fail — They Drift Spilling beans for how i learn for exam😁"Reinforcement Learning Cheat Sheet" I Replaced Chrome with Safari for AI Browser Automation. Here's What Broke (and What Finally Worked) How Python Borrows Other People's Work The $40 Architecture: Processing 1 Billion API Requests with 99.99% Uptime Vibe Coding: A Workflow Guide (From Zero to SaaS) Most webhook security guides protect the wrong side. The scary part is delivery. Headless CMS for TanStack Start: Build a Blog with Cosmic EU Age Verification App "Hacked in 2 Minutes" — What Actually Happened Comfy Cloud’s delete function does not actually remove files Running AI Models on GPU Cloud Servers: A Beginner Guide Event-driven media intelligence with AWS Step Functions and Bedrock I scored 500 AI prompts across 8 quality dimensions — here's what broke How to Call Google Gemini API from Next.js (Free Tier, No Backend Needed) The Portal Protocol: Reclaiming Human Connection in the Age of AI How to Fix Your Team's Scattered Knowledge Problem With a Self-Hosted Forum Intro to tc Cloud Functors: A Graph-First Mental Model for the Modern Cloud Designing Multi-Tenant Backends With Both Ownership and Team Access I Built a Neumorphic CSS Library with 77+ Components — Here's What I Learned PostgreSQL Performance Optimization: Why Connection Pooling Is Critical at Scale Cómo construí un SaaS multi-rubro para gestionar expensas en Argentina con FastAPI + Vue 3 🚀 I Built an Ethical Hacking Scanner Tool – Open Source Project I Replaced /usage and /context in Claude Code With a Single Statusline A Pythonic Way to Handle Emails (IMAP/SMTP) with Auto-Discovery and AI-Ready Design I Collected 8.9 Million Polymarket Price Points — Here's What I Found About How Markets Really Move EcoTrack AI — Carbon Footprint Tracker & Dashboard Everyone's Using AI. No One Agrees How. 5 self-hosted ebook managers worth trying in 2026 Building Your First AI Agent with LangChain: From Chatbot to Autonomous Assistant Common SOC 2 Failures (Real World) Stop Vibe-Checking Your AI App: A Practical Guide to Evals How to Use SonarQube and SonarScanner Locally to Level Up Your Code Quality Your Next To-Do App Is Dead — I Replaced Mine with an OpenClaw AI Sign a Nostr event in 60 lines of Python using coincurve — no nostr-sdk, no nbxplorer, no rust toolchain ITGC Audit Explained Like You’re in Big 4 Patch Tuesday abril 2026: Microsoft parcha 163 vulnerabilidades y un zero-day en SharePoint Stop scraping everything: a better way to track competitor price changes Listing on MCPize + the Official MCP Registry while routing payments OUTSIDE the marketplace — how I kept 100% of my x402 revenue Building an AI-Powered Risk Intelligence System Using Serverless Architecture Why We Ripped Function Overloading Out of Our AI Toolchain Testing AI-Generated Code: How to Actually Know If It Works SaaS Churn Is Killing Your Business. Here Is What to Do About It (Without a Support Team) The Speed of AI Is No Longer Linear - And Self-Improving Models Are Why How to Implement RBAC for MCP Tools: A Practical Guide for Engineering Teams From Standard Quote to Persuasive Proposal: AI Automation for Arborists I built a CLI that scaffolds complete multi-tenant SaaS apps Axios CVE-2025–62718: The Silent SSRF Bug That Could Be Hiding in Your Node.js App Right Now The dashboard that ended our friendship Data Pipelines Explained Simply (and How to Build Them with Python)
持續記憶是 AI 代理的缺失拼塊
pulkitgovran · 2026-05-24 · via DEV Community

這是一份提交給Hermes Agent Challenge的內容:寫關於Hermes Agent

每一個AI示範都看起來很令人印象深刻。問它一個問題,得到一個聰明的答案。問一個追問——仍然很好。關閉標籤頁,明天再回來——它完全不知道你是誰.

那不是一個代理。那是一個帶有長系統提示的聊天機器人。

工具與合作夥伴之間的區別在於記憶.


無狀態性扼殺了承諾

我們一直在建立基本上是健忘的「代理」.

每個主要框架 — LangChain、LlamaIndex,甚至 OpenAI 的 Assistants API — 不是要求你明確傳遞對話歷史,就是管理你自己建立和維護的向量存儲。

結果:開發者花費更多時間工程記憶,而非建立實際產品。而且記憶仍然淺薄。是提取。不是理解.

人類的合作夥伴不僅僅從筆記本中提取事實。他們已經經歷過 這個背景。他們還記得上週冲刺會議中關於 Redis 的爭論。他們知道你為什麼嘗試並放棄了 GraphQL 的遷移。他們承載著所有導致你現在處境的制度的知識.

這不是通過分割文件和計算餘弦相似度來複製的東西.


检索陷阱

RAG (檢索增強生成) 成為記憶問題的預設答案。它對特定類型的問題效果很好: "文件 X 有關主題 Y 的說法是什麼?"

但它對另一類型的問題失效了: "發生了什麼變化,為什麼會變化,以及這種模式告訴我們關於未來的方向是什麼?"

差異在於時間推理。RAG 是一個帶有 LLM 的搜尋引擎。它找出相關文本。它不懂順序因果,或反轉

若一個團隊在三月從 PostgreSQL 迁移到 MongoDB,然後在九月又回歸到 PostgreSQL,一個 RAG 系統會看到兩份關於資料庫的文件。Hermes,憑藉持續性會話記憶,理解一個決定被做出、重新考慮,並且被反轉——而且能夠告訴你這種模式代表什麼意思.


持續性會話記憶帶來的變化

Hermes Agent 引進了一個看似簡單的功能:一個跨請求持續的會話 ID,並累積理解。

X-Hermes-Session-Id: my-repo-brain

進入全螢幕模式 退出全螢幕模式

透過那個會話在三個月內發送一百個事件,Hermes 不僅僅是儲存它們。它建立了一個它正在觀察的系統的模型。每個新的信息都在之前所有信息的背景中降落。

第十次的提交並非獨立處理。赫爾墨斯知道它推翻了六週前所做的決定。它知道引入變更的 Pull Request 充滿爭議。它知道作者之前已經兩次執行過類似的撤回操作。

這是一種質性上不同的知識。


更深層次的含義

我們正處於從AI作為查詢介面到AI作為長期參與者的轉變開端.

不是:「向AI提個問題。」
而是:「AI一直在觀察,將會告訴你它注意到的事。」

這改變了可構建的內容:

  • 一個能解釋自身架構歷史的代碼庫
  • 一位能記得所有過往互動,無需被告知的客戶支援代理
  • 一個能夠知道三個月前「正常」狀態的監控系統,而不僅僅是現在
  • 一位能夠追蹤每個決策並自動發現矛盾的项目經理

這些都無法透過無狀態的大型語言模型呼叫來實現,無論提示工程多麼精妙。它們需要一個積累的代理,一個隨著運行時間越來越聰明的代理,而不是一個在每次 API 呼叫時都重置為零的代理。


自動層

完成這張圖片的拼塊是排程。Hermes 的內建 cron 工作排程器註冊意味著一個持續的代理也可以是一個 主動的 代理.

await hermes.create_job(
    name="weekly-risk-report",
    schedule="0 9 * * 1",
    prompt="Review what you've learned this week. Identify the three biggest risks.",
)

進入全螢幕模式 離開全螢幕模式

這不是一個cron工作呼叫無狀態API。這是同一個代理,使用相同的累積記憶,在排程上自行運行。記憶和自主性存於同一系統中.

那就是產生一種感覺像真實參與者,而不是複雜自動完成感的架構。


開放是另一部分

Nous Research 讓赫尔墨斯開放。這超出了通常的開源爭論範圍。

對於一個 AI 代理,持續記憶是敏感的。如果一個代理記得你代碼庫的所有信息,你的團隊,你的客戶——你想要確切知道那個記憶存放在哪裡,誰控制它,以及當你停止支付訂閱時會發生什麼。

開啟 + 持續性 + 本地可執行是讓這個可以嚴肅地建立在上面,而不僅僅是實驗的組合。你擁有記憶體。這是沒有封閉式雲服務實際能保證的屬性.


我們正在填補的差距

任何組織中最寶貴的知識都不在文件裡。它存在於那些待得夠久、足以了解事情為何如此的人腦中 — 那位記得你三次嘗試重構認證系統的資深工程師,那位知道哪些賬戶在不同名稱下抱怨過同一個錯誤的客戶成功經理。

當知識存在時它無可取代,當它離開門口時則毀滅性

具備持續記憶的AI代理是第一種能實際持有那種知識的技術——並使其可查詢、可擴展且永恆

這不是一個功能。這是整個遊戲。