慣性聚合 関心のあるブログ、ニュース、テクノロジーを効率的に追跡
原文を読む 慣性聚合で開く

おすすめ購読元

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

DEV Community

Authentication Security Deep Dive: From Brute Force to Salted Hashing (With Java Examples) Why AI Systems Don’t Fail — They Drift Spilling beans for how i learn for exam😁"Reinforcement Learning Cheat Sheet" I Replaced Chrome with Safari for AI Browser Automation. Here's What Broke (and What Finally Worked) How Python Borrows Other People's Work The $40 Architecture: Processing 1 Billion API Requests with 99.99% Uptime Vibe Coding: A Workflow Guide (From Zero to SaaS) Most webhook security guides protect the wrong side. The scary part is delivery. Headless CMS for TanStack Start: Build a Blog with Cosmic EU Age Verification App "Hacked in 2 Minutes" — What Actually Happened Comfy Cloud’s delete function does not actually remove files Running AI Models on GPU Cloud Servers: A Beginner Guide Event-driven media intelligence with AWS Step Functions and Bedrock I scored 500 AI prompts across 8 quality dimensions — here's what broke How to Call Google Gemini API from Next.js (Free Tier, No Backend Needed) The Portal Protocol: Reclaiming Human Connection in the Age of AI How to Fix Your Team's Scattered Knowledge Problem With a Self-Hosted Forum Intro to tc Cloud Functors: A Graph-First Mental Model for the Modern Cloud Designing Multi-Tenant Backends With Both Ownership and Team Access I Built a Neumorphic CSS Library with 77+ Components — Here's What I Learned PostgreSQL Performance Optimization: Why Connection Pooling Is Critical at Scale Cómo construí un SaaS multi-rubro para gestionar expensas en Argentina con FastAPI + Vue 3 🚀 I Built an Ethical Hacking Scanner Tool – Open Source Project I Replaced /usage and /context in Claude Code With a Single Statusline A Pythonic Way to Handle Emails (IMAP/SMTP) with Auto-Discovery and AI-Ready Design I Collected 8.9 Million Polymarket Price Points — Here's What I Found About How Markets Really Move EcoTrack AI — Carbon Footprint Tracker & Dashboard Everyone's Using AI. No One Agrees How. 5 self-hosted ebook managers worth trying in 2026 Building Your First AI Agent with LangChain: From Chatbot to Autonomous Assistant Common SOC 2 Failures (Real World) Stop Vibe-Checking Your AI App: A Practical Guide to Evals How to Use SonarQube and SonarScanner Locally to Level Up Your Code Quality Your Next To-Do App Is Dead — I Replaced Mine with an OpenClaw AI Sign a Nostr event in 60 lines of Python using coincurve — no nostr-sdk, no nbxplorer, no rust toolchain ITGC Audit Explained Like You’re in Big 4 Patch Tuesday abril 2026: Microsoft parcha 163 vulnerabilidades y un zero-day en SharePoint Stop scraping everything: a better way to track competitor price changes Listing on MCPize + the Official MCP Registry while routing payments OUTSIDE the marketplace — how I kept 100% of my x402 revenue Building an AI-Powered Risk Intelligence System Using Serverless Architecture Why We Ripped Function Overloading Out of Our AI Toolchain Testing AI-Generated Code: How to Actually Know If It Works SaaS Churn Is Killing Your Business. Here Is What to Do About It (Without a Support Team) The Speed of AI Is No Longer Linear - And Self-Improving Models Are Why How to Implement RBAC for MCP Tools: A Practical Guide for Engineering Teams From Standard Quote to Persuasive Proposal: AI Automation for Arborists I built a CLI that scaffolds complete multi-tenant SaaS apps Axios CVE-2025–62718: The Silent SSRF Bug That Could Be Hiding in Your Node.js App Right Now The dashboard that ended our friendship Data Pipelines Explained Simply (and How to Build Them with Python)
持続メモリはAIエージェントの欠けていたピースです
pulkitgovran · 2026-05-24 · via DEV Community

これはHermes Agent Challenge「Hermes Agentについて書く」に提出するものです

すべてのAIデモは印象的です。質問をすると賢い答えが返ってきます。追加点を尋ねても良いです。タブを閉じて明日戻ってきたら—あなたが誰か知りません

それはエージェントではありません。それは長いシステムプロンプトを持つチャットボットです

ツールと協力者との違いは記憶です.


ステートレスが約束を殺す理由

私たちは基本的に健忘症の「エージェント」を構築してきました.

主要なフレームワーク——LangChain、LlamaIndex、OpenAIのAssistants APIさえも——は、会話履歴を明示的に渡すか、あなたが構築・メンテナンスするベクトルストアで管理する必要があります。

結果:開発者は実際の製品を作るよりも記憶のエンジニアリングに時間を費やす。そして記憶はまだ浅い。それは検索だ。理解していない.

人間の協力者はノートから事実を検索するだけではない。彼らは実際に経験している その文脈を覚えています。先週のスプリントミーティングでRedisについての議論を覚えています。GraphQLの移行を試みた理由と放棄した理由を知っています。今のあなたに至るまでのすべての過程に関する組織知識を持っています.

それはドキュメントをチャンク化してコサイン類似度を計算する方法で再現できるものではありません.


検索の罠

RAG(検索拡張生成)は、記憶問題に対するデフォルトの解決策となった。特定の種類の質問にはうまく機能する:「文書XはトピックYについて何を述べていますか?」

しかし、別の種類の質問では機能しない:「何が変わりましたか、なぜ変わりましたか、そしてそのパターンは私たちが向かっている場所について何を教えてくれますか?」

時間的推論の違いです。RAGはLLMを上に乗せた検索エンジンです。関連するテキストを見つけます。順序因果関係、または逆転を理解しません。

3月にPostgreSQLからMongoDBへ移行し、その後9月にPostgreSQLに戻ったチームの場合、RAGシステムはデータベースに関する2つの文書を見ます。持続的セッションメモリを持つHermesは、決定が下され、見直され、逆転したことを理解し、そのパターンが何を意味するかを教えてくれます.


持続的セッションメモリの変更

エルメスエージェントは、見かけ上単純なものを導入しました:リクエストを越えて持続するセッションIDで、理解を蓄積します.

X-Hermes-Session-Id: my-repo-brain

全画面表示モードに入る 全画面表示モードから退出する

3ヶ月間でそのセッションを通じて100件のイベントを送信し、エルメスはそれらを単に保存するだけでなく、監視しているシステムのモデルを構築します。新しい情報の各一つが、それまでのすべての情報の文脈に着陆します。

10番目のコミットは孤立して処理されない。ヘルメスは6週間前に決定を覆したことを知っている。変更を導入したPRが論争的だったことを知っている。著者はこれまでに似たようなロールバックを2回したことを知っている.

それは定性的に異なる種類の知識である.


より大きな意味

私たちは、AIをクエリインターフェースとしてではなく、長期間参加するプレイヤーとしてのAIへの移行の始まりにいます

「AIに質問する」のではなく
「AIはもう観察していて、それが気づいたことをお伝えする」です

これは構築可能なものを変えます

  • 自分のアーキテクチャの歴史を説明するコードベース
  • 過去のすべてのやり取りを覚えておくサポートエージェント(__JHSNS_SEG_07fafcca_38__)
  • 3ヶ月前の「正常」の状態を知っている監視システム(__JHSNS_SEG_07fafcca_39__)
  • すべての決定を追跡し、矛盾を自動的に浮き彫りにするプロジェクトマネージャー(__JHSNS_SEG_07fafcca_40__)

これらは状態のないLLM呼び出しでは不可能であり、どれほど高度なプロンプトエンジニアリングをしても。それらには、蓄積するエージェントが必要であり、API呼び出しごとにゼロにリセットされるのではなく、実行時間が長ければ長いほど賢くなるエージェントが必要です.


自動化レイヤー

全体像を完成させるのはスケジューリングです。Hermesの組み込みcronジョブ登録機能により、持続的なエージェントは積極的にもなれます エージェント.

await hermes.create_job(
    name="weekly-risk-report",
    schedule="0 9 * * 1",
    prompt="Review what you've learned this week. Identify the three biggest risks.",
)

フルスクリーンモードを開始 フルスクリーンモードを終了

これはcronジョブがステートレスAPIを呼び出しているのではありません。同じエージェントで、同じ蓄積されたメモリで、スケジュール上で自分自身を実行しています。メモリと自律性は同じシステムに存在します.

それが、高度なオートコンプリートではなく、本物の参加者のように感じさせるアーキテクチャです。


オープンは他の一部

Nous ResearchがHermesをオープンにした。それは通常のオープンソースの議論を超えたものだ。

AIエージェントのための持続的メモリは機密性がある。エージェントがあなたのコードベース、あなたのチーム、あなたの顧客についてすべてを覚えている場合、そのメモリがどこに存在するか、誰がそれを管理しているか、そしてサブスクリプションを解約したときにそれがどうなるかを知りたい。

オープン + 持続的 + ローカルで実行可能な組み合わせが、これを本格的に構築する安全なものにしている。実験的なものに留まらない。あなたがメモリを所有している。これは、実際にクローズドソースのクラウドサービスが保証できるようなプロパティではない。


塞が詰まる場所

あらゆる組織で最も価値ある知識は文書にない。それは、物事がなぜそのようになっているのかを知るのに十分な経験がある人々の頭の中にある——長く勤めたシニアエンジニアがあなたが認証システムをリファクタリングしようとした三回を覚えていること、顧客成功マネージャーが同じバグを異なる名前で苦情を提出した口座を知っていることなどがそれだ。

その知識は存在する時にはかけがえのないものであり、外に出て行く時には破滅的です.

持続的な記憶を持つAIエージェントは、実際にその種の知識を保持できる初めての技術であり、それを検索可能、拡張可能、永続的にすることができます.

これは機能ではありません。これは全てのゲームです。