持続メモリはAIエージェントの欠けていたピースです

これはHermes Agent Challenge「Hermes Agentについて書く」に提出するものです

すべてのAIデモは印象的です。質問をすると賢い答えが返ってきます。追加点を尋ねても良いです。タブを閉じて明日戻ってきたら—あなたが誰か知りません

それはエージェントではありません。それは長いシステムプロンプトを持つチャットボットです

ツールと協力者との違いは記憶です.

ステートレスが約束を殺す理由

私たちは基本的に健忘症の「エージェント」を構築してきました.

主要なフレームワーク——LangChain、LlamaIndex、OpenAIのAssistants APIさえも——は、会話履歴を明示的に渡すか、あなたが構築・メンテナンスするベクトルストアで管理する必要があります。

結果：開発者は実際の製品を作るよりも記憶のエンジニアリングに時間を費やす。そして記憶はまだ浅い。それは検索だ。理解していない.

人間の協力者はノートから事実を検索するだけではない。彼らは実際に経験している その文脈を覚えています。先週のスプリントミーティングでRedisについての議論を覚えています。GraphQLの移行を試みた理由と放棄した理由を知っています。今のあなたに至るまでのすべての過程に関する組織知識を持っています.

それはドキュメントをチャンク化してコサイン類似度を計算する方法で再現できるものではありません.

検索の罠

RAG（検索拡張生成）は、記憶問題に対するデフォルトの解決策となった。特定の種類の質問にはうまく機能する：「文書XはトピックYについて何を述べていますか？」

しかし、別の種類の質問では機能しない：「何が変わりましたか、なぜ変わりましたか、そしてそのパターンは私たちが向かっている場所について何を教えてくれますか？」

時間的推論の違いです。RAGはLLMを上に乗せた検索エンジンです。関連するテキストを見つけます。順序、因果関係、または逆転を理解しません。

3月にPostgreSQLからMongoDBへ移行し、その後9月にPostgreSQLに戻ったチームの場合、RAGシステムはデータベースに関する2つの文書を見ます。持続的セッションメモリを持つHermesは、決定が下され、見直され、逆転したことを理解し、そのパターンが何を意味するかを教えてくれます.

持続的セッションメモリの変更

エルメスエージェントは、見かけ上単純なものを導入しました：リクエストを越えて持続するセッションIDで、理解を蓄積します.

X-Hermes-Session-Id: my-repo-brain

3ヶ月間でそのセッションを通じて100件のイベントを送信し、エルメスはそれらを単に保存するだけでなく、監視しているシステムのモデルを構築します。新しい情報の各一つが、それまでのすべての情報の文脈に着陆します。

10番目のコミットは孤立して処理されない。ヘルメスは6週間前に決定を覆したことを知っている。変更を導入したPRが論争的だったことを知っている。著者はこれまでに似たようなロールバックを2回したことを知っている.

それは定性的に異なる種類の知識である.

より大きな意味

私たちは、AIをクエリインターフェースとしてではなく、長期間参加するプレイヤーとしてのAIへの移行の始まりにいます

「AIに質問する」のではなく
「AIはもう観察していて、それが気づいたことをお伝えする」です

これは構築可能なものを変えます

自分のアーキテクチャの歴史を説明するコードベース
過去のすべてのやり取りを覚えておくサポートエージェント（__JHSNS_SEG_07fafcca_38__）
3ヶ月前の「正常」の状態を知っている監視システム（__JHSNS_SEG_07fafcca_39__）
すべての決定を追跡し、矛盾を自動的に浮き彫りにするプロジェクトマネージャー（__JHSNS_SEG_07fafcca_40__）

これらは状態のないLLM呼び出しでは不可能であり、どれほど高度なプロンプトエンジニアリングをしても。それらには、蓄積するエージェントが必要であり、API呼び出しごとにゼロにリセットされるのではなく、実行時間が長ければ長いほど賢くなるエージェントが必要です.

自動化レイヤー

全体像を完成させるのはスケジューリングです。Hermesの組み込みcronジョブ登録機能により、持続的なエージェントは積極的にもなれます エージェント.

await hermes.create_job(
    name="weekly-risk-report",
    schedule="0 9 * * 1",
    prompt="Review what you've learned this week. Identify the three biggest risks.",
)

これはcronジョブがステートレスAPIを呼び出しているのではありません。同じエージェントで、同じ蓄積されたメモリで、スケジュール上で自分自身を実行しています。メモリと自律性は同じシステムに存在します.

それが、高度なオートコンプリートではなく、本物の参加者のように感じさせるアーキテクチャです。

オープンは他の一部

Nous ResearchがHermesをオープンにした。それは通常のオープンソースの議論を超えたものだ。

AIエージェントのための持続的メモリは機密性がある。エージェントがあなたのコードベース、あなたのチーム、あなたの顧客についてすべてを覚えている場合、そのメモリがどこに存在するか、誰がそれを管理しているか、そしてサブスクリプションを解約したときにそれがどうなるかを知りたい。

オープン + 持続的 + ローカルで実行可能な組み合わせが、これを本格的に構築する安全なものにしている。実験的なものに留まらない。あなたがメモリを所有している。これは、実際にクローズドソースのクラウドサービスが保証できるようなプロパティではない。

塞が詰まる場所

あらゆる組織で最も価値ある知識は文書にない。それは、物事がなぜそのようになっているのかを知るのに十分な経験がある人々の頭の中にある——長く勤めたシニアエンジニアがあなたが認証システムをリファクタリングしようとした三回を覚えていること、顧客成功マネージャーが同じバグを異なる名前で苦情を提出した口座を知っていることなどがそれだ。

その知識は存在する時にはかけがえのないものであり、外に出て行く時には破滅的です.

持続的な記憶を持つAIエージェントは、実際にその種の知識を保持できる初めての技術であり、それを検索可能、拡張可能、永続的にすることができます.

これは機能ではありません。これは全てのゲームです。

おすすめ購読元

DEV Community