慣性聚合 関心のあるブログ、ニュース、テクノロジーを効率的に追跡
原文を読む 慣性聚合で開く

おすすめ購読元

Google DeepMind News
Google DeepMind News
人人都是产品经理
人人都是产品经理
M
MIT News - Artificial intelligence
博客园 - 叶小钗
MyScale Blog
MyScale Blog
V
Visual Studio Blog
月光博客
月光博客
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
量子位
I
InfoQ
有赞技术团队
有赞技术团队
阮一峰的网络日志
阮一峰的网络日志
Jina AI
Jina AI
V
V2EX
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
Blog — PlanetScale
Blog — PlanetScale
Last Week in AI
Last Week in AI
雷峰网
雷峰网
Stack Overflow Blog
Stack Overflow Blog
博客园 - Franky

DEV Community

Authentication Security Deep Dive: From Brute Force to Salted Hashing (With Java Examples) Why AI Systems Don’t Fail — They Drift Spilling beans for how i learn for exam😁"Reinforcement Learning Cheat Sheet" I Replaced Chrome with Safari for AI Browser Automation. Here's What Broke (and What Finally Worked) How Python Borrows Other People's Work The $40 Architecture: Processing 1 Billion API Requests with 99.99% Uptime Vibe Coding: A Workflow Guide (From Zero to SaaS) Most webhook security guides protect the wrong side. The scary part is delivery. Headless CMS for TanStack Start: Build a Blog with Cosmic EU Age Verification App "Hacked in 2 Minutes" — What Actually Happened Comfy Cloud’s delete function does not actually remove files Running AI Models on GPU Cloud Servers: A Beginner Guide Event-driven media intelligence with AWS Step Functions and Bedrock I scored 500 AI prompts across 8 quality dimensions — here's what broke How to Call Google Gemini API from Next.js (Free Tier, No Backend Needed) The Portal Protocol: Reclaiming Human Connection in the Age of AI How to Fix Your Team's Scattered Knowledge Problem With a Self-Hosted Forum Intro to tc Cloud Functors: A Graph-First Mental Model for the Modern Cloud Designing Multi-Tenant Backends With Both Ownership and Team Access I Built a Neumorphic CSS Library with 77+ Components — Here's What I Learned PostgreSQL Performance Optimization: Why Connection Pooling Is Critical at Scale Cómo construí un SaaS multi-rubro para gestionar expensas en Argentina con FastAPI + Vue 3 🚀 I Built an Ethical Hacking Scanner Tool – Open Source Project I Replaced /usage and /context in Claude Code With a Single Statusline A Pythonic Way to Handle Emails (IMAP/SMTP) with Auto-Discovery and AI-Ready Design I Collected 8.9 Million Polymarket Price Points — Here's What I Found About How Markets Really Move EcoTrack AI — Carbon Footprint Tracker & Dashboard Everyone's Using AI. No One Agrees How. 5 self-hosted ebook managers worth trying in 2026 Building Your First AI Agent with LangChain: From Chatbot to Autonomous Assistant Common SOC 2 Failures (Real World) Stop Vibe-Checking Your AI App: A Practical Guide to Evals How to Use SonarQube and SonarScanner Locally to Level Up Your Code Quality Your Next To-Do App Is Dead — I Replaced Mine with an OpenClaw AI Sign a Nostr event in 60 lines of Python using coincurve — no nostr-sdk, no nbxplorer, no rust toolchain ITGC Audit Explained Like You’re in Big 4 Patch Tuesday abril 2026: Microsoft parcha 163 vulnerabilidades y un zero-day en SharePoint Stop scraping everything: a better way to track competitor price changes Listing on MCPize + the Official MCP Registry while routing payments OUTSIDE the marketplace — how I kept 100% of my x402 revenue Building an AI-Powered Risk Intelligence System Using Serverless Architecture Why We Ripped Function Overloading Out of Our AI Toolchain Testing AI-Generated Code: How to Actually Know If It Works SaaS Churn Is Killing Your Business. Here Is What to Do About It (Without a Support Team) The Speed of AI Is No Longer Linear - And Self-Improving Models Are Why How to Implement RBAC for MCP Tools: A Practical Guide for Engineering Teams From Standard Quote to Persuasive Proposal: AI Automation for Arborists I built a CLI that scaffolds complete multi-tenant SaaS apps Axios CVE-2025–62718: The Silent SSRF Bug That Could Be Hiding in Your Node.js App Right Now The dashboard that ended our friendship Data Pipelines Explained Simply (and How to Build Them with Python)
なぜAIメモリが多すぎるのか—何を保存すべきか
Self-Correct · 2026-05-25 · via DEV Community

AIの記憶に関する人々の静かな間違いは、あまりにも多く解決しようとすることです

多くの記憶システムは過去をきれいなものに圧縮したいです:要約、決定、好み、修正された信念。問題が解決しているときには便利です。しかし多くの真面目な仕事は解決していません。それは暫定的なもの、議論の対象、部分的な証拠、または次のシグナルを待っているものです。

あなたの記憶システムがその状態を保持できない場合、不確実性は偽りの明確さに平坦化されます。エージェントは組織的に聞こえるかもしれませんが、それはクリーンに整えられた嘘を継承します.

それが失敗モードです:忘れることではなく、クリーンに記憶することです。

媚上心(Sycophancy)とは、あまりにも同意する記憶である。早すぎる結論(Premature closure)とは、あまりにも解決する記憶である。どちらも同じ根元から生まれる:判断よりも快適さと効率を最適化する記憶システムである.

要約の罠

要約は中立的ではない。どの要約も、何が重要であるか、何が消えていくか、そして未来が継承するトーンを選ぶ.__JHSNS_SEG_82c856b8_5__

モデルが混沌とした議論を「ユーザーがXを決定した」として圧縮すると、トークンを節約できるが、決定を生んだ圧力を削除することもあり得る:却下された代替案、不確実性の境界、Xが真でなくなる可能性のある条件。

これが長期的なAIシステムが間違った理由で自信を持つ方法である。

彼らは事実を妄想するだけでなく、解決策も妄想する。

彼らは転身する:

There are three competing interpretations. One is currently stronger, but the evidence is incomplete.

フルスクリーンモードを開始 フルスクリーンモードを終了

入力:

User believes interpretation one.

フルスクリーンモードを開始 フルスクリーンモードを終了

それは効率的です。実際には判断の損失です。

製品の例は簡単です。創業者は「この提案がうまくいっていない」と言います。急いで記憶するシステムは「提案失敗」と記録します。しかし、提案が失敗したわけではないかもしれません。配信が弱かったかもしれません。ターゲットオーディエンスが間違っていたかもしれません。ランディングページが不明瞭だったかもしれません。提案は良いが、実績がないかもしれません。

Offer failedはクリーンなまとめです。

Offer unproven; distribution and audience mismatch unresolvedはより良い記憶です。

最初のものはアイデアを殺します。二番目のものは疑問を保持します。

矫正は最終的な層ではない

正確記憶は強力なものです。なぜなら、思考がどのように変わったかを保存するからです:あなたはXを信じていたが、証拠はYに変わったので、将来の行動は調整されるべきです

しかし、すべての価値のある記憶がその形に合致するわけではありません

時にはまだ修正がありません。時には緊張があります。時にはパターンが繰り返されますが、主張になる十分な証拠がない場合があります。時にはあなたの古い信念が間違っていなかったのです;不完全だったり、文脈に依存していたり、より良い枠組みを待っていたのです。

それは持続可能な記憶システムには好みや要約、修正だけでは不十分であるということです。未解決の記憶が必要です:結論に収束しないであろうもののために場所が必要です.

未解決の記憶は言います.

Do not decide this yet.
Do not forget it either.
Keep the tension visible until the evidence improves.

フルスクリーンモードに切り替えます フルスクリーンモードを終了します

リスクは明らかです:オープンな質問は、より良いフォーマットで遅延につながることがあります。そのため、未解決の記憶には構造、レビューのトリガー、強制解決ルールが必要です。要点は曖昧さをロマンチックにするわけではありません。要点は、それがまだ仕事をしている間だけ不確実性を保つことです.

三層フレーム

記憶の種類 それは 最適な使用方法 典型的寿命 エージェントは次のような状況でそれを表示する 故障モード
要約メモリ 「ここに何が起こったかがあります。」 速い連続性 数日から数週間 タスクは現在の状態のみが必要です 不確実性を削除
修正メモリ 「ここに何が変わったかがあります。」 繰り返しのミスを防ぐ 長持ちするが、古くなったら置き換えられる 現在の計画が既知の失敗を繰り返す 改訂を教義に変える
未解決のメモリ 「ここに残っているものがあります。」 生きた質問を保存する 数週間から数ヶ月、デフォルトで永続的ではない 決定はアクティブな不確実性の境界に触れる 未整理であれば引きずられる

継続性には要約が必要。判断には修正が必要。発見には未解決の記憶が必要

不確実性の構造

良い未解決記憶のエントリは曖昧な自分へのメモではない。推論の時点での知識の状態を保存すべきである:

主要フィールド:

  • 質問:実際に未解決なのは何ですか?
  • タグ / スコープ:どのプロジェクト、ドメイン、または決定に関わるのでしょうか?
  • ライブ解釈:どのような合理的な説明が考えられますか?
  • 不確定の境界:まだ何が分かっていないのですか?
  • さらに証拠が必要です: どのようなことで質問がより鋭いものになるでしょうか?
  • レビュー政策 / TTL: この時期にどのように絞り込まれ、移動するか、あるいは消滅する必要がありますか?

高度なフィールドは、リスクがそれを正当化する場合にのみ:

  • 解釈ごとに信頼範囲: 弱 / 中程度 / 強い、または20-40%のような確率範囲です。
  • 偽装条件: どの解釈を弱めるか、または殺すか?
  • リンクされた記憶:関連する修正、決定、要約、またはゲート。
  • ステータス:オープン、絞り込まれた、ゲートに移動、修正に移動、解決済み、アーカイブ済み。

その構造は不確実性が怠け心になるのを防ぐ。それがなければ、「オープンな心を保つ」というのは決断しないための口実になる。

より良いテンプレート

編集ログの隣にファイルを1つ追加:

open_questions.md

フルスクリーンモードに入る フルスクリーンモードから退出

このコアテンプレートを使用:

## [date] — [question title]
Status:
open / narrowed / moved to gate / moved to correction / resolved / archived

Tags:
[project/domain/decision]

Question:
What is unresolved?

Live interpretations:
1. [Interpretation] — why this is plausible
2. [Interpretation] — why this is plausible
3. [Interpretation] — why this is plausible

Current strongest read:
Which interpretation is leading, and why?

Uncertainty boundary:
What do we not know yet?

Next evidence needed:
What would make this clearer?

Linked memories:
- corrections.md: [...]
- decisions.md: [...]
- gates.md: [...]

Review policy / TTL:
If no new evidence arrives by [date or condition], then [decide / move to gate / archive].

フルスクリーンモードに入る フルスクリーンモードから退出

高リスクの質問の場合は、信頼範囲と偽証条件を追加:

Interpretation: [...]
Confidence: weak / moderate / strong, or [20-40%]
Falsified if: [...]
Debiasing check: what would I believe if this interpretation were inconvenient?

フルスクリーンモードに入る フルスクリーンモードを終了

正確なパーセンテージは偽の精度を生み出す可能性があります。実際に予測を校準している場合のみ使用してください。ほとんどの個人システムでは、範囲やバンドの方が安全です.

具体的な例

プログラミング:

## 2026-05-24 — Is the slowdown algorithmic or data-shaped?
Tags:
search-api, performance, production

Question:
Is the latency spike caused by the algorithm, the data distribution, or the caching layer?

Live interpretations:
1. Algorithmic complexity — moderate — local profiling shows a slower path on larger inputs.
   Falsified if: production traces show constant-time behavior after cache miss removal.
2. Data distribution — moderate — slow requests cluster around unusually large tenant records.
   Falsified if: tenant size does not correlate with p95 latency.
3. Cache behavior — weak — recent cache-key change may be causing misses.
   Falsified if: hit rate remains stable across the spike window.

Current strongest read:
Algorithmic complexity is leading, but production traces are missing.

Uncertainty boundary:
No production profiling sample yet.

Next evidence needed:
Trace p95 requests by tenant size and cache-hit status.

Linked memories:
- corrections.md: "Do not optimize generated assumptions before profiling."
- gates.md: "Performance fix accepted only after p95 improves on production-like data."

Review policy / TTL:
If traces are not collected by Friday, stop debating and instrument first.

Status:
open

フルスクリーンモードを開始 フルスクリーンモードを終了

戦略:

## 2026-05-24 — Is the market wrong, or is the channel wrong?
Tags:
market-entry, distribution, conversion

Question:
Is weak early traction evidence that the market does not want the offer, or evidence that the current channel is wrong?

Live interpretations:
1. Offer weak — weak — no purchases yet, but the sample is small.
   Falsified if: targeted readers save, reply, click, or buy after distribution.
2. Channel mismatch — moderate — the offer has not reached a meaningful targeted sample.
   Falsified if: 100 target readers in the right channel produce no clicks, replies, saves, or buys.
3. Positioning weak — weak — the buyer may understand the topic but not the outcome.
   Falsified if: interviews show the problem is clear and urgent but the offer still feels irrelevant.

Current strongest read:
Channel mismatch is leading, but the sample is not large enough.

Uncertainty boundary:
No reliable click-through, purchase intent, or target-reader sample yet.

Next evidence needed:
100 targeted readers or 14 days of deliberate distribution.

Review policy / TTL:
Review after sample threshold. If no signal, revise positioning before building a second offer.

Status:
open

フルスクリーンモードを開始 フルスクリーンモードを終了

問題は永遠にオープンに保つことではない。問題は、証拠が到着する前に弱い要約が生の仮説を殺さないようにすることだ

検索衛生

オープンな問題はメモリが高価だ。あなたはすべてのセッションにそれらをロードすべきではない

これらのルールを使用する:

  • 現在アクティブなオープンな問題をstate.md.
  • プロジェクト、ドメイン、決定タイプごとに開いている質問をタグ付けします.
  • タスクに一致するタグを持つエントリのみをロードします.
  • ベクトルストアを使用する場合、未解決のアイテムには別の名前空間またはメタデータフィールドを割り当てます.
  • TTLに失敗した質問は証拠を生成せず、減衰またはアーカイブします.
  • 定期的認識的审计を行う:何が開かれていたか、何が狭まったか、何が門となったか、何を殺すべきか?

エージェントシステムの場合、未解決のメモリは明示的なメタデータを持ちます:

epistemic_status: unresolved
confidence_range: [low / medium / high]
review_date: [...]
surface_when: [matching project/tag/decision]

フルスクリーンモードに入る フルスクリーンモードから退出する

埋め込みやベクトルデータベースを使用する場合、未解決のアイテムをフィルタリングできるように保ちなさい。簡単なルールは以下の通りです:タグが重なり、意味的類似性が重要である程度十分である場合にのみ取得する。正確な閾値はあなたのシステムに依存しますが、原則は安定しています:未解決のメモリは関連性に基づいてオプトインされるべきであり、すべてのコンテキストウィンドウにダンプされるべきではない。

Obsidian、Logseq、Mem0、Zep、LangGraph、またはカスタムベクトストアなどのツールにスムーズにマッピングさせたい場合は、フロントマターまたはメタデータを使用してください:

epistemic_status: unresolved
tags: [market-entry, distribution]
status: open
confidence_range: moderate
review_date: 2026-06-07
surface_when: [market-entry, pricing, distribution]

フルスクリーンモードを開始 フルスクリーンモードを終了

それ以外の場合、検索結果が文脈汚染になります。解決されていない質問が多すぎると、エージェントが遅くなり、騒がしくなり、運用コストが高くなります。

ライフサイクルは重要です

ファイルは別々の箱ではありません。エントリは移行します:開かれた疑問は狭くなり、分かれ、ゲートになる、修正になる、または新しい証拠の後再開することができます.

移行経路:

open question
  -> gate when the question becomes testable
  -> correction when evidence changes behavior
  -> decision when a path is chosen despite uncertainty
  -> archived when no longer decision-relevant
  -> reopened when new evidence changes the frame

フルスクリーンモードに入る フルスクリーンモードから退出する

例のライフサイクル:

open_questions.md
Question: Is the product weak, or has distribution not reached the right readers?
Status: open until 100 targeted readers or 14 days.

gates.md
Gate: If 100 targeted readers produce no clicks, saves, replies, or buys, revise the positioning.

corrections.md
Correction: "Shipping is not conversion." Publishing created an asset; distribution remained untested.

decisions.md
Decision: Keep the product live at $12 while testing distribution; reject building a second product until the gate resolves.

フルスクリーンモードに入る フルスクリーンモードから退出する

100人のターゲット読者に強く反応しても誰も買いませんでしたら、問題は再開できます:

open_questions.md
New question: Is the article strong but the Gumroad page under-converting?

フルスクリーンモードを開始 フルスクリーンモードを終了

あなたはいつも古い信念を置き換えるわけではありません。時には文脈を与えたり、それらを狭めたり、新たな証拠の下で再開したりします。

質問文

力は三つのファイルを持っていることではなく、それらを議論させることです。

このプロンプトを使用してください:

Read state.md, corrections.md, gates.md, and open_questions.md.
Use only open questions whose tags match the current task.
For each relevant open question:
- Check whether it conflicts with a previous correction or active gate.
- Classify it as productive uncertainty, retreaded error, lingering task, or avoidance.
- Flag anything older than 30 days without new evidence or a reviewed TTL.
- Separate what is known from what is assumed.
Do not resolve the question unless the missing evidence is present.

フルスクリーンモードに入る フルスクリーンモードから退出する

これは最も大きな失敗パターンを捉えます:「未解決」というマスクを使って、答えを受け入れたくないことを隠していること

反パターン

未解決のメモリも腐敗する

  • 無限の開放性 / 意味不明症__JHSNS_SEG_82c856b8_138__十分かりました。以下のように翻訳いたします。 十分な証拠があるのに、不承認を洗練された態度として扱う。
  • 曖昧な直感:テスト可能にするものを名前をつけずに、その感覚を保つ。
  • バランスの取れすぎより強い証拠がある場合、あらゆる解釈を同等に扱う
  • アイデンティティ保護的確信不確実性: 問いを開放したままにしているのは、結論が出ると自己、投資の損失、イデオロギー、あるいは自己イメージが脅かされるからだ。
  • 評価のトリガーなし: 終わらない開放されたループを作り、仕事に戻らない。
  • 選択の関連性なし: 未来的な行動に影響しない問いをアーカイブする。

修正は優先度分類です。すべての開放された質問にはレビューのトリガー、証拠のターゲット、または決定のリンクが必要です。質問が将来の決定に影響を与えられない場合、それはファイルに含まれるべきではないかもしれません.

プライバシーとチームの文脈

開かれた質問はしばしば修正よりも機微がある。修正は何が間違っていたかを説明する。開かれた質問は何が間違っている可能性があるかを説明する:戦略、能力、関係、市場、アーキテクチャ、またはタイミングに関する疑念。未解決の記憶をデフォルトでプライベートに保ち、各クラウドエージェントにロードしない。公開例と実際の記録を分ける.

チームやマルチエージェントシステムにおいても、未解決の記憶には所有権が必要である:

  • 誰がその質問の所有者ですか?
  • 誰がそれを解決できますか?
  • どのような証拠基準が必要ですか?
  • どのユーザーやエージェントがそれを見ることが許可されるべきですか?

所有権と解決権限がないと、共有されているオープンな質問は政治的な霧となります。

それが機能しているかどうかを知る方法

システムを洗練度ではなく行動で測定します。追跡:

  • 証拠が到着するまで延期された決定、
  • 開放された疑問からゲートへ移行した仮説、
  • 解決された疑問から生じた修正、
  • 繰り返しのミスを回避、
  • 時間とともに予測の精度、
  • レビューがトリガーされた後のプロジェクトの結果。

開かれた質問が決定を変えないならば、それは飾りです。もし適切な決定を遅らせ、適切な閉鎖を加速するならば、それはインフラです。手動設定の場合、システムが新しい間は2週間ごとに監査を行い、安定したら月に1回行います。プロジェクトあたり5つのアクティブな質問で十分です;それ以外はアーカイブ、ゲート、決定、または修正に移動するべきです.

監査中には、次のように尋ねます:

  • どの開放問題が決定を変えたか?
  • どれには新しい証拠がないか?
  • どれはそのTTLよりも古いか?
  • どれがゲート、修正、決定、またはアーカイブになるべきか?
  • どれを開放したくて、答えが面倒だから?

30日以内に解決または移行する開放問題の割合と、解決した問題が後で繰り返しのミスを防いだ割合の2つの有用なKPIです。

ソースと隣接作業

本記事は不確実性管理が新しいことを主張しているわけではありません。リチャードズ・ヒュアーによるインテリジェンス分析の心理学 情報活動における競合仮説の形式化分析。フィリップ・テトロックとグッド・ジャッジメント・プロジェクトは、キャリブレーション、確率更新、予測の規範をより広い聴衆に理解できるものにしました。科学には検証、競合モデル、同行審査があります。工学にはインシデントの後処理と意思決定記録があります。法廷には括弧書き、証拠基準、未解決の事実問題があります。

ここでのポイントはより狭いものです:個人AIメモリシステムには同じ規律が必要です。もし認識的地位、不確実性の境界、レビューのトリガーを保存しなければ、未解決の疑問を自信を持った要約に圧縮してしまいます.

関連する研究価値のある分野:

今夜からどう始めるか

open_questions.mdを作成する.

解決できないが、何度も考えを巡らせている質問に対して1つのエントリを書く.

四つのルールを使用:

  • 少なくとも二つのライブ解釈を名前をつける。
  • 各解釈に信頼区間と偽装条件を与える。
  • 何の証拠が不足しているか名前をつける。
  • TTLまたはレビュートリガーを名前をつける。

その後、あなたのエージェントに尋ねる:

Read open_questions.md.
Tell me which current decision is being treated as settled even though the record says it is still unresolved.
Tell me which open question is productive uncertainty, and which one is avoidance.
Do not resolve a question unless the missing evidence is present.

フルスクリーンモードに入る フルスクリーンモードを出る

エージェントが適切な場所であなたを遅らせる場合、ファイルは機能しています。


修正メモリは失敗したことを繰り返さないで保護します。未解決のメモリは、まだ理解されていないものを殺さないで保護します。

これは訂正記憶フレームワークの第二層です:推論の時点での知識の状態を保持すること、すなわち何が知られていたか、何が推論されたか、何が議論されたか、そしてまだ欠けていた証拠が何かを含みます。