慣性聚合 関心のあるブログ、ニュース、テクノロジーを効率的に追跡
原文を読む 慣性聚合で開く

おすすめ購読元

Google DeepMind News
Google DeepMind News
人人都是产品经理
人人都是产品经理
M
MIT News - Artificial intelligence
博客园 - 叶小钗
MyScale Blog
MyScale Blog
V
Visual Studio Blog
月光博客
月光博客
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
量子位
I
InfoQ
有赞技术团队
有赞技术团队
阮一峰的网络日志
阮一峰的网络日志
Jina AI
Jina AI
V
V2EX
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
Blog — PlanetScale
Blog — PlanetScale
Last Week in AI
Last Week in AI
雷峰网
雷峰网
Stack Overflow Blog
Stack Overflow Blog
博客园 - Franky

DEV Community

Authentication Security Deep Dive: From Brute Force to Salted Hashing (With Java Examples) Why AI Systems Don’t Fail — They Drift Spilling beans for how i learn for exam😁"Reinforcement Learning Cheat Sheet" I Replaced Chrome with Safari for AI Browser Automation. Here's What Broke (and What Finally Worked) How Python Borrows Other People's Work The $40 Architecture: Processing 1 Billion API Requests with 99.99% Uptime Vibe Coding: A Workflow Guide (From Zero to SaaS) Most webhook security guides protect the wrong side. The scary part is delivery. Headless CMS for TanStack Start: Build a Blog with Cosmic EU Age Verification App "Hacked in 2 Minutes" — What Actually Happened Comfy Cloud’s delete function does not actually remove files Running AI Models on GPU Cloud Servers: A Beginner Guide Event-driven media intelligence with AWS Step Functions and Bedrock I scored 500 AI prompts across 8 quality dimensions — here's what broke How to Call Google Gemini API from Next.js (Free Tier, No Backend Needed) The Portal Protocol: Reclaiming Human Connection in the Age of AI How to Fix Your Team's Scattered Knowledge Problem With a Self-Hosted Forum Intro to tc Cloud Functors: A Graph-First Mental Model for the Modern Cloud Designing Multi-Tenant Backends With Both Ownership and Team Access I Built a Neumorphic CSS Library with 77+ Components — Here's What I Learned PostgreSQL Performance Optimization: Why Connection Pooling Is Critical at Scale Cómo construí un SaaS multi-rubro para gestionar expensas en Argentina con FastAPI + Vue 3 🚀 I Built an Ethical Hacking Scanner Tool – Open Source Project I Replaced /usage and /context in Claude Code With a Single Statusline A Pythonic Way to Handle Emails (IMAP/SMTP) with Auto-Discovery and AI-Ready Design I Collected 8.9 Million Polymarket Price Points — Here's What I Found About How Markets Really Move EcoTrack AI — Carbon Footprint Tracker & Dashboard Everyone's Using AI. No One Agrees How. 5 self-hosted ebook managers worth trying in 2026 Building Your First AI Agent with LangChain: From Chatbot to Autonomous Assistant Common SOC 2 Failures (Real World) Stop Vibe-Checking Your AI App: A Practical Guide to Evals How to Use SonarQube and SonarScanner Locally to Level Up Your Code Quality Your Next To-Do App Is Dead — I Replaced Mine with an OpenClaw AI Sign a Nostr event in 60 lines of Python using coincurve — no nostr-sdk, no nbxplorer, no rust toolchain ITGC Audit Explained Like You’re in Big 4 Patch Tuesday abril 2026: Microsoft parcha 163 vulnerabilidades y un zero-day en SharePoint Stop scraping everything: a better way to track competitor price changes Listing on MCPize + the Official MCP Registry while routing payments OUTSIDE the marketplace — how I kept 100% of my x402 revenue Building an AI-Powered Risk Intelligence System Using Serverless Architecture Why We Ripped Function Overloading Out of Our AI Toolchain Testing AI-Generated Code: How to Actually Know If It Works SaaS Churn Is Killing Your Business. Here Is What to Do About It (Without a Support Team) The Speed of AI Is No Longer Linear - And Self-Improving Models Are Why How to Implement RBAC for MCP Tools: A Practical Guide for Engineering Teams From Standard Quote to Persuasive Proposal: AI Automation for Arborists I built a CLI that scaffolds complete multi-tenant SaaS apps Axios CVE-2025–62718: The Silent SSRF Bug That Could Be Hiding in Your Node.js App Right Now The dashboard that ended our friendship Data Pipelines Explained Simply (and How to Build Them with Python)
AIエージェントの失敗ループ:継続が品質バグになる時
Gregory Shev · 2026-05-25 · via DEV Community

2026年、私のAIコーディングエージェントにはもう一つのルールを加えたい:やめときめるタイミングを知る

AIエージェントは常に失敗することはない

時には継続することで失敗する

これは実際のブランドシステム用にカスタムのキリル文字フォント拡張を作る際に直面した問題だった。タスクは具体的に見えた:キリル文字、ラテン文字、数字、特殊記号が一つの編集タイプファミリーのように感じさせる

Claude CodeとCodexは引き続き動いていました。ファイルを生成し、証明書をエクスポートし、進捗を報告し、最後の目に見える不満を修正しました.

しかし、同じ欠陥の種類が繰り返し発生していました.

これはAIエージェントの失敗ループの危険なバージョンです:ワークフローは生産的に見えますが、実際の品質問題は生存しています.

失敗ループとは何ですか?

失敗ループとは、エージェントが同じ根本的な欠陥が解決されないまま、新しい候補の修正を繰り返し生成するパターンです。

通常、以下の5つのステップで構成されています:

  1. ユーザーが同じ種類の欠陥を再度拒否します。
  2. エージェントが最新の症状を修正します。
  3. 証明ゲートは問題を捉えるのに十分に弱いです。
  4. エージェントが別の手動レビューを要求します。
  5. 同じ問題にまた一つのサイクルを費やす.

一つの間違いは普通.

実際のプロセスのバグは、エージェントが検証システムがすでに失敗した後に続けたときに現れる.

なぜ通常の証明ループが失敗するのか

証明ループは有用だ。テスト、スクリーンショット、ビルドチェック、リンティング、差分、生成報告書などがすべて重要だ.

しかし証明ループは、測るものが間違っている場合にも芝居のようになる。

私のフォントプロジェクトでは、エージェントがフォントがコンパイルされたことを証明し、PDFがレンダリングされたことを証明し、スクリーンショットが存在することを証明し、バウンダリングボックスが変更されたことを証明し、数値スコアが向上したことを証明した。

しかし、それは文字が正しく見えたことを証明していなかった。

ユーザーは別のものを拒否していた:視覚的な一貫性。

ルシアン文字の一部がラテン文字と比べて、あまりにも短く、太すぎ、間隔が広すぎ、または構造的に間違って見えた。

ゲートが人間が見ている欠陥を見ることができないならば、ゲートは作業完了を宣言するのを許されない。

今私は使っているルール

同じ可視的な欠陥のクラスが2回現れた後、通常の実装を停止する。

もう一つ推測的なパッチを作らない。

閾値を緩めるな.

他の候補物を確認するようユーザーに尋ねるな.

失敗ループブレーカーモードに切り替えろ.

失敗ループブレーカーがやること

失敗ループブレーカーはAIエージェントの作業のためのハードモードスイッチだ.

より良い次の出力は候補の修正ではなく診断パッケージだ.

それは次のものを含むべきだ:

  1. 繰り返し失敗するクラス;
  2. 拒否された既知の悪い例のコーパス;
  3. それらの例で失敗する赤い最初のゲート;
  4. ゲートを緑にする修正;
  5. 著者が答えを見たときの無視または独立した検証;
  6. 明確な続行、停止、または人間の決定推奨;

これは再試行の制限だけではない。

リトライ制限はコスト増加を防ぐ。失敗ループブレーカーは作業そのものを変更する.

赤優先ゲートは重要

有用なゲートは修正される前に失敗しなければならない、なぜならそうでなければ古い失敗を見ることができるかを証明していないから.

エージェントが以前の不良アーティファクトで新しいチェックャーを失敗させることができない場合、それは真の問題のためにチェックャーを構築していない.

多くのエージェントワークフローはこの部分をスキップする。

新しい指標を追加し、新しい候補がより高いスコアになったのを見て、それを進歩と呼ぶ。この指標は決して古い失敗を拒否する必要はなかった。

主観的または視覚的なタスクでは、これがさらに重要になる because 拒否されたコーパスは人間の好みと決定的な検証の橋となる。

エージェントが汚染されたとき

別の落とし穴は汚染された検証です:同じエージェントが修正を書き、ターゲットを知り、結果を評価します

それはイテレーション中には有用かもしれませんが、それは独立した検証ではありません。

エージェントがすでに期待される答えを見た場合、最終的なチェックには保留された例、盲目のレビュラー、作成者の推論を受け取らない別のモデル、または要求が計算ではなく好みである場合の人的決定という確定的なゲートが必要です.

同じ著者の検証はしばしば自己一貫性であり、証明ではありません.

これは小さな公開スキルとしてパッケージ化しました

ルールを小さな公開リポジトリに変換しました:

https://github.com/g-shevchenko/agent-failure-loop-breaker

Claude Code、Codex、Cursor、およびWindsurf用にコンパクトなスキルとリポジトリローカルルールをインストールします。

インストールされるルールは意図的にシンプルです:

同じ欠陥クラスが2回出現した場合、エージェントは通常のパッチングを停止し、拒否されたコーパスと赤を優先するゲートを構築してから続行する必要があります。

このパッケージはモデルをより賢くするために作られたものではありません.

それはワークフローが動きを進歩と混同しにくくするものです.

会社が間違えるところ

チームは通常、エージェントの持続性を資産として扱います.

明確な範囲で実装されたタスクに強いテストがある場合、それは合理的です。受け入れ基準が視覚的、編集的、アーキテクチャ的、または運用的な作業ではリスクがあります。

Claude Code、Codex、Cursor、またはWindsurfが同じ種類のレビューで常に失敗する場合、次の投資は検証契約に向けたべきです。

世界で最も良いプロンプトでも、ゲートが間違ったアーティファクトを報酬するとループします。

この点で役立つ

このパターンはUIポリッシュループ、ビジュアルリグレッション作業、PDFとプレゼンテーション生成、タイポグラフィシステム、コンテンツQA、および同じバグが繰り返されるエージェントコーディングタスクに有用です。

ここにシグナルがあります:

ユーザーが「これがまだ同じ問題だ」と2回言うと、プロセスは変わるべきです。

実用的な要点

AIエージェントに「続けろ」と永遠に頼まないで

そのチェックャーが最後の失敗した試行を捉えることを証明するように頼んで

もしできなければ、次のタスクは実装ではない

その時点で、次のタスクはより良いゲートを作ること

詳細な記述:

https://gregshevchenko.com/notes/ai-agent-failure-loop-breakers/