
























做过几个长一点的 Agent 之后,越来越感觉到一件事:上下文的问题,不只是“放什么进去”,还有“什么时候把没用的东西拿出去”。 这几年从 Prompt Engineering 讲到 Context Engineering,Memory、RAG、Tool、History、Plan,这些东西都在往上下文里塞。目标也很清楚,就是让模型在当前这一步看到更有用的信息。 一旦 Agent 跑久了,上下文就会开始变脏。工具调用多了,重试多了,草稿多了,旧结论也还在。它们不一定是错的,只是后面已经用不上了,可还是一直占位置。最后的结果往往不是“模型突然变笨”,而是它被一堆没必要的历史拖着走。 从我个人的视角,更愿意把这件事拆成两半看: Load:把该放的放进去 Unload:把不该留的拿出去 现在大家基本都在讲 Load。但如果一个 Agent 要长时间跑,Unload 迟早要补上。否则你会发现,问题不是上下文不够大,而是上下文太乱。 我把这件事再往下拆,分成四层。 L0:消息级裁剪 最细的一层,直接删消息。这个操作给到了Agent,达到阈值后,引导Agent自主决策。 比如某条消...
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。