惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

F
Full Disclosure
Scott Helme
Scott Helme
U
Unit 42
G
Google Developers Blog
Microsoft Azure Blog
Microsoft Azure Blog
P
Privacy & Cybersecurity Law Blog
The GitHub Blog
The GitHub Blog
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
Webroot Blog
Webroot Blog
C
CERT Recently Published Vulnerability Notes
Simon Willison's Weblog
Simon Willison's Weblog
WordPress大学
WordPress大学
S
Securelist
S
SegmentFault 最新的问题
Y
Y Combinator Blog
P
Privacy International News Feed
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
P
Proofpoint News Feed
M
MIT News - Artificial intelligence
Know Your Adversary
Know Your Adversary
Stack Overflow Blog
Stack Overflow Blog
C
Check Point Blog
Martin Fowler
Martin Fowler
V
Vulnerabilities – Threatpost
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
小众软件
小众软件
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
云风的 BLOG
云风的 BLOG
T
The Blog of Author Tim Ferriss
H
Help Net Security
Engineering at Meta
Engineering at Meta
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Recorded Future
Recorded Future
V2EX - 技术
V2EX - 技术
S
Security @ Cisco Blogs
IT之家
IT之家
T
Tenable Blog
Recent Announcements
Recent Announcements
P
Proofpoint News Feed
Blog — PlanetScale
Blog — PlanetScale
T
Tailwind CSS Blog
I
InfoQ
GbyAI
GbyAI
月光博客
月光博客
S
Security Affairs
G
GRAHAM CLULEY
Cloudbric
Cloudbric
TaoSecurity Blog
TaoSecurity Blog
Application and Cybersecurity Blog
Application and Cybersecurity Blog
T
Troy Hunt's Blog

LINUX DO - 最新话题

谷歌云盘下载700g数据集,求方法 OpenAI推出了100美元的Pro订阅后,plus的Codex 5小时限额大幅缩水 之前买的super grok居然还没掉 关于CPA认证文件周限 佬们,默认CDK的要求是什么等级啊? 最新版本的微信群聊机器人方案 有没有人知道如何free号没有封,那么是否可以循环使用,因为我看主要是周限 L站改版了?吓我一跳,我以为我浏览器崩了 淘宝这种宽带可信吗,500兆移动宽带月费8元到2099年 docker内部应用访问宿主机mysql和redis时被拒绝connection refuse Erp全栈想转行做Ai有什么推荐的吗 boost有bug 佬们,有没有靠谱点的 Plus 购买渠道 大妈,狗妈用的 lg 服务有源头开源项目吗? 有人有能过验证码打码的嘛 上次帖里好像发过通过大模型来打码的 gpt plus 封号似乎也太快了点,一天就给封号了 按流量/token收费的国产官方AI推荐 我算是知道了为什么Oracle总是ABC了 佬友们帮我分析一下 ChatGPT Team账号只有一个人使用和4个席位邀请满了使用的总额度是一样的吗? gpt-free 10个带rt CPA反代claude是默认1m吗? 我终于敢说我做出来windows上tmux的替代了,目标windows/全平台最强的终端Ai编程工具 claude pro升级max,除了原来的$20,好像还能再领一次$100 关于AI agent的知识框架 独乐乐不如众乐乐,分享一下我的的AI对话程序 佬们自建网站支付问题是怎么解决的 怎么能让gpt模仿claude风格输出 codex free已经死了,下一个会是plus或者team吗 请问chatgpt pro里的fast模式,速度快了,降智吗 天才程序员想要复活,还有可用的codex公益站么 里斯本丸沉没照进现代了 [富可敌国] [一叶知秋API]友仔们 我们换域名了~~ 记得更新一下哦 有点莫名其妙,被阿里云警告了 从道观回家之前,我和师兄问道 【picpi 皮皮公益站】为了防止有人拿去卖,邀请码发放规则更新。 美国 FAA: 我们需要你,游戏玩家,来当空管吧 vibe时用文言省tok吗? 有没有用? 会降表现吗? Codex CLI 官方这个 imagegen 的 Skill 到底是干啥的?哪有对应工具啊? 求问关于尼区和美区开通Claude 换设备登录telegram国内号码老账号 需要收费咋办? 发现hotmail的额度特别耐用 最近还有能正常用的claude中转站吗? 避雷闲鱼上面的CC中转站 现在cursor的优势是什么呢? OpenAI 回应马斯克要求罢免奥尔特曼:搞法律突袭,扰乱诉讼 谁在吹opencode go套餐啊,又慢量又少 【SamAltman】奥特曼被燃烧瓶袭击后的回应 咸鱼上359买的claude MAX 5x ,美国假家宽,看看能活几天 想问问跳蚤市场开的Pro和Plus 虚拟卡链接求助 [开源插件] 做了一个适合科研佬的GPT插件 【AI小说】拿AI跑了一部小说,佬们看看质量怎么样 总是能在首页看到opus4.6鞭尸推送 这个别名邮箱可以注册gpt 一个人在外地的话,佬们周末都做什么 你们ddg还能行不 获取不到新的邮箱 了····· claude code修复codex windows升级0.120.0 无法打开问题 我现在Zeabur上搭建了CPA服务,怎么再接入new api来做分发 杭州有么有佬友在搞AI应用这块的,四年前端转AI开发 汇丰、渣打两家银行获得香港稳定币牌照 【开源推广】 AIUsage:聚合多个 AI 平台配额与用量的 高颜值 macOS端 CPA看板 APP Newapi吃服务器内存多吗 中行跨境通疑限制无卡连续交易 或为应对盗刷 突然不能用表情回应话题了 codex是不是降额度了 反馈关于 “快问快答”标签的乱象 opencode版本1.4.3 无法上传图片问题 想问一下怎么解决这个问题,就是终端太多? codex更新到0.120.0之后无法加载以前的会话 sub2api怎么部署? 分享一个自用的南京继续教育平台视频自动播放下一集的油猴脚本 zotero9出来了 Claude正在向我推销付费项目,那能让你轻易得逞嘛 甲骨文用脚本开出来4个2+12咋办啊佬们,我还是免费号 各个厂的coding plan lite都绝版了? claude code 20美金账户问题 联通元景套餐续费问题 ai时代下的一些思考(诚邀大家讨论) 出境易GPT订阅pro求助 今年到目前股市的操作。 刚收到短信之前跑路的那家可以兑换了 佬们都用境外服务器做什么呢? 甲骨文4+24 求助领pro时候报错-付款页面出错。请重试。如果问题依然存在,请访问help.openai.com。 cloudflare 浏览器渲染增加了 CDP与mcp支持 SUB2API 导入 rt 时报错显示 Request failed with status code 502 如何解决 讨论一下怎么整理笔记 codex0.120.0更新后无法启动,回退 0.119.0正常使用 冰佬的公益站也不行了吗 三角洲直接给我封了10年 有佬友知道怎么起诉么 88VIP邀请 经过排查大概确定反重力代理报错问题了 【求助】openrouter 今年4月用国内visa卡充值后导致封禁,无法使用外国模型 奥特曼家被炸 自用,高信息量回复收集 求助sub2api分组问题 【新人报道】注册成功了 分享100个codex free账号 招聘 深圳客户端开发(flutter) 20k+
深度研究了下,发现Claude 上下文与长期记忆不适合国产ai
豆豆哥🌹 · 2026-04-28 · via LINUX DO - 最新话题
一直感觉cc有时候没有那么强,国产ai没那么弱,但是就是cc挺好用,最近没事研究了下cc的泄漏源码,我发现 Claude cli的长期记忆,本质上仍然是“把记忆塞回上下文”。它没有真正跳出上下文窗口,只是在上下文窗口快爆炸时,用更复杂的摘要、更聪明的筛选、更贵的模型调用,继续维持这个旧范式。 所以claude更适合这套模型,在国产上下文注意没那么集中的用cc反而在一轮轮的压缩后降智(opus4.7也是同理), Claude cli 的上下文更像一个临时工作台,里面同时堆着: 系统指令 用户当前请求 历史对话 工具定义 工具调用结果 文件片段 项目信息 环境信息 记忆文件 压缩摘要 会话状态 模型需要遵守的行为规则 这些东西最终都会进入同一个窗口。 这个窗口就是模型当前能“看见”的世界。 模型不知道窗口外发生了什么。窗口外的东西如果没有被重新召回、重新摘要、重新拼进 prompt,它对模型来说就不存在。 所以 Claude cli的上下文管理,核心不是“记忆”,而是“窗口资源调度”。 它要不停决定: 哪些历史消息还值得保留 哪些工具结果必须留下 哪些文件片段要塞进去 哪些记忆可能相关 哪些内容可以摘要 哪些内容可以丢掉 什么时候必须压缩 这套系统的目的不是让模型真正拥有长期记忆,而是让模型在有限窗口里尽量不要失忆得太严重。 长期记忆看起来有很多层。 1. 静态记忆,用来记录用户偏好、项目背景、长期规则。 2. 会话记忆,用来总结当前任务进展、关键文件、错误修复、待办事项。 3. 自动提取,用来从对话中抽取值得保留的信息。 4. 跨会话整理,用来把零散记忆合并、剪枝、重写。 5. 它还有团队记忆,用来在多人场景里共享某些知识。 长期记忆最终还是要变成文本,被塞回上下文,才能被模型使用。 这意味着 Claude cli的长期记忆不是一个独立的知识系统,而是上下文的附属品。 它的记忆不是“模型真正知道了什么”,而是“这次 prompt 里有没有把相关内容带上”。 要是没有带上,记忆就等于不存在。 带错了,记忆就会污染推理。 带多了,上下文就会膨胀。 压缩了,就会丢失细节。 Claude cli真正的问题:它把上下文当成大脑 功能太多,但都围绕同一个旧假设展开: 模型的大脑就是上下文窗口。 这个假设在短任务里成立。 写一个函数、改一个文件、回答一个问题,窗口足够大,摘要足够准,体验可以很好。 但一旦任务变长,项目变复杂,记忆变多,团队协作变频繁,这个假设就开始崩塌。 因为上下文窗口不是大脑。 它只是一次推理的输入缓存。 把更多东西塞进缓存,不会变成真正的长期理解。 把旧内容压缩成摘要,也不会变成稳定的知识。 把记忆写成 Markdown,也不会自动变成可验证、可更新、可检索、可审计的记忆系统。 Claude cli的上下文越强,它越容易让人误以为问题已经解决。 但本质上,它只是把“失忆”推迟了,把“遗忘”包装成了“压缩”,把“重新阅读”包装成了“长期记忆”。 Claude 就是长期记忆很太依赖记忆文件。 这种方式简单、透明、容易被模型读取。 但文件不是系统。 文件只解决“放在哪里”,没有解决“如何变成可信记忆”。 真正的长期记忆至少要回答这些问题: 这条记忆从哪里来? 什么时候产生? 为什么重要? 是否已经过期? 是否与其他记忆冲突? 是否被用户确认过? 是否应该只对当前项目生效? 是否应该对所有项目生效? 是否被模型多次使用过? 使用后是否证明有效? 是否应该合并、降权、归档或删除? Claude cli记忆md文件可以承载信息,但无法天然承担这些治理能力。 一旦记忆变多,它就会变成另一种技术债: 旧偏好污染新任务。 过期事实继续生效。 重复记忆互相打架。 全局规则误伤局部项目。 模型写入的内容用户没有检查。 最后,长期记忆不再是优势,而变成 prompt 里的长期噪声。 **这样深度研究下去,就会发现Claude cli的架构不适合国产模型** Claude cli的能力很强,但强在 Claude 生态里。 它围绕 Claude cli的上下文窗口、工具调用、推理格式、缓存能力、模型选择和云端服务建立。 这对 Claude 是优势。 对国产模型 就是负担。 国产模型生态的现实是: 不同厂商的工具调用格式存在差异 reasoning 内容输出方式不统一 中文 token 计算差异明显 上下文窗口和真实可用上下文不完全一致 流式输出字段不稳定 企业经常需要自定义网关和私有化部署 数据不能默认进入海外云服务 Claude cli 面向多模型的时候,就没有那么好用了。 更长上下文救不了这个问题 很多人以为,只要模型上下文足够长,长期记忆就不再需要了。 这是不准确的。 更长上下文只会推迟问题,不会解决问题。 因为长期工作的问题不是“能不能塞进去”,而是: 怎么判断什么重要? 怎么保证旧信息不过期? 怎么处理冲突? 怎么让用户审查? 怎么跨模型复用? 怎么跨设备同步? 怎么保护隐私? 怎么让记忆持续变好? 怎么让上下文只包含当前真正需要的内容? 上下文越长,噪声越多。 噪声越多,模型越容易被干扰。 把所有历史都塞进去,是懒的表现。 真正的长期记忆不是无限上下文。 真正的长期记忆是选择、组织、更新、检索、验证和遗忘。 新的设计 借鉴 Claude cli:上下文工程、任务状态、自动压缩、会话恢复、工具结果整理。 批判 Claude cli:最终还是把能力压回上下文窗口。 借鉴 Mem0:记忆创建、搜索、更新、删除、作用域、元数据、语义召回、关系和冲突。 维度 Claude/all 新设计 核心范式 上下文窗口中心 长期记忆系统中心 记忆形态 文本文件和摘要为主 结构化、本地化、可治理 使用方式 召回后塞进 prompt 先检索、再筛选、再编译上下文 压缩本质 摘要历史 迁移状态 用户控制 有限可见 可视化、可编辑、可审计 模型绑定 深度适配 Claude 面向多模型和国产模型 数据主权 强依赖生态能力 本地优先,可私有化 长期演进 容易变成 prompt 负债 可以持续整理、合并、降权和遗忘 本设计最核心的创新点: BFS 跨链历史追踪 当记忆经过 合并或 Compacted 压缩后,传统系统会丢失源记录的历史。新的设计通过 BFS 遍历事件链中的 source_ids 引用,自动追踪完整来源 具体的细节设计下次单独开一篇再说吧, 目标就是更贴合更符合国产ai 让国产ai也能真正的能长时间运行并且不丢失上下文 附上几张还在开发的图, 不需要推广 6 个帖子 - 4 位参与者 阅读完整话题