惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

H
Help Net Security
T
ThreatConnect
SecWiki News
SecWiki News
F
Future of Privacy Forum
AWS News Blog
AWS News Blog
C
Cisco Blogs
A
Arctic Wolf
Vercel News
Vercel News
The GitHub Blog
The GitHub Blog
Scott Helme
Scott Helme
V
V2EX
博客园 - 叶小钗
阮一峰的网络日志
阮一峰的网络日志
K
Kaspersky official blog
G
Google Developers Blog
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
P
Privacy International News Feed
C
Cyber Attacks, Cyber Crime and Cyber Security
N
News | PayPal Newsroom
Schneier on Security
Schneier on Security
NISL@THU
NISL@THU
Microsoft Azure Blog
Microsoft Azure Blog
量子位
The Hacker News
The Hacker News
Stack Overflow Blog
Stack Overflow Blog
Security Latest
Security Latest
M
Microsoft Research Blog - Microsoft Research
Google Online Security Blog
Google Online Security Blog
博客园_首页
C
CXSECURITY Database RSS Feed - CXSecurity.com
I
InfoQ
Google DeepMind News
Google DeepMind News
Y
Y Combinator Blog
The Cloudflare Blog
Microsoft Security Blog
Microsoft Security Blog
Martin Fowler
Martin Fowler
Cisco Talos Blog
Cisco Talos Blog
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
T
Troy Hunt's Blog
F
Fox-IT International blog
S
Security @ Cisco Blogs
博客园 - 司徒正美
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
C
Comments on: Blog
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
L
LINUX DO - 最新话题
GbyAI
GbyAI
Project Zero
Project Zero
腾讯CDC
T
Tailwind CSS Blog

博客园 - iTech

Google 开源分布式 Agent 运行时 AX:让 AI Agent 像微服务一样可靠 不用 Embedding 也能做知识 Agent?Vercel 用文件系统干掉了向量检索管线 AI 技术日报 - 2026-05-25 Hermes Agent 接入 Microsoft Teams 全指南:6 步让你的 AI Agent 进群聊 Understand Anything:把任何代码库变成可交互知识图谱,23k star 的 AI 编程理解神器 腾讯开源 openclaw-weixin:让你的 AI Agent 直连微信,扫码即用 什么是 Agent-Native?如何把你的网站升级成面向 AI Agent 的网站 AI 技术日报 - 2026-05-24 Claude Code 为什么放弃 RAG 用 Grep 搜索代码?大型代码库最佳实践全解析 DeepSeek V4 Pro 永久降价 75%:旗舰推理模型进入白菜价时代 Runtime (YC P26):给每个团队配一个沙盒 AI Agent,产品经理也能提 PR Models.dev:查 AI 模型价格不用再开十几个网页了,4,844 个模型一站式对比 Superset (YC P26):Agent 时代的全新 IDE,同时跑 10 个 Claude Code 互不干扰 AI 技术日报 - 2026-05-23 3.5 个月 4.3 万 Star:nanobot 凭什么成为最火的开源 AI Agent CodeGraph:给 AI 编程助手装上代码知识图谱,省 35% 费用、减少 70% 工具调用 AI Engineering from Scratch:435 节课从线性代数到自主 Agent,每个算法手写一遍 Lucarne:不用盯着电脑也能掌控 AI Agent,微信/Telegram 远程遥控本地编码助手 财富正在向 AI 集中:三个万亿级 IPO 同场竞技,一场前所未有的造富运动 程序员必备核心技能手册:从 Linux 到 Docker 的实战速查 Deep:DeepSeek 版的 Aider / Claude Code,开源 CLI 编程工具新选择 AI 技术日报 - 2026-05-22 PUA vs NoPUA:用恐惧还是用爱驱动 AI Agent?一场 17000 Star 的路线之争 Anthropic 停招 L6 以下:当最强 AI 公司自己都不招初级工程师了 CLI for Microsoft 365 实战:用命令行操控 Teams 收发消息 面试 AI Agent 工程师会被问什么?40+ 真题 + 知识图谱全梳理 7 个标准正在重塑 AI 开发:从 MCP 到 AG-UI,一文看懂 Agent 时代的协议栈 SpaceX IPO:史上最大上市案,1.75万亿到2万亿美元的估值到底买了什么? DeepSeek 悄悄挂出 Agent Harness 岗位:Model + Harness = Agent,要做智能体产品了? AI 技术日报 - 2026-05-21 Claw 和 Hermes 精选 10 个零成本 Skills:让 AI Agent 能力翻倍 Stainless:AI 时代最被低估的幕后公司,你用的每个 SDK 可能都出自他们之手 飞书 CLI vs 企业微信 CLI vs 钉钉 CLI:三大办公平台终端工具横评 12-Factor Agents:从 21k Star 的开源项目看 AI Agent 的正确构建姿势 AI 技术日报 - 2026-05-20 Semble:让 AI Agent 搜代码的 Token 消耗直降 98%,怎么做到的 CloakBrowser:15k Star 的隐形浏览器,49 个 C++ 补丁干翻所有反爬检测 AI 技术日报 - 2026-05-19 面向 Agent 的软件开发:当软件的第一用户不再是人类 8MB 内存跑 AI 编程代理?Zerostack 用纯 Rust 证明:Agent 不需要那么重 AI 技术日报 - 2026-05-18 AI 技术日报 - 2026-05-17 AI 技术日报 - 2026-05-16 Anthropic 发布创始人手册:AI Native 公司不是多招几个工程师,是换一种活法 "不用 AI 就会被淘汰"——这是我听过最懒惰的恐吓 0.79ms 创建一个安全沙箱:zeroboot 用 COW 打穿 AI Agent 隔离的性能天花板 2000+ API 一把梭:agentic-ai-apis 让你少写 80% 的基础设施代码 AI 技术日报 - 2026-05-15 OpenHuman:一个让你在几分钟内拥有 AI 超级智能的开源项目 开源项目怎么选 License?个人免费、企业收费的 6 种方案全对比 browser-use vs browser-harness vs agent-browser:AI Agent 浏览器自动化工具终极选型指南 AI 技术日报 - 2026-05-14 一个 Deep Agent 到底能干什么?从功能视角拆解它的全部能力 Deep Agents SDK 功能全清单:我逐行读了源码,整理出这份完整参考手册 7MB 干翻 200MB?开源终端 Terax AI 能不能替代 Warp,我替你试了 Deep Agents vs Claude Code vs Cursor:2026 年 AI 编程 Agent 终极对比 15 个 Deep Agents 实战案例:从 Deep Research 到 Text-to-SQL,看看这个框架能做什么 用 Deep Agents CLI 替代 Claude Code:一条命令装好,任意模型驱动的终端 Agent 拆解 Deep Agents 架构:中间件、后端、Profile 三板斧,这设计比我想的还深 Deep Agents:LangChain 出品的 2026 年最强开源 Agent 框架,3 行代码搞定一切 AI 时代,我辞掉了大厂工作去做独立开发者——血泪换来的 7 条生存法则 中国 AI 六小虎估值大盘点:谁在泡沫上跳舞,谁在价值里扎根 AI 技术日报 - 2026-05-13 写好 AGENTS.md 相当于白嫖一次模型升级(写错了还不如不写) GitHub 49K Star!Ruflo 让 Claude 多 Agent 协作像带团队一样简单 AI 技术日报 - 2026-05-12 罗福莉访谈深度解析:Agent 时代普通人还能干什么 AWS DevOps Agent:亚马逊的自主运维 Agent 来了 Vercel vs Netlify vs Cloudflare Pages:2026 静态托管三巨头实测对比 AI 时代,为什么中国出不了英伟达、三星、海力士? Vercel 开源 Open Agents:把 Claude Code 搬上云,关机也能干活 黄仁勋 CMU 毕业演讲全文解读:计算范式 60 年来首次被重写,每个人都是程序员 AI 技术日报 - 2026-05-11 nuwa-skill 18K Star:16 个思维 Skill 全拆解 - iTech Hermes Web UI:把 AI Agent 装进浏览器,一个面板管到底 AI Agent 工具多到选不过来?Agent MGMT 帮你一次性看清全局 营收创新高却裁员 20%:Cloudflare 用 AI Agent 告诉我们,替代已经开始了 AI 技术日报 - 2026-05-10 23K Star 的 DeepSeek TUI,真能代替 Claude Code 吗? Gumroad创始人把《极简创业》做成AI技能包:10个斜杠命令,让Claude当你的创业顾问 Open Design:3.4万星的开源AI设计工作室,让你的编程Agent秒变设计师 免费搭一个 AI 新闻雷达:Horizon 开源项目部署实战 Cloudflare Agent Setup:一行指令让 AI Agent 帮你配好整个开发环境 AI 技术日报 - 2026-05-09 AI Agent 写完代码谁来测?这个开源沙箱把 CI/CD 和多 Agent 协作全包了 7万星的AI交易框架:让大模型模拟投行多空辩论,自动做交易决策 71000颗星的AI交易团队:让大模型模拟投行分工,自动做交易决策 13400颗星的开源项目:输入一句话,AI全自动帮你做短视频 102颗星的沙盒:当AI学会自己写代码、跑测试、做部署 AI 技术日报 - 2026-05-08 29k 星的 PageIndex:不用向量数据库,靠推理就能做 RAG 每天花两小时刷信息?这个开源项目帮你全自动搞定 读源码像读小说?试了 DeepWiki 和 Zread,我再也不想裸读 GitHub 了 Matt Pocock 开源的这套 .claude 技能,为什么让工程师集体上头? Cursor Team Kit:Cursor 官方团队在用的 17 个 AI 工作流 AI 技术日报 - 2026-05-07 AI 技术日报 - 2026-05-06 - iTech AI 技术日报 - 2026-05-05 Anthropic CEO 说 12 个月内程序员要失业,我扒完他的底牌,发现事情没那么简单 把工程师的肌肉记忆装进 Claude Code,这个 4300 Star 的项目我后悔没早用
DeepSeek-Reasonix:一个为缓存而生的终端编程 Agent,99.8% 缓存命中率的秘密
iTech · 2026-05-26 · via 博客园 - iTech

DeepSeek-Reasonix:一个为缓存而生的终端编程 Agent,99.8% 缓存命中率的秘密

435M input tokens,账单 12 美元——同样的工作量在 DeepSeek v4-flash 无缓存模式下要花 61 美元。这个数字来自 Reasonix 一位真实用户 2026 年 5 月 1 日的单日使用记录,缓存命中率 99.82%

这不是魔法,是架构选择的结果。Reasonix 从第一行代码就把 DeepSeek prefix cache 当作核心约束来设计,所有其他决策都服从于这个目标——包括只支持 DeepSeek 一个后端。

本文提纲

  1. Reasonix 是什么——定位与核心数据
  2. 四大支柱架构——Cache-First Loop 的实现细节
  3. Tool-Call Repair——DeepSeek 模型的「坏习惯」修复术
  4. 成本控制——flash-first 的分级策略
  5. 实际体验——安装与使用
  6. 谁适合用,谁不适合

Reasonix 是什么

DeepSeek-Reasonix 是一个开源(MIT 协议)的终端 AI 编程 Agent,由 esengine 社区开发。用 TypeScript 写的,基于 Node.js(≥22),运行在 macOS、Linux 和 Windows 上。

核心数据:

指标 数值
GitHub Stars 8,300+
协议 MIT
语言 TypeScript
创建时间 2026 年 4 月
支持模型 DeepSeek v4-flash / v4-pro

它的定位很明确:DeepSeek-only 的终端编程 Agent。不是通用框架,不支持 OpenAI、Anthropic 或其他后端。这个限制不是能力不足,而是刻意选择——只有绑死一个后端,才能把 prefix cache 的命中率做到极致。

和 Claude Code、Cursor、Aider 的对比:

维度 Reasonix Claude Code Cursor Aider
后端 DeepSeek Anthropic OpenAI / Anthropic 任意 (OpenRouter)
协议 MIT 闭源 闭源 Apache 2.0
每任务成本 订阅+按量 不定
DeepSeek prefix-cache 专门工程化 不适用 不适用 附带
内置 Web Dashboard 不适用

四大支柱架构

Reasonix 的架构文档定义了四大支柱(Pillar),每一个都针对 DeepSeek API 的特定行为或经济特性。

Pillar 1:Cache-First Loop

这是 Reasonix 存在的理由。

DeepSeek 的 prefix cache 机制:当新请求的 byte 前缀与上一个请求完全匹配时,缓存命中的 input token 按 miss 费率的约 10% 计费。关键在于 exact byte prefix——一个字节的差异就导致缓存失效。

大多数 Agent 循环每轮都在重排、改写或注入新时间戳,实际缓存命中率不到 20%。Reasonix 的做法是把 context 分成三个区域:

┌─────────────────────────────────────────┐
 IMMUTABLE PREFIX                          session 内固定不变
   system + tool_specs + few_shots           缓存命中候选
├─────────────────────────────────────────┤
 APPEND-ONLY LOG                           单调递增
   [assistant₁][tool₁][assistant₂]...       保留之前轮次的前缀
├─────────────────────────────────────────┤
 VOLATILE SCRATCH                          每轮重置
   R1 thought, 临时 plan 状态                不发送到上游
└─────────────────────────────────────────┘

三条不变量:

  1. Prefix 一次计算——session 建立时计算、哈希、锁定,不再改动
  2. Log 只追加——按顺序序列化,不重写任何已有条目
  3. Scratch 蒸馏后才能进入 Log——Pillar 2 负责这一步

还有一个容易忽略的细节:并行 tool dispatch。每个 tool 声明 parallelSafe 属性(默认 false),Agent 循环的 dispatcher 把连续的 parallel-safe 调用打包成 chunk,用 Promise.allSettled 并行执行。读文件、搜索文件、web 搜索这些只读操作可以并行;写文件、执行命令这些有副作用的操作保持串行。这样在不破坏 prefix 的前提下提升了速度。

Pillar 2:Tool-Call Repair

DeepSeek 模型在实际使用中有几种已知的「坏习惯」:

  • tool-call 的 JSON 被「思考过程」(<think code> 块)吃掉,最终 message 里缺失
  • 参数 schema 超过 10 个字段或嵌套深度 >2 时丢参数
  • 同一个 tool 用相同参数重复调用(call storm)
  • max_tokens 用尽时 JSON 截断

Reasonix 用四道工序修复:

  1. flatten——参数过多或嵌套过深时,自动转成 dot-notation 给模型看,dispatch 时再还原
  2. scavenge——用正则 + JSON parser 扫描 reasoning_content,把模型忘记发出的 tool-call 捞出来
  3. truncation——检测不完整的 JSON,补全括号或请求续写
  4. storm——滑动窗口内检测相同的 (tool, args) 组合,抑制重复调用并注入反思轮次

这四道工序组成了一个 pipeline,每次模型响应都经过处理,确保 tool-call 的完整性和正确性。

Pillar 3:成本控制

一个活跃用户用 Claude Code 大概每月 150-250 美元。Reasonix 的目标是让用户能「一直开着不心疼」。

四个互补机制:

1. flash-first 分级

预设 模型 成本倍率
flash v4-flash
auto(默认) flash → 遇到难任务自动切 pro 1-3×
pro v4-pro ~12×

所有辅助调用(摘要、子 Agent、截断修复重试)强制使用 v4-flash,不管用户选了什么预设。没有必要为「把 tool 结果改写成文字」这种事付 pro 价。

2. 轮次结束自动压缩

每个 tool 结果超过 3000 token 的,在轮次结束时压缩到上限。模型在读取时已经看过完整内容了,后续轮次看压缩版就够——需要详情时再 read_file 重新读。一次额外的 read_file 调用,比每轮都拖着 12KB 的原始数据便宜得多。

3. 模型自报告升级(<<<NEEDS_PRO>>>

这是最有趣的设计。模型自己判断当前任务是否超出 flash 的能力。如果需要更强推理,模型在响应的第一行输出 <<<NEEDS_PRO>>> 标记,系统中断当前 flash 调用,自动用 pro 重试。在 pro 层级这个标记是空操作——pro 已经是顶层,没法再升了。

4. 显式模型选择

通过 /model flash/model pro 切换,设置后持续生效直到手动更改。不会出现「忘切回来」的问题。

Pillar 4:成本透明

每轮和每 session 的费用实时显示在 StatsPanel 里,按金额着色:

  • 绿色:< $0.05/轮
  • 黄色:$0.05-0.20/轮
  • 红色:≥ $0.20/轮

用户随时能看到钱在怎么花。

MERMAID_BLOCK_0

实际体验——安装与使用

安装只需要一行:

npm install -g reasonix
reasonix code my-project

首次运行时粘贴 DeepSeek API key 就行,之后会自动持久化。也可以用 npx reasonix code 直接运行,不用全局安装。

主要命令:

命令 用途
reasonix / reasonix code [dir] 编程 Agent,从这里开始
reasonix chat 纯聊天,无文件系统/shell 工具
reasonix run "task" 一次性任务,输出到 stdout,适合管道
reasonix doctor 健康检查:Node、API key、MCP 连接
reasonix update 自升级

Reasonix 还支持 MCP(stdio + SSE + Streamable HTTP)、Skills(Markdown 格式的可复用 playbook)、Memory(用户私有知识库)、Hooks(生命周期钩子)等高级功能。甚至有一个 prerelease 的 Tauri 桌面客户端和 QQ 频道远程连接功能——可以在 QQ 上远程控制正在运行的 Reasonix session。

值得一提的还有 SEARCH/REPLACE 编辑模式。Agent 不直接修改文件,而是生成 SEARCH/REPLACE 编辑提案,用户通过 /apply 审核后才落盘。和 Claude Code 的模式类似,但 Reasonix 实现了自己的 cell-diff 渲染器。

谁适合用,谁不适合

Reasonix 文档里有一段「Non-goals」,写得很直白,这里直接引用核心观点:

适合你的场景
- 日常编程任务:修 bug、重构、写测试、生成代码
- 需要长时间运行的 Agent session,不想心疼 token 费用
- 喜欢终端工作流,不需要 IDE 集成
- 看重开源和社区驱动

不适合你的场景
- 需要多模型后端切换——Reasonix 是 DeepSeek-only,这是特性不是缺陷
- 需要解决 PhD 级证明题——Claude Opus 在这类任务上更强
- 需要离线/零成本——得看 Aider + Ollama 或 Continue
- 需要完整 IDE 集成——Reasonix 是 terminal-first,diff 在 git diff 里看

我的判断:如果你已经在用 DeepSeek API 做开发,Reasonix 值得认真试一下。99.82% 的缓存命中率不是吹的——它不是某个 benchmark 的最优解,而是日常使用的真实数据。8,300+ stars、活跃的社区、MIT 协议,这个项目正在快速成熟。


作者: itech001
来源: 公众号:AI人工智能时代
网站: https://www.theaiera.cn/
每日分享最前沿的AI新闻资讯和技术研究。

本文首发于 AI人工智能时代,转载请注明出处。