惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

N
News and Events Feed by Topic
Malwarebytes
Malwarebytes
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
C
Cybersecurity and Infrastructure Security Agency CISA
F
Future of Privacy Forum
C
Cisco Blogs
T
The Exploit Database - CXSecurity.com
A
Arctic Wolf
S
Securelist
K
Kaspersky official blog
S
Schneier on Security
T
ThreatConnect
T
Tenable Blog
Spread Privacy
Spread Privacy
T
True Tiger Recordings
AWS News Blog
AWS News Blog
F
Fox-IT International blog
量子位
T
Threatpost
V
Vulnerabilities – Threatpost
C
CERT Recently Published Vulnerability Notes
Cisco Talos Blog
Cisco Talos Blog
GbyAI
GbyAI
宝玉的分享
宝玉的分享
腾讯CDC
G
Google Developers Blog
aimingoo的专栏
aimingoo的专栏
Cyberwarzone
Cyberwarzone
有赞技术团队
有赞技术团队
S
SegmentFault 最新的问题
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
V
Visual Studio Blog
U
Unit 42
雷峰网
雷峰网
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Simon Willison's Weblog
Simon Willison's Weblog
O
OpenAI News
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
The GitHub Blog
The GitHub Blog
The Register - Security
The Register - Security
MyScale Blog
MyScale Blog
小众软件
小众软件
A
About on SuperTechFans
Last Week in AI
Last Week in AI
Y
Y Combinator Blog
博客园 - 三生石上(FineUI控件)
美团技术团队
Google Online Security Blog
Google Online Security Blog
P
Proofpoint News Feed
MongoDB | Blog
MongoDB | Blog

量子位

图灵奖得主领衔,中国大模型第一梯队集结!2026智源大会,看懂AI下一程 Claude 通过率不到4%,SaaS-Bench撕碎了Computer-Use的「全自动办公」幻想 华为具身大脑一号位创业,用认知科学造世界模型,获亿元级融资 未来推理将吃掉70%算力,30%留给训练丨硅谷投资人张璐@AIGC2026 卷到今天,Agent的含金量还在提升丨AIGC2026圆桌论坛 谷歌CEO承认Coding落后了 未来推理将吃掉70%算力,30%留给训练丨硅谷投资人张璐@AIGC2026 什么!你说胡彦斌也在苦修Vibe Coding “五类人AI替代不了,企业做第二名最稳妥” | 昆仑万维方汉@AIGC2026 OpenAI大神教你如何榨干Codex DeepSeek V4价格打骨折,宁王京东网易抢着入场,梁文锋:目标是AGI 美团外卖前负责人入局餐饮具身模型,元节智能获千万级种子轮融资 美团外卖前负责人入局餐饮具身模型,元节智能获千万级种子轮融资 龙虾养不动了?周鸿祎给虾搭了个云端办公室,专业私教在线炼虾 李飞飞再出手,空间智能的ImageNet来了 融资700亿!DeepSeek Code真要来了,ACM金牌大神崔添翼挂帅 狂揽F轮融资+拿下4100万用户!深圳玩家出手,把企业旧系统变成AI能力库 顶流里最快!智谱,你是在「喷」代码吧 80集短剧,3天拍完:当电影人下场做Agent,影视生产迎来了“最懂行”的解法 39万!雷军发布小米最贵SUV 联想集团Q4营收利润双创新高,兑现历史最佳财年 腾讯混元开源全新翻译模型Hy-MT2 ,上线小程序「腾讯Hy翻译」 菲尔兹奖得主都看懵了:OpenAI非数学模型首次自主突破80年未解数学难题 风行在线CEO易正朝:先全员Coding,再All in众创丨AIGC2026 Artificial Analysis放榜:千问3.7问鼎国产模型冠军,全球前五 AI首次实现中国风光发电普查,北大、阿里达摩院研究登上《自然》 上海交大AI教授亲授:半天带你拆解Agent底层逻辑 得场景者得AI天下,出行赛道跑出了一家值得关注的数据玩家 520当天400万AI人,都在量子位听这近20场演讲&对谈|第四届中国AIGC产业峰会 顺丰邮政仓库干活的机器人,顺手拿了个具身高考第一 刚刚,马斯克公开SpaceX招股书! 智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布,融资持续提速 太初元碁洪源:异构计算能力将成为未来AI算力基础设施的重要方向|AIGC2026 VC、品牌顾问、编剧,正在批量把自己做成AI AIDC建设正从“通用标准”走向“适用高效” 破壁行动!把大厂级“研发外挂”发给每一个创新者,智会心研PLUS版免费公测 海信激光电视探索X1 Pro发布:中国家庭,正式进入客厅影院时代 2026中国AIGC最值得关注的企业&产品图鉴来了!谁在造浪,谁在落地? 趋境科技完成数亿元Pre-A轮融资,高品质AI Token生产基础设施 苏姿丰上海开讲:AI正在重新定义计算的每一层 完成“由铁到钢”的生态蜕变 刘军携联想全场景AI终端点亮智能未来 抢先李飞飞!世界模型能多人联机玩FPS游戏了 国产GPU开始造世界!国内首个全栈具身智能仿真平台来了 Cursor新模型,你怎么还在套Kimi?马斯克你怎么还吆喝上了?? L2++「五冠王」文远知行:自动驾驶版的张雪机车,专治各种不服 5.20 明天见!拿好这份参会指南|AIGC2026峰会 Qwen最新3.7 Max预览版空降!两代超大杯并行迭代,林俊旸走了但还在加速 百度无人车新纪录:周订单破35万!李彦宏:开始单城盈利了 重塑主流PC,第三代英特尔酷睿开启全民AI轻薄本时代 AI水论文封一年,署名连坐!arXiv最严新规来了,陶哲轩附议 openJiuwen社区开源新招:重磅发布JiuwenSwarm,拉开群体智能“养蜂”序幕 华为“养”出半个具身智能创业圈 上交x创智x瑞金联合发布CX-Mind:胸片诊断进入“可验证推理”时代 8B模型做生物实验:实验步骤顺序不乱、剂量无幻觉|ICLR 2026 信通院&清华提出FedRE:用「纠缠」搞定联邦学习三难困境 | CVPR 26 黄仁勋北京必吃榜我们都尝了!后海酒吧老板:他答应以后每年来一次 LeCun炮轰Hinton:他认可LLM就是想摆烂退休了! 30万奖金池,这道汉语方言对话题等你来解丨第十一届信也科技杯全球AI算法大赛 一只机器狗,把英伟达的算力王座拱翻了 世界大学生超级计算机竞赛首设“英才对接”环节,搭建“赛场—职场”人才供需桥梁 Agent、多模态、应用、算力一天看尽,峰会亮点在此|5.20日,来现场一起AI 龙虾之父月烧940万元的token!要不是入职OpenAI还真用不起 SFT别急着接RL!你的多模态大模型可能一直在“带伤训练” 6.4k Stars!用Claude Code写论文的全套流水线,有人打包开源了 不用再找了,AI落地最全的实战打法,都在亦庄这场大会里 奥特曼投的芯片涨疯了,今年最大科技IPO 虾马之后又火一个!OpenHuman用20分钟了解你的一切,存成卡帕西式知识库 别让模型烧Token了!GitHub 20k星神作:把全网变成命令行 中国500万医生的新AI:顶刊独家联手,卷的就是证据源 15.68万乐道L80开卖,厨房搬进前备厢,李斌:纯电大五座SUV的“拐点” 华为云创想者大会主题论坛议程公布:释放Agentic AI新布局 Need is all you need:AI接手Coding后,程序员最值钱的能力只剩这一项? 容联云发布“数字员工”级 Al Agent 平台,重塑大模型联络中心 手机的智能体AI,正在因为天玑全面跃升 阿里发布Qoder 1.0,可全面接管代码生成、验证和交付流程 坐到马斯克和库克中间的湖南女人 蚂蚁百灵 Ring-2.6-1T 开源 Agent 执行能力全面增强 智能无处不在:OpenClaw预示的AI未来 英伟达给黄仁勋儿女涨薪了!年薪百万美元,“凭能力而不是身份” 数亿元融资落地!国内最早布局“人类学习”路线的具身公司,用人类视角重做具身智能 人手一个数据库,Kimi背后这套AI基建到底有多能扛? 重生之我在AI时代当老板:让一群Agent互相PUA 淘天金码奖落幕:20 名超级工程师诞生,推动 AI Native 实践 国产GPU组了个开源局,把SGLang等核心开发者都摇来了! Robotaxi第一股又涨疯了 腾讯开源 Agent 记忆技术方案,Token 消耗最高降低 61% 阿里 AI 应用新进展:悟空开始逐步规模化放量 田渊栋AI创业估值315亿,老黄苏妈都投了,姚班施天麟也是合伙人 亚历山大王回应一切:LeCun、Manus,“我的父母都是中国人” Waymo CEO回应L2升维L4:有可能,但只靠端到端还不够 倒计时一周,AIGC峰会嘉宾又上新了!一起来看第三波嘉宾 8岁小学生idea直接变应用,秒哒3.0刚刚把AI应用门槛打没了 挑战扩散自回归统治!字节提出视觉生成第三种路线,让模型像人类一样边画边改 林俊旸果然创业了!一个“Qwen负责人”头衔值135亿 苹果画的饼谷歌率先搞定!Gemini全面进驻全家桶,连鼠标都AI上了 高德与千问C端应用团队开源AGenUI:首个覆盖iOS、安卓、鸿蒙三端的原生A2UI框架 AI拿婚外情写勒索邮件,查一年告诉我科幻小说教坏的 AI步入“自我进化”时代,李彦宏首提AI时代度量衡“DAA”|Create2026百度AI开发者⼤会速览 Auto Research时代,47个没有标准答案的任务成了Agent能力必测榜 奥特曼趁马斯克出差爆猛料:他曾想让子女继承OpenAI
DeepSeek V4还能更省!新工具缓存命中率高达99.82%,2折稳定到手
鱼羊 · 2026-05-25 · via 量子位

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

2026-05-25 12:40:14 来源:量子位

原本4亿+token、61美元的账单,直降至12美元

鱼羊 发自 凹非寺

量子位 | 公众号 QbitAI

我悟了,DeepSeek V4系列发布1个月,价格屠夫的本色这才刚刚发力啊!

官方这边,打折促销期还没过,折上折价格已官宣落定为永久降价

就这样,开源社区仍不满足。您猜怎么着?缓存命中率直接给干到99.82%了!

什么概念?就是原本4亿+token、61美元(合人民币414元)的账单,能直降至12美元(合人民币81元),2折轻松到手。

老哥老姐们给这个名为Reasonix的项目点星都点疯了,状态be like:

具体来说,Reasonix是一款专为DeepSeek打造的终端coding harness,核心目的很简单,就是两个字:省钱——

长会话能把缓存命中保持在90%+,输入token成本降到1/5的那种。

DeepSeek原生编程Agent

Reasonix的实现思路也不复杂,最核心的一点是:基于字节稳定prefix-cache设计的append-only运行循环

就是说,Reasonix的工作流程是专门为了DeepSeek的缓存机制设计的:旧的上下文固定不动,新消息只往后追加,尽量保证每一轮请求的前半部分完全一样,从而提高缓存命中率,降低长会话成本。

具体架构可以拆分成3个部分来看。

缓存优先循环(Cache-First Loop)

自动前缀缓存(prefix-cache)仅在当前请求的精确字节前缀和先前请求匹配时才会激活,想要提高缓存命中率,需要解决的是大多数智能体循环会在每次交互时重新排序、重写或注入新的时间戳的问题。

Reasonix的解决方案是把上下文划分为三个区域:

这样,前缀会被固定下来,在每个会话中仅计算一次;历史消息只追加不重写;而草稿区中的任何信息在归入日志前,均需通过Tool-Call Repair进行提炼。

工具调用修复(Tool-Call Repair)

DeepSeek比较容易遇到的问题包括:

  • 工具调用JSON在内部已经生成,但在最终消息里却消失不见;
  • 模型想调用工具,但参数写歪了,即JSON参数畸形;
  • 同一工具被反复调用且参数完全相同,即重复调用风暴;
  • JSON被截断。

工具调用修复会通过4轮处理,让Reasonix在真正执行前,先尝试修复这些问题。

成本控制

首先,默认优先使用v4 flash,困难任务才会切pro。

其次,轮次结束自动压缩上下文。

用户要是觉得下一次任务比较难,就输入/pro,这样下一轮对话模型就会切换为v4 pro。跑完这一轮后Reasonix自动切回便宜模型,无需用户手动更改。

最后,失败信号会触发自动升级:失败次数到达警戒线后,当前轮次的剩余部分就会切到v4 pro上运行。

Reasonix在安装使用方面也比较简单。

两步即可运行,无需全局安装:

  1. 进入项目目录;
  2. 输入:npx reasonix code,启动TUI会话。

不习惯用终端的话,Reasonix还提供了桌面版。

以及再次再次高亮一下来自Reasonix官方的提醒:

Reasonix只为DeepSeek打造,每一个抽象层级都基于DeepSeek的Feature构建,完全不通用,也“不会发布通用功能”。

One More Thing

省钱的事情,大家伙当然喜闻乐见,毕竟也不是每个人都能像龙虾之父Peter那样无限狂烧公司token。

于是关于Reasonix的讨论,是轻轻松松就盖了几百楼。

不少小伙伴已经摩拳擦掌跃跃欲试,但也有人提出疑问:

我们真的需要一个DeepSeek原生编程Agent吗?

有网友分享说,Ta写了一个微型桥接程序,在Codex中使用DeepSeek V4 Pro,同样实现了95%以上的高缓存命中。

并且Ta“没做任何特殊处理,只是将DeepSeek API的格式调整为Codex所需要的”。

anyway,harness和harness之间肯定是有区别的。就有网友分享说,在Claude Code里使用DeepSeek V4比在OpenCode上省钱。

甭管你用了哪一种方案,都欢迎在评论区分享分享心得体验。

大家省才是真的省(doge)。

项目地址:

https://github.com/esengine/DeepSeek-Reasonix

参考链接:
[1]
https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs/ARCHITECTURE.md#pillar-1–cache-first-loop
[2]
https://esengine.github.io/DeepSeek-Reasonix/index.html#agents

版权所有,未经授权不得以任何形式转载及使用,违者必究。