惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

H
Help Net Security
T
ThreatConnect
SecWiki News
SecWiki News
F
Future of Privacy Forum
AWS News Blog
AWS News Blog
C
Cisco Blogs
A
Arctic Wolf
Vercel News
Vercel News
The GitHub Blog
The GitHub Blog
Scott Helme
Scott Helme
V
V2EX
博客园 - 叶小钗
阮一峰的网络日志
阮一峰的网络日志
K
Kaspersky official blog
G
Google Developers Blog
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
P
Privacy International News Feed
C
Cyber Attacks, Cyber Crime and Cyber Security
N
News | PayPal Newsroom
Schneier on Security
Schneier on Security
NISL@THU
NISL@THU
Microsoft Azure Blog
Microsoft Azure Blog
量子位
The Hacker News
The Hacker News
Stack Overflow Blog
Stack Overflow Blog
Security Latest
Security Latest
M
Microsoft Research Blog - Microsoft Research
Google Online Security Blog
Google Online Security Blog
博客园_首页
C
CXSECURITY Database RSS Feed - CXSecurity.com
I
InfoQ
Google DeepMind News
Google DeepMind News
Y
Y Combinator Blog
The Cloudflare Blog
Microsoft Security Blog
Microsoft Security Blog
Martin Fowler
Martin Fowler
Cisco Talos Blog
Cisco Talos Blog
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
T
Troy Hunt's Blog
F
Fox-IT International blog
S
Security @ Cisco Blogs
博客园 - 司徒正美
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
C
Comments on: Blog
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
L
LINUX DO - 最新话题
GbyAI
GbyAI
Project Zero
Project Zero
腾讯CDC
T
Tailwind CSS Blog

钛媒体:引领未来商业与生活新知

“死磕”鲲鹏昇腾生态的极客们,要搞点大事情 聊聊Harness时代AI-First的组织架构:从信任人到信任AI 55亿大单零交付,德力股份败走光伏玻璃,与隆基“友好协商”解约背后,是光伏行业的又一道阴影-钛媒体官方网站 马矿股份:一矿独大、9成收入来自福建,三年分红12亿现欲再募10亿|IPO观察-钛媒体官方网站 一年入账72.8亿,破产巨头“起死回生”-钛媒体官方网站 AI越强,你的手机越贵?一张账单揭开AI芯片涨价潮的真相-钛媒体官方网站 朴朴超市咋就没人要了? 处方药网络零售“最严指南”出台,京东健康、阿里健康们被带上紧箍咒-钛媒体官方网站 自动驾驶等待ChatGPT时刻-钛媒体官方网站 2026Q1方便速食市场回顾-钛媒体官方网站 万豪Design Hotels强势回归后,开始大跃进?-钛媒体官方网站 逆势降价,高端手机市场的最后一次博弈?-钛媒体官方网站 所有创新药投资者都在幻想ASCO的催化行情-钛媒体官方网站 被全线吊打,云深处IPO凭什么比宇树贵?-钛媒体官方网站 中国铝行业爆单:下一个“煤炭”大周期?-钛媒体官方网站 AI时代,大厂重回PC战场-钛媒体官方网站 Huawei Presents the Tau (τ) Scaling Law, Enabling Breakthroughs in Transistor Density and System Performance-钛媒体官方网站 独立储能为什么很难赚到钱?-钛媒体官方网站 FSD来了,最该高兴的是国内车企 奶茶店、小吃店加冰淇淋,90%的人选错了方法-钛媒体官方网站 珀莱雅很需要花知晓-钛媒体官方网站 助力产业人才培养,希音获评“国家级高技能人才培训基地”-钛媒体官方网站 30亿资金被转移,联储证券状告大股东-钛媒体官方网站 投资人疯抢“没利润”的AI企业:一场关于“未来定义权”的豪赌-钛媒体官方网站 一年关店399家,“温州鞋王”遭遇财富“滑铁卢”-钛媒体官方网站 净利暴跌七成,“RNA诊断第一股”仁度生物何以着急“卖身”?-钛媒体官方网站 全日本打工人最离不开的老头,走了-钛媒体官方网站 时钟的归时钟:从摩尔到韬定律的六十年-钛媒体官方网站 三大巨头竞购朴朴?即时零售迈入寡头时代-钛媒体官方网站 3万、半年、注销:2026年,第一批“一人公司”老板已经退场-钛媒体官方网站 新品是今年618的一大看点-钛媒体官方网站 特斯拉FSD入华背后,Momenta、元戎启行们“抢时间”-钛媒体官方网站 Anthropic:版本号退潮,嵌入称王-钛媒体官方网站 如果不走华为韬定律,业内怎么走到0.2nm?-钛媒体官方网站 对话里斯咨询全球CEO张云:中国汽车之前靠价格,未来靠区隔-钛媒体官方网站 创新难以为继?莉莉丝的选择,戳中所有游戏人的痛点:再强的玩法标杆,也逃不开行业生存法则-钛媒体官方网站 谁会将卖菜这门武功发扬光大?-钛媒体官方网站 中国品牌出海,海外网红不够用了-钛媒体官方网站 一张GPU订单的“左右互搏”,两家上市公司的“双向奔赴”| 钛媒体深度-钛媒体官方网站 Edge AI Daily 早报(5月26日)-钛媒体官方网站 【钛晨报】实名购药、严禁AI替代审方,《处方药网络零售合规指南》发布;华为发表半导体韬定律;6G试验频率正式获批,6G有望在2030年前后正式商用-钛媒体官方网站 宇树科技IPO倒计时,9000万撑起的帝国,还差一个“大脑”-钛媒体官方网站 割肉福兆、苦候30亿补偿款:华映科技的“止血”与“输血”困局-钛媒体官方网站 扣非连亏、主业承压,杰美特追加2.35亿控股戴尔蒙德跨界新材料 | 并购一线-钛媒体官方网站 阿里巴巴重新做云的决心,还是被低估了-钛媒体官方网站 大模型公司门口,挤满了送钱的投资人-钛媒体官方网站 上市4年连亏2年,百诚医药破发阴影下觅新主-钛媒体官方网站 全球Token,短缺了-钛媒体官方网站 20岁透支、60岁退保,韩国人借钱狂买三星-钛媒体官方网站 谷歌对“AI投毒”重拳出击-钛媒体官方网站 Token五年增长370倍:谁在给AI公司“印钞机”充值?-钛媒体官方网站 AI 芯片的"电力革命"-钛媒体官方网站 从云深处IPO,看一家“不性感”的机器狗公司凭什么值139亿?-钛媒体官方网站 越贵越火?神经外科集采走出不一样的剧本-钛媒体官方网站 马斯克的科技树,跑赢了一个G7国家-钛媒体官方网站 从希腊酸奶到超滤鲜奶,吾岛为何入局高蛋白红海?-钛媒体官方网站 DeepSeek永久降价,其实是瞄准了10万亿美元?-钛媒体官方网站 语音,流量,Token,三大运营商的三生三世-钛媒体官方网站 海外科技巨头缺钱了?全球AI掀起债券融资浪潮 晶体管密度单代涨55%不靠新制程:华为“韬(τ)定律”说了什么-钛媒体官方网站 【Fintech 周报】八部门联合打击非法跨境炒股;险资规模超过公募基金 低调的天津,悄悄干成了中国机器人产业黑马-钛媒体官方网站 谷歌CEO最新访谈:谷歌多模态能力领先,但Coding确实落后了-钛媒体官方网站 市值已经跌去2150亿,“中药一哥”究竟怎么了?-钛媒体官方网站 月活3000万+!欧洲线下巨头的线上平台-钛媒体官方网站 重庆有张雪,天津有海光-钛媒体官方网站 不做NPC,只做OPC的年轻人,后悔了吗?-钛媒体官方网站 不炫技,重落地:一支机器人IPO军团在天津崛起-钛媒体官方网站 特朗普又盯上量子计算入股,9家公司一夜暴涨-钛媒体官方网站 广东有着最厚的核电家底,但AI的电力牌被浙江抢先打出去了-钛媒体官方网站 中美创新药的主战场,在所有人的视线之外 不“跟风”的天津机器人,用实干走出新路-钛媒体官方网站 从被“卡脖子”到定标准,天津机器人凭什么硬气出圈?-钛媒体官方网站 天津机器人,藏不住了-钛媒体官方网站 最赚钱的海力士,其实是存储周期里的「输家」-钛媒体官方网站 大厂AI内卷新姿势:Token变成新“PPT”-钛媒体官方网站 Token背后的生意经-钛媒体官方网站 七分钱,破了腾讯云的“金身”-钛媒体官方网站 芯片产业聚焦东南亚,谁能突围?-钛媒体官方网站 宁德,被主机厂“逼”着投DeepSeek-钛媒体官方网站 Chinese Programmers' "AI Split Personality"-钛媒体官方网站 快手的中年拐点-钛媒体官方网站 600696终退市,33年“A股不死鸟”落幕-钛媒体官方网站 DTC十余年,黄粱一梦-钛媒体官方网站 梁文锋想送DeepSeek一个成人礼-钛媒体官方网站 天津,工业机器人高地-钛媒体官方网站 ASC2026决赛揭示:AI差的不仅是算力-钛媒体官方网站 月之暗面"卸甲"赴港, 杨植麟“自砍一刀”-钛媒体官方网站 一大批GEO公司,死了-钛媒体官方网站 对手都在关店,沃尔玛为什么还能打?-钛媒体官方网站 Edge AI Daily 早报(5月25日)-钛媒体官方网站 【钛晨报】事关未落户常住人口住房、社保、就业、子女教育等,国务院最新部署;神舟二十三号载人飞船发射取得圆满成功;DeepSeek宣布永久降价-钛媒体官方网站 近39个“小目标”,“难倒”王健林和他的好哥们-钛媒体官方网站 Mythos的面纱,成了Anthropic撬动万亿的杠杆-钛媒体官方网站 DeepSeek永久降价,但梁文锋并不想做「赛博菩萨」-钛媒体官方网站 尼泊尔旅游为啥火?-钛媒体官方网站 从“最敢赌”到“引力井”,合肥改写城市竞争逻辑-钛媒体官方网站 黄仁勋不想“认输”-钛媒体官方网站 谁是中东储能之王?-钛媒体官方网站 曾经爆火的拉勾网为何陨落?-钛媒体官方网站
DeepSeek永久降价,第一个赢家已经浮出水面-钛媒体官方网站
硅基星芒 · 2026-05-26 · via 钛媒体:引领未来商业与生活新知

文 | 硅基星芒

上周五,DeepSeek宣布API的2.5折优惠从临时改为永久。

对开发者而言,价格没有变化,但权利的期限从一个月变成了无限期。全球用户陷入狂欢。但价格只是表象,真正值得关注的变量在另一边:一款名为Reasonix的编程Agent正在GitHub上爆火。

它的逻辑极其直接:只适配DeepSeek,通过极致的工程优化,让使用成本再降80%。

一明一暗,两条线索同时展开。Reasonix如何利用DeepSeek的底层特性实现降维打击?为什么“模型+代理”的工程组合正在替代单纯的模型性能?这才是需要拆解的问题。

“前缀缓存”与“字节指纹”

先说“前缀缓存(Prefix Caching)”这个词,这是一项在去年就已经被广泛采用的大语言模型推理优化技术。

核心思想很简单:缓存历史对话中的KV Cache,以便后续的请求能够直接复用这些中间结果,从而显著降低首个token的生成延迟,提升推理效率。

技术细节有些繁琐,因此绝大部分开发者对DeepSeek的前缀缓存也仅仅停留在“省钱”这个感性认知上。然而,Reasonix的开发者团队抓住了物理层面的本质:字节级稳定性(Byte-stable)。

要理解Reasonix,先得搞明白DeepSeek缓存的逻辑:前缀哈希(Prefix Hash)。

设想一下,用户发送的提示词在机器面前就是一串极长的数字,而哈希算法将会对这串数字对应的文本颁发一个“唯一数字签名”,并称之为“指纹”。只要用户发送的这段内容和服务器缓存的内容指纹对上,这部分内容就没必要重新计算一遍,费用也就可以打2折。

但是大家都知道,每个人的指纹都不同,而这种缓存逻辑也有一个致命的缺点:它要求对话内容必须从头开始、一字不差地完全重合。

市面上绝大部分编程代理的设计思路都是基于“无缓存时代”的,优化目标也只有一个,那就是尽量减少发送的总token数。

因此,为了省钱,这些代理会动态地压缩历史对话,并删除中间无用的推理过程。或者,为了让模型更清醒,它们会在每一轮对话中重新排列系统提示词的位置。

然而,这些看起来很聪明的优化动作却破坏了前缀的连续性,一旦一次微小的改动打破了“完全重合”,原本可以命中的几百万个token缓存瞬间化为乌有。这就是典型的“丢了西瓜捡了芝麻”,为了剩下100个token的长度,直接损失了10000个token的缓存。

Reasonix采取的方案,在传统思维看来可能有些笨拙,可称为“绝对追加模式(Append-Only Loop)”。

简单来说,它在模型运行的循环中始终遵守一条铁律:不重排、不压缩、不修改历史。无论是工具调用结果还是用户追加反馈,一律都像流水账一样追加在末尾。这种看似笨拙的做法,带来的结果就是随着对话进行,发送的上下文会越来越长。

然而,天才般的结果也随之而来,因为前缀始终未变,这部分极长的上下文始终能被模型“铭记”,即使是长达数小时的编程会话场景,Reasonix搭配DeepSeek V4的缓存命中率仍然保持在94%以上。在GitHub Projects的极端实测案例中,命中率甚至冲到了恐怖的99.82%。

因此,这是一场极其精准的数学计算:在DeepSeek这种缓存命中价格低到可以忽略不计的环境下,留存长上下文的边际成本远远低于破坏缓存后重新注入的冷启动成本。

思维链的回收机制

既然是专门为DeepSeek开发的编程代理,享受到红利的自然不仅有新出的V4,还有旧的R1模型。

R1是上一代的推理模型,最大的特点大家都很熟悉了,它会在

标签内展示长达数千字的思维链。但在实际工程中,这种“推理先行”的模式反而会给智能体带来两个巨大的挑战:思考泄露和语法畸形。

顾名思义,思考泄露指的是R1在思考过程中有时会表现出极强的“执行欲”。如果智能体的模型选了R1,它就应该在思考结束后才发起对应的工具调用指令。然而,因为推理链太长,它经常在思维链内部就已经写出了各种工具调用指令。

对于大部分智能体来说,它们只能识别官方定义的Tool Call区块,模型在思维链中的“偷跑”指令会被当成普通的纯文本忽略,严重时可能导致会话直接卡住不动。

Reasonix为此设计了实时扫描机制,即便工具调用指令逃逸到了思维链中,Reasonix也能精准识别到,并把它抓回来重新调度执行。

这不仅提升了38%的调度效率,更重要的是挽救了昂贵的推理token成本,模型不再会因为思维链出现了细枝末节的混乱就重新思考一遍。

语法畸形同样不难理解,即使模型正确地发起了工具调用,JSON格式的脆弱性也是智能体难逃的噩梦。模型输出中无论是多一个逗号还是少一个引号,都会让智能体陷入停滞。

而在前面所说的“绝对追加模式”下,一次工具调用若是因为语法错误而失败,智能体就得把报错信息反馈给模型,模型据此重新生成一遍逻辑。在这个过程中,多重损耗已经悄然产生:错误信息污染了上下文、重新生成的回复破坏了指纹的确定性、缓存优势大打折扣。

因此,Reasonix采取了“自愈”方案:在指令送入执行器前,必须由Reasonix进行一轮感知约束的自我修复。这就好比一个资深的程序员在改bug,自动补齐缺失的符号、修正格式、重排字段。

而经过修复之后,工具执行的失败率也降到了3%以下。如此一来,会话历史就变得“干净”且正确,前缀缓存能够像滚雪球一样持续累积。

被动生态的霸权

回到事情的起因,DeepSeek的永久降价,对开发者而言是一场编程狂欢,但对竞争企业来说无异于一场晴天霹雳。

一个不够严谨但足够残酷的商业公式就此产生:

AI产品的统治力=(模型原生能力+社区工程补全)/用户迁移成本。

显而易见的是,在如今的AI行业,如果一个模型的性能达到竞品的90%以上,而价格只有竞品的1/10,那么毁灭性的替代效应自然会爆发。

前段时间,内有百度AI开发者大会和阿里云峰会,外有Google I/O 2026,这些企业无一例外试图将旗下的各种AI产品集成到一个统一入口,并打造出难以逾越的生态壁垒。

反观DeepSeek,它没有各种百度云和阿里云这些云平台服务,没有Google遍布全球的Youtube和Gmail,甚至没有多模态功能。

但它成功证明了一个令全球开发者尊敬的逻辑:将能力维持在国内第一梯队,将性价比落实到极致,使用量自然会来,而剩下的功能,开源社区会帮着补齐和完善。

过去,大厂总是认为生态是自上而下建设的,“围墙花园”的景象我们已经在智能体时代初期的豆包手机助手和千问APP中见识过了。

而Reasonix证明了被动生态的威力,它不是像Claude Code和Codex一样的商业化产品,而是开发者们自发筑起的一座只属于DeepSeek的坚城。

为什么开发者会愿意为DeepSeek专门写一套运行优化的逻辑?答案很简单,因为DeepSeek给全球的开发者留出了足够的获益空间。面对国内外那些昂贵的模型,开发者层面上的工程优化抵消不了token燃烧带来的成本;但在DeepSeek上,每一次优化都能直接转化为开发者的“试错自由”。

这就是开源带来的权力反转。

我们承认DeepSeek离全球顶尖模型仍然存在差距,但当模型的API价格足够便宜时,V4就已经从一款模型演变成了普惠的AI基础设施,而社区会自发地补完它的短板。梁文锋旗下团队可能没空做极致的TUI,但总有Reasonix一样的团队带领“精算师们”迅速补位。

这种利益驱动的生态,进化速度远超大厂内部的全家桶产品。

评价体系的位移

至此,国产AI也终于可以昂首挺胸加入这场智能体编程的竞赛。

国外跑在Claude Code里的Opus 4.7和跑在Codex里的GPT-5.5用不了,我们就用跑在Reasonix里的DeepSeek V4。

欢喜和骄傲的同时,一个极其容易被忽略的格局正在改变:目前AI领域的竞争,已经演变为“模型+编程代理(Coding Agent)”的比拼。

国内外有许多AI厂商都倾向于把所有功能塞进一个用户界面之中,但Reasonix选择了像Claude Code一样的垂直路线:只做编程,深入终端。它没有参与IDE插件的内卷,而是自研了基于Yoga的cell-diff渲染器,尽管研发团队提供了门槛更低的桌面版,但毫无疑问,重心还是放到了在终端实现最极致的交互。

而在Artificial Analysis的评价体系中,效率和成本已经成为核心权重。

Anthropic和OpenAI的产品组合价格有多高自然不必多说,一个月20美元的订阅费往往满足不了开发者的需求。然而,若是使用Reasonix+DeepSeek的组合,使用4亿token只需要花费12美元(按DeepSeek国际版收费标准)。

这种极致的低成本带来的不仅是试错自由,还有多智能体协作的生态繁荣。用户可以批量生成任务执行方案,无需担心账单瞬间爆表。这种心理层面的解绑,给AI真正进入大规模生产力提供了可能性。

Reasonix的出现,是Agent领域从炫技转向精算的标志。AI时代的竞争,已经下沉到每个字节的缓存指纹和每次工具调用的纠错。

DeepSeek把算力和智慧变成了人人可用的廉价自来水。而Reasonix,成了第一款效率高、损耗低的水龙头。