惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

N
News and Events Feed by Topic
Malwarebytes
Malwarebytes
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
C
Cybersecurity and Infrastructure Security Agency CISA
F
Future of Privacy Forum
C
Cisco Blogs
T
The Exploit Database - CXSecurity.com
A
Arctic Wolf
S
Securelist
K
Kaspersky official blog
S
Schneier on Security
T
ThreatConnect
T
Tenable Blog
Spread Privacy
Spread Privacy
T
True Tiger Recordings
AWS News Blog
AWS News Blog
F
Fox-IT International blog
量子位
T
Threatpost
V
Vulnerabilities – Threatpost
C
CERT Recently Published Vulnerability Notes
Cisco Talos Blog
Cisco Talos Blog
GbyAI
GbyAI
宝玉的分享
宝玉的分享
腾讯CDC
G
Google Developers Blog
aimingoo的专栏
aimingoo的专栏
Cyberwarzone
Cyberwarzone
有赞技术团队
有赞技术团队
S
SegmentFault 最新的问题
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
V
Visual Studio Blog
U
Unit 42
雷峰网
雷峰网
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Simon Willison's Weblog
Simon Willison's Weblog
O
OpenAI News
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
The GitHub Blog
The GitHub Blog
The Register - Security
The Register - Security
MyScale Blog
MyScale Blog
小众软件
小众软件
A
About on SuperTechFans
Last Week in AI
Last Week in AI
Y
Y Combinator Blog
博客园 - 三生石上(FineUI控件)
美团技术团队
Google Online Security Blog
Google Online Security Blog
P
Proofpoint News Feed
MongoDB | Blog
MongoDB | Blog

爱范儿

国产闭环,框架国产,芯片国产,模型国产,方法论自主 多给一点冗余,说不定真能让通勤路变得有些不一样。 早报|国产手机618前集体降价/微信解释「2 分钟内可撤回」/买智能手表以后不能再刷医保 它还说「何以览胜,唯有泰山」。 2026 年的旗舰耳机,不能只是耳机 要成为 OpenAI 最赚钱的产品 卖到莱茵河流域去。 一台「平平无奇」的好手机 早报|雷军:手机越来越贵,建议现在就换/特斯拉监督版FSD将入华/努比亚总裁:豆包手机真可以订餐厅 跑车级 SUV,首先得是一台好用的 SUV。 「另一个我」,可能比你想象的更早上线 人生如歌,无须耳朵,且用心听。 全功能GPU,全场景AI算力 早报|448元,iPhone绝版配件回归/Meta用员工键鼠数据训练AI,扎克伯格:外包不够聪明/GoPro考虑出售或合并 用规模为未来铺路。 硬件扎实,系统优化。 这次 iQOO 给玩家的,是 iQOO15T 和 iQOO Pad6 Pro 共同构成的一套兼顾方案——竞技和沉浸,可以在同一个生态里完成。 给 Gemini 完整的一生 vivo S60 系列:今天,把星星海握在手里 早报|Google发布一大波AI更新/华为五一假期领跑中国手机市场/小米YU7 GT刷新纽北纪录 新的 Gemini 3.5、Agent 产品、视频模型都来了 在极氪 009 上,你也能面对面聊天了。 让 PC 真正开始「理解」人 6 月 9 日,不见不散 复古家族又添一员。 一代经典落幕。 早报|苹果开启WWDC邀请,将公布苹果AI新进展/问界M9设计师点赞理想L9内饰/国家反诈中心App上线「AI内容鉴定」 把旗舰制程下放到入门产品上,英特尔这是想开了? 用自己的信誉为车辆品质托底,是魏建军决战高端新能源的决心。 明面上算力是最关键要素?暗地里,其实是数据…… 你今天🔥Token 了吗 昊铂需要让产品被更多人知道。 但 AI 真的有「摄影眼」吗? 早报|马耳他为全民买单ChatGPT会员/卢伟冰预判年底国产直板旗舰破万元/曝苹果新Siri聊天记录可自动删除 早报|华为Mate X7官方降价1000元/Anthropic估值超越OpenAI/国行Switch正式停服 好就是大。 把家装进车里,把纯电融进增程。 鸿蒙智行的首款 MPV,献给预算充足的老板们。 持币观望,是目前的最佳选择 一场针对 AI 的大型猎巫 腾讯的 AI 王牌是微信 早报|OpenAI或将起诉苹果/iPhone 17 Pro官降1000元/影石CEO回应Luna定价贵:5299是美国价格 AI 人机交互,迎来十字路口 锐意向前。 液压底盘,让方程豹告别千斤顶。 AI 时代的价值坐标正在被重建。 让人愿意戴,并且愿意长时间戴,这就是智能穿戴产品最重要的优势。 早报|元宝推出一键总结微信聊天/曝苹果探索将AI Agent引入App Store/小米 17 Max官宣本月发布 管 agent 要像管人一样,懂得「驭臣之术」…… 高刷、高刷,还是高刷 Y600 Pro 可能是 vivo 今年最重要的一款产品。它不一定最贵、不一定最亮眼,但它代表了 vivo 这家公司对入门级市场的一次重新理解 —— 这个档位的用户要的是什么,不再由旗舰来定义。 让 Android Auto 和 Google Built-in 更适应不同车型和不同屏幕,同时继续与苹果 CarPlay 竞争。 大疆 Pocket 4P 上手体验:欲穷千里目,更多摄像头 拳打 iPhone,脚踢 Galaxy 比 1000 马力更敏感的,是重量。 设备一直在变,但芯片作为中枢的地位不变。 给 Gemini 不止一个身体 一个行业的终结 早报|Android 17转型智能系统,深度整合AI/腾讯:微信已读和访客功能「已焊死」,不会开发/李想:理想自研芯片不是跟风 用算力对抗经验。 我将以高达形态出击! Google 的大招是图像、文本、视频轮着来 汽车早已不仅仅是一种交通工具。 想要什么格式就什么格式 YU7 GT 秀肌肉、提品牌、战全球;YU7「青春版」 降门槛、保销量、拼刺刀。 早报|曝苹果新Vision Pro研发已暂停,团队分拆/黄仁勋:AI让所有人站上同一条起跑线/微信状态将推出「访客记录」 失去车顶,不失下压力。 重点是:人无我有。 最好的 AI 载体,需要一个 AIOS 全球 AI 顶会,快成中国卷王的专场了。 去读书,更去读那些真正有作者的书。 你拿 AI 写代码,AI 给你种木马 AI 时代最反焦虑的演讲 AI 时代,编程能力更珍贵了 早报|微信灰测「组合支付」功能/苹果或重新设计macOS27「液态玻璃」/哈啰回应员工脚踩青桔美团 早报|中汽协辟谣8家车企锁电被约谈/曝苹果正在研发全息iPhone/李想回应理想L9四年换代:汽车不是手机 车市又将血雨腥风。 快不是新闻,一直快才是。 理想内饰的新阶段,由 L9 Livis 开始。 让普通家庭跨入高品质出行的门槛。 当匠心遇上算力。 淘汰赛的进程正在加速。有些品牌注定会在这个周期里倒下。 一个不懂死亡的小男孩,攒了 15 块钱,想给去世的奶奶烧一部手机 三排六座,定位高于雷克萨斯 RZ。 早报|小米增程SUV 曝光,但不叫YU9/苹果与英特尔达成初步芯片代工协议/Cloudflare用AI裁掉20%员工 苹果的第一款 AI 穿戴产品,将是 AirPods。 AI 硬件必须先沿着「手机」的路走出来,然后才有资格谈「革手机的命」 一款车盘活整个广汽新能源。 你还发现了 AI 的哪些口癖 苹果 AI 硬件最激进的赌注,撞上了全球最严的隐私墙。 如果连品牌自身都要留一条退路,消费者又凭什么要坚定地选择你? 早报|曝苹果考虑取消入门款MacBook Neo/理想高管谈MEGA设计争议:不是失败/千问PC端上线AI语音输入 「请稍等片刻」 聊着天,就把视频做了 AI 时代的新「键盘」长这样 28 年控制终结!保时捷出售布加迪全部股份,作价 70 亿元 早报|DeepSeek首轮融资曝光,估值450亿美元/谷歌称Android不会推出「液态玻璃」/三星宣布在中国大陆停售所有家电产品 第十一代雅阁,还得扛 4 年。 独显配风扇,新一代性能旗舰的标配 是伸张正义还是背刺
为什么必须做中国版「Claude Code」?
莫崇宇 · 2026-05-25 · via 爱范儿

DeepSeek 之于大模型,就像蜜雪冰城之于奶茶。你不必纠结性价比,因为它的本事你挑不出毛病,你的钱包它也从不为难。

最近,DeepSeek 官方宣布,DeepSeek-V4-Pro 模型 API 将永久降价。同时,DeepSeek 表示,API 已完成输出提速与服务扩容,速度更快,服务更稳定,默认支持 500 并发,企业用户可以在线申请更高并发。

发布模型,再给出折扣,接着降低缓存命中价格,最后把临时优惠变成长期价格。大模型 API 的价格基准正在被重新改写,而低价模型背后的下一站,很可能是 Agent。

DeepSeek 永久降价,梁文锋把 Token 价格打骨折了

让我们先来简单梳理一下 DeepSeek 的降价时间线:

  • 4 月 24 日,DeepSeek V4 预览版正式发布。
  • 4 月 25 日,DeepSeek 宣布 V4-Pro 开启 2.5 折优惠。
  • 4 月 26 日,DeepSeek 宣布缓存命中价格调整为首发价的十分之一。
  • 4 月 28 日,DeepSeek 宣布 V4-Pro 的 2.5 折优惠延期至 5 月 31 日。
  • 5 月 22 日,DeepSeek 宣布 V4-Pro 永久降价为原价的四分之一。

时间线的关键之处,在于临时折扣变成了永久降价。调整之后,DeepSeek-V4-Pro 输入缓存命中价格从 0.1 元每百万 Tokens 降至 0.025 元,输入缓存未命中价格从 12 元每百万 Tokens 降至 3 元;

输出价格从 24 元每百万 Tokens 降至 6 元。叠加默认 500 并发和服务提速后,官方 API 对开发者和企业的吸引力进一步提高。

▲ 🔗 https://api-docs.deepseek.com/zh-cn/quick\_start/pricing

而价格下调最直接的影响,是把任务成本推到开发者决策的更前端。

在代码场景里,一次任务可能要读取项目文件、分析日志、多轮修改、反复运行测试,Tokens 消耗很容易放大。

长上下文、代码库分析、批量重构、自动测试、Agent 多轮执行这些高消耗场景,开始更接近个人开发者和小团队的预算范围。

过去,开发者选择 Claude、OpenAI 或 Gemini,主要看模型能力、稳定性、生态和使用习惯。DeepSeek 打骨折的永久降价,也意味着在绝对的性价比面前,开发者使用习惯也是可以轻易改变的。

顺着这条线,DeepSeek 一贯的市场角色也更清楚了:用低价、开源和强推理能力,持续建立大模型市场的价格优势。对国内模型厂商来说,V4-Pro 永久降价相当于重新划了一条 API 定价线。

智谱、MiniMax、月之暗面这类同样依赖 API 收费、又面向开发者和企业客户的模型,压力可想而知。反观 Claude、OpenAI、Gemini 等海外头部模型,由于市场、客户结构和生态位置不同,短期冲击则相对有限。

但如果 DeepSeek 后续推出类似 Claude Code 的编码工具,再用低 token 成本支撑高频调用,价格敏感的开发者群体会更容易被吸引过来。

梁文锋此前对 DeepSeek 定价哲学的解释,也能放到今天理解。

早在 2024 年 DeepSeek V2 降价时,梁文锋就提到,DeepSeek 只是按照自己的节奏做事,核算成本后定价,原则是不贴钱,也不赚取暴利。他还说,降价一部分来自下一代模型结构探索带来的成本下降,另一部分原因是 API 和 AI 都应该是普惠的、人人用得起的东西。

比起把 API 当成高毛利收费入口,DeepSeek 则更像是在用过硬的 Infra 实力压低推理成本,再用低价吸引开发者、应用和下游生态进入自己的轨道。

X 平台博主 @bookwormengr 最近在一篇题为《DeepSeek’s 10 trillion USD grand strategy(DeepSeek 的十万亿美元棋局)》的长文中,给出了一个更激进的解释。

他认为,DeepSeek 的真正目标未必是和智谱、月之暗面、MiniMax 竞争,也不是急着补齐多模态、语音、视频这些产品线,而是通过持续降低训练和推理的资源需求,推动一套更便宜、更分散的 AI 硬件生态成形。

在他看来,DeepSeek 的长期价值不只在模型本身,而在于让更多国产存储、GPU、ASIC、网络芯片和异构硬件进入大模型训练与推理体系。

这个判断未必能完全兑现,但它解释了 DeepSeek 一系列选择背后的方向:

MoE、MLA、DSA、GRPO、RLVR、KV Cache 压缩、Dual Path、TileLang,表面上看是模型架构和推理工程优化,往深处看,都是在降低对高端 HBM、顶级 GPU 和 CUDA 生态的依赖。

一系列降价公告里,最值得关注的不只是输出价格下降,还有缓存命中价格下降。

在大模型推理过程中,KV Cache 是一个关键成本项。模型处理长上下文时,需要把历史 tokens 对应的 Key 和 Value 存起来,后续生成时反复使用。上下文越长,需要保存和读取的缓存越多,对显存、带宽和存储系统的压力也越大。

普通聊天里,缓存压力不一定明显,但在进入代码、长文档和 Agent 任务后,成本结构会迅速变化。@bookwormengr 在长文里专门算了一笔 KV Cache 账。

他以 100 万 tokens 上下文、8 bit KV 精度和 16 bit 索引精度为前提,估算 DeepSeek V4 只需要约 5.48GB HBM,而 GLM5 约为 60GB,Qwen3-235B-A22B 约为 89GB。

长上下文和 Agent 任务真正贵的地方,不只是模型生成本身,还有缓存、显存、带宽和重复上下文搬运。

一个 Code Agent 处理项目时,可能要反复读取同一个代码库结构、同一批文件、同一段任务历史、同一套系统提示词和同一批测试日志。若每一轮都按完整上下文重新计费,长任务很快会变贵。缓存命中价格下降后,重复上下文的成本会明显变低。

DeepSeek 近年来在 MoE 架构、长上下文、KV Cache 压缩和推理效率上持续投入的表现有目共睹。降价是技术迭代后的必然结果,也将彻底搅动 AI 编程市场格局。

为什么必须做中国版「Claude Code」?

最先被牵动的,是 AI 编程工具的订阅模式。

市面主流 AI 编程工具均推出 Coding Plan 月付订阅,为用户提供代码补全、模型调用、Agent 执行等权益。在轻量化补全时代,单次调用消耗极低。

但 AI 编程已从单次补全迭代为全流程 Agent 自动化编码,模型可独立完成代码修改、测试运行、报错修复,单次任务 Token 消耗大幅提升。

当底层 API 又同时大幅降价,Coding Plan 也必须找到新的支撑点。这个支撑点,更可能落在工程能力上——比如能不能更好地读懂项目结构,能不能精准选择上下文,能不能控制 tokens 消耗,能不能稳定修改代码,能不能处理 Git、终端、CI/CD,能不能在企业环境里管理权限和审计记录?

同样要重新定位的,还有 API 中转站。对个人开发者来说,便宜和好用仍然重要。但对企业来说,稳定、可审计、可控、可迁移更重要。

沿着这个逻辑继续看,Coding Plan 和中转站的改变只是表层。低价之后更值得追问的,是开发者入口究竟掌握在谁手里。

Google CEO Sundar Pichai 最近接受了《Hard Fork》采访,他首次公开承认,Google 在文本、多模态、语音、推理和整体智能上都很有竞争力,但在 agentic coding 这一类能力上,尤其是工具调用、指令跟随和长周期任务,目前还有差距。

他还提到,更关键的是把模型放到真实世界里使用,让数据回流,继续迭代。Pichai 特别说到,coding 是一个需要接触 data flows(数据流)的领域。

终端工具能看到开发者如何提出任务,如何追问,什么时候接受建议,什么时候放弃,什么时候要求模型继续修复。它还可以通过测试结果、终端日志、文件变更和 Git 提交,判断一次 Agent 执行是否完成任务。这类数据,对 coding model 和 Agent 产品都非常有价值。

从公开招聘动作看,DeepSeek 近期围绕 Agent 的动作也变得密集。

我们也可以看到岗位里出现了 Agent 深度学习算法研究员、Agent 数据策略工程师、产品经理、研发工程师等角色。更关键的是,DeepSeek 资深研究员陈德里直接发出招聘信息,提到要从零开始构建 Code Harness。

如其所说,Model + Harness = Agent,在 Agent 产品中,模型负责理解和生成,Harness 负责把模型能力带入真实工程环境,相当于模型外面那套「执行系统」。

DeepSeek 版 Claude Code 不能只给开发者一个对话框,而要给开发者一个能持续执行任务的工程系统。

崔添翼加入 DeepSeek 后受到关注,也和 Code Agent 的工程属性有关。

公开信息显示,崔添翼本科毕业于浙江大学计算机系,曾因信息学竞赛保送浙大,6 次获得 ACM 亚洲区域赛金牌,之后在 Jane Street 工作 9 年,并联合创立 TSY Capital。

Code Agent 的难点不只是生成代码,还要在真实项目里持续执行任务。量化交易系统长期强调低延迟、稳定性、自动化执行和风险控制,这些经验放到 Agent Harness 上,至少在工程范式上是相通的。

而 Agent 工具的产品能力,不只包括写代码,也包括权限、审计、数据隔离和安全策略。

这反过来给 DeepSeek 这样的国产模型提供了机会。如果 DeepSeek 能把低成本模型、Code Harness、本地部署、企业级权限控制结合起来,它在政企、金融、制造、能源等对数据敏感的行业里,会有更强的替代价值。

DeepSeek 做中国版 Claude Code 的逻辑也正在于此:低价 tokens 把更多开发者吸引进来。低缓存价格让 Agent 任务运行成本下降。Code Harness 让模型进入开发环境。真实工作流又会反过来帮助 DeepSeek 改进模型和产品。

就像滚下坡的雪球,越滚越大,滚得越快。降价只是推下山的第一把力,往后它会自己越滚越沉,谁也拦不住。