惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

大猫的无限游戏
大猫的无限游戏
阮一峰的网络日志
阮一峰的网络日志
T
Tailwind CSS Blog
WordPress大学
WordPress大学
小众软件
小众软件
Engineering at Meta
Engineering at Meta
有赞技术团队
有赞技术团队
博客园 - 聂微东
GbyAI
GbyAI
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
Stack Overflow Blog
Stack Overflow Blog
罗磊的独立博客
腾讯CDC
The Cloudflare Blog
博客园 - Franky
MongoDB | Blog
MongoDB | Blog
Martin Fowler
Martin Fowler
G
Google Developers Blog
博客园 - 三生石上(FineUI控件)
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知

博客园 - iTech

Claude Code 为什么放弃 RAG 用 Grep 搜索代码?大型代码库最佳实践全解析 Runtime (YC P26):给每个团队配一个沙盒 AI Agent,产品经理也能提 PR - iTech Models.dev:查 AI 模型价格不用再开十几个网页了,4,844 个模型一站式对比 Superset (YC P26):Agent 时代的全新 IDE,同时跑 10 个 Claude Code 互不干扰 AI 技术日报 - 2026-05-23 3.5 个月 4.3 万 Star:nanobot 凭什么成为最火的开源 AI Agent CodeGraph:给 AI 编程助手装上代码知识图谱,省 35% 费用、减少 70% 工具调用 AI Engineering from Scratch:435 节课从线性代数到自主 Agent,每个算法手写一遍 Lucarne:不用盯着电脑也能掌控 AI Agent,微信/Telegram 远程遥控本地编码助手 财富正在向 AI 集中:三个万亿级 IPO 同场竞技,一场前所未有的造富运动 程序员必备核心技能手册:从 Linux 到 Docker 的实战速查 Deep:DeepSeek 版的 Aider / Claude Code,开源 CLI 编程工具新选择 AI 技术日报 - 2026-05-22 PUA vs NoPUA:用恐惧还是用爱驱动 AI Agent?一场 17000 Star 的路线之争 Anthropic 停招 L6 以下:当最强 AI 公司自己都不招初级工程师了 CLI for Microsoft 365 实战:用命令行操控 Teams 收发消息 面试 AI Agent 工程师会被问什么?40+ 真题 + 知识图谱全梳理 7 个标准正在重塑 AI 开发:从 MCP 到 AG-UI,一文看懂 Agent 时代的协议栈 SpaceX IPO:史上最大上市案,1.75万亿到2万亿美元的估值到底买了什么? DeepSeek 悄悄挂出 Agent Harness 岗位:Model + Harness = Agent,要做智能体产品了? AI 技术日报 - 2026-05-21 Claw 和 Hermes 精选 10 个零成本 Skills:让 AI Agent 能力翻倍 Stainless:AI 时代最被低估的幕后公司,你用的每个 SDK 可能都出自他们之手 飞书 CLI vs 企业微信 CLI vs 钉钉 CLI:三大办公平台终端工具横评 12-Factor Agents:从 21k Star 的开源项目看 AI Agent 的正确构建姿势 AI 技术日报 - 2026-05-20 Semble:让 AI Agent 搜代码的 Token 消耗直降 98%,怎么做到的 CloakBrowser:15k Star 的隐形浏览器,49 个 C++ 补丁干翻所有反爬检测 AI 技术日报 - 2026-05-19 面向 Agent 的软件开发:当软件的第一用户不再是人类 8MB 内存跑 AI 编程代理?Zerostack 用纯 Rust 证明:Agent 不需要那么重 AI 技术日报 - 2026-05-18 AI 技术日报 - 2026-05-17 AI 技术日报 - 2026-05-16 Anthropic 发布创始人手册:AI Native 公司不是多招几个工程师,是换一种活法 "不用 AI 就会被淘汰"——这是我听过最懒惰的恐吓 0.79ms 创建一个安全沙箱:zeroboot 用 COW 打穿 AI Agent 隔离的性能天花板 2000+ API 一把梭:agentic-ai-apis 让你少写 80% 的基础设施代码 AI 技术日报 - 2026-05-15 OpenHuman:一个让你在几分钟内拥有 AI 超级智能的开源项目 开源项目怎么选 License?个人免费、企业收费的 6 种方案全对比 browser-use vs browser-harness vs agent-browser:AI Agent 浏览器自动化工具终极选型指南 AI 技术日报 - 2026-05-14 一个 Deep Agent 到底能干什么?从功能视角拆解它的全部能力 Deep Agents SDK 功能全清单:我逐行读了源码,整理出这份完整参考手册 7MB 干翻 200MB?开源终端 Terax AI 能不能替代 Warp,我替你试了 Deep Agents vs Claude Code vs Cursor:2026 年 AI 编程 Agent 终极对比 15 个 Deep Agents 实战案例:从 Deep Research 到 Text-to-SQL,看看这个框架能做什么 用 Deep Agents CLI 替代 Claude Code:一条命令装好,任意模型驱动的终端 Agent 拆解 Deep Agents 架构:中间件、后端、Profile 三板斧,这设计比我想的还深 Deep Agents:LangChain 出品的 2026 年最强开源 Agent 框架,3 行代码搞定一切 AI 时代,我辞掉了大厂工作去做独立开发者——血泪换来的 7 条生存法则 中国 AI 六小虎估值大盘点:谁在泡沫上跳舞,谁在价值里扎根 AI 技术日报 - 2026-05-13 写好 AGENTS.md 相当于白嫖一次模型升级(写错了还不如不写) GitHub 49K Star!Ruflo 让 Claude 多 Agent 协作像带团队一样简单 AI 技术日报 - 2026-05-12 罗福莉访谈深度解析:Agent 时代普通人还能干什么 AWS DevOps Agent:亚马逊的自主运维 Agent 来了 Vercel vs Netlify vs Cloudflare Pages:2026 静态托管三巨头实测对比 AI 时代,为什么中国出不了英伟达、三星、海力士? Vercel 开源 Open Agents:把 Claude Code 搬上云,关机也能干活 黄仁勋 CMU 毕业演讲全文解读:计算范式 60 年来首次被重写,每个人都是程序员 AI 技术日报 - 2026-05-11 nuwa-skill 18K Star:16 个思维 Skill 全拆解 - iTech Hermes Web UI:把 AI Agent 装进浏览器,一个面板管到底 AI Agent 工具多到选不过来?Agent MGMT 帮你一次性看清全局 营收创新高却裁员 20%:Cloudflare 用 AI Agent 告诉我们,替代已经开始了 AI 技术日报 - 2026-05-10 23K Star 的 DeepSeek TUI,真能代替 Claude Code 吗? Gumroad创始人把《极简创业》做成AI技能包:10个斜杠命令,让Claude当你的创业顾问 Open Design:3.4万星的开源AI设计工作室,让你的编程Agent秒变设计师 免费搭一个 AI 新闻雷达:Horizon 开源项目部署实战 Cloudflare Agent Setup:一行指令让 AI Agent 帮你配好整个开发环境 AI 技术日报 - 2026-05-09 AI Agent 写完代码谁来测?这个开源沙箱把 CI/CD 和多 Agent 协作全包了 7万星的AI交易框架:让大模型模拟投行多空辩论,自动做交易决策 71000颗星的AI交易团队:让大模型模拟投行分工,自动做交易决策 13400颗星的开源项目:输入一句话,AI全自动帮你做短视频 102颗星的沙盒:当AI学会自己写代码、跑测试、做部署 AI 技术日报 - 2026-05-08 29k 星的 PageIndex:不用向量数据库,靠推理就能做 RAG 每天花两小时刷信息?这个开源项目帮你全自动搞定 读源码像读小说?试了 DeepWiki 和 Zread,我再也不想裸读 GitHub 了 Matt Pocock 开源的这套 .claude 技能,为什么让工程师集体上头? Cursor Team Kit:Cursor 官方团队在用的 17 个 AI 工作流 AI 技术日报 - 2026-05-07 AI 技术日报 - 2026-05-06 - iTech AI 技术日报 - 2026-05-05 Anthropic CEO 说 12 个月内程序员要失业,我扒完他的底牌,发现事情没那么简单 把工程师的肌肉记忆装进 Claude Code,这个 4300 Star 的项目我后悔没早用 AI 技术日报 - 2026-05-04 AI 技术日报 - 2026-05-03 AI 技术日报 - 2026-05-02 六大 Agent 框架横评:谁支持 Skills?谁能自动创建 Agent?MCP 呢? Wechatsync:一个 Chrome 插件,一键把文章同步到 31 个平台 LangChain 开源了 Open SWE:Stripe、Ramp、Coinbase 内部都在造的编程 Agent Cockpit:把 Claude Code 从终端里搬出来,装进浏览器 Cursor 把自家的 AI Agent 开放了:写几行 TypeScript 就能调 Cursor 干活 AI 技术日报 - 2026-05-01
DeepSeek V4 Pro 永久降价 75%:旗舰推理模型进入白菜价时代
iTech · 2026-05-23 · via 博客园 - iTech

DeepSeek 刚做了一个让整个 LLM API 市场震动的决定:V4 Pro 的 75% 折扣永久化。

这不是限时促销。从 2026 年 5 月 31 日促销期结束后,V4 Pro 的定价将正式调整为原价的 1/4。一个支持 1M 上下文、具备推理能力、开源权重的旗舰模型,输入 $0.435/百万 token,输出 $0.87/百万 token。

这篇文章涵盖什么

  • 降价详情和新旧价格对比
  • V4 Pro 的核心能力
  • 与竞品的详细价格对比
  • 对行业的影响分析

降价详情

DeepSeek V4 Pro 定价调整(单位:美元/百万 token):

项目 原价 新价(永久) 降幅
输入(缓存未命中) $1.74 $0.435 75%
输出 $3.48 $0.87 75%
输入(缓存命中) $0.0145 $0.003625 75%

同时,V4 Flash 的缓存命中价格也降到了原价的 1/10($0.0028/百万 token),5 月 26 日生效。

时间线:

  • 现在 ~ 5 月 31 日:促销折扣期,已经是新价格
  • 5 月 31 日之后:新价格正式永久生效

V4 Pro 核心能力

特性 V4 Pro V4 Flash
上下文窗口 1M tokens 1M tokens
最大输出 384K tokens 384K tokens
推理模式 支持(可开关) 支持(可开关)
工具调用
JSON 输出
FIM 补全 非推理模式 非推理模式
开源权重
并发限制 500 2500

两个模型都支持 OpenAI 和 Anthropic 两种 API 格式,迁移成本低。

与竞品价格对比

选当前市场上主流的推理模型对比(单位:美元/百万 token):

旗舰级推理模型

模型 输入 输出 缓存读 上下文 DeepSeek 便宜多少
DeepSeek V4 Pro $0.435 $0.87 $0.0036 1M
Claude Sonnet 4.6 $3 $15 $0.3 1M 输出便宜 17 倍
GPT-5.5 $5 $30 $0.5 1050k 输出便宜 34 倍
Gemini 3.5 Flash $1.5 $9 $0.15 1048k 输出便宜 10 倍
Grok 4.3 $1.25 $2.5 $0.2 1M 输出便宜 2.9 倍
GPT-5.4 $2.5 $15 $0.25 1050k 输出便宜 17 倍
o3 $2 $8 $0.5 200k 输出便宜 9 倍

V4 Pro 在所有旗舰推理模型中价格最低,同时保持了 1M 上下文窗口。

超高性价比模型

模型 输入 输出 上下文 推理 开源
DeepSeek V4 Flash $0.14 $0.28 1M
GPT-5.4 nano $0.2 $1.25 400k
GPT-5 Nano $0.05 $0.4 400k
Gemini 3.1 Flash Lite $0.25 $1.5 1048k
Mistral Small $0.15 $0.6 256k
GPT-5 Mini $0.25 $2 400k

V4 Flash 以 $0.14/$0.28 的价格 + 1M 上下文 + 推理 + 开源权重,仍然是性价比之王。

实际使用成本对比

假设一个典型任务:100K token 输入(50% 缓存命中),10K token 输出:

模型 单次成本
DeepSeek V4 Pro $0.011
DeepSeek V4 Flash $0.004
Claude Sonnet 4.6 $0.165
GPT-5.5 $0.305
Gemini 3.5 Flash $0.098
Grok 4.3 $0.026

同样的任务,V4 Pro 的成本是 GPT-5.5 的 1/28,是 Claude Sonnet 4.6 的 1/15。

DeepSeek 全产品线定价

模型 输入 输出 缓存读 定位
V4 Flash $0.14 $0.28 $0.0028 性价比日常模型
V4 Pro $0.435 $0.87 $0.0036 旗舰推理模型

注:旧的 deepseek-chat 对应 V4 Flash 非推理模式,deepseek-reasoner 对应 V4 Flash 推理模式,未来会逐步弃用。

为什么 DeepSeek 能这么便宜

DeepSeek 的低价不是烧钱补贴,而是技术效率的结果:

  • MoE 架构:DeepSeek-V4 采用混合专家模型,每次推理只激活部分参数,降低计算量
  • MLA 注意力机制:Multi-head Latent Attention 减少KV 缓存大小,降低内存和带宽成本
  • DualPipe 并行:自研的训练/推理并行方案,提高硬件利用率
  • FP8 混合精度:推理阶段使用 8 位浮点,减少计算和显存消耗
  • 开源生态:权重开源意味着社区帮助优化,推理成本持续下降

对行业的影响

1. LLM API 进入价格战深水区

DeepSeek 每次降价都会引发连锁反应。这次旗舰模型降到 $0.435/$0.87,其他厂商面临跟随或不跟随的两难。不跟,客户流失;跟,利润压缩。

2. 推理能力不再是溢价理由

此前,推理(Reasoning)能力是高端模型的标志,OpenAI o3 收 $2/$8,Claude Opus 4.7 收 $5/$25。DeepSeek V4 Pro 证明了推理能力可以在极低成本下提供。

3. AI 应用开发门槛实质性降低

$0.435/百万 token 的价格意味着:

  • 处理 100 万 token 文档只需 $0.435
  • 一天处理 1000 次中等复杂度任务约 $5-10
  • 中小团队可以大规模使用旗舰级推理能力,而不需要预算审批

4. 开源权重的降维打击

V4 Pro 和 V4 Flash 都开源了权重。这意味着你甚至可以在自己的 GPU 上免费运行——对于有本地算力的团队,成本趋近于零。

开发者怎么用

OpenAI 格式

from openai import OpenAI

client = OpenAI(api_key="your-key", base_url="https://api.deepseek.com")

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[{"role": "user", "content": "解释量子计算"}],
)

Anthropic 格式

from anthropic import Anthropic

client = Anthropic(api_key="your-key", base_url="https://api.deepseek.com/anthropic")

response = client.messages.create(
    model="deepseek-v4-pro",
    max_tokens=4096,
    messages=[{"role": "user", "content": "解释量子计算"}],
)

V4 Pro 支持两种 API 格式,从 OpenAI 或 Anthropic 迁移只需要改 base_url 和 API key。

适用场景

  • 高吞吐场景:客服、数据分析、批量处理,V4 Flash 极低成本
  • 复杂推理:代码生成、数学证明、多步规划,V4 Pro 旗舰能力 + 低价
  • 长文档处理:1M 上下文窗口处理完整代码库、长报告
  • 初创团队:旗舰模型能力,花不到竞品 1/10 的钱
  • 自部署:开源权重,有 GPU 的团队可以零成本本地运行

作者: itech001
来源: 公众号:AI人工智能时代
网站: https://www.theaiera.cn/
每日分享最前沿的AI新闻资讯和技术研究。

本文首发于 AI人工智能时代,转载请注明出处。