惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

酷 壳 – CoolShell
酷 壳 – CoolShell
H
Hacker News: Front Page
P
Palo Alto Networks Blog
T
ThreatConnect
Apple Machine Learning Research
Apple Machine Learning Research
博客园_首页
T
True Tiger Recordings
P
Privacy & Cybersecurity Law Blog
B
Blog
IT之家
IT之家
Last Week in AI
Last Week in AI
F
Full Disclosure
Hacker News: Ask HN
Hacker News: Ask HN
C
Comments on: Blog
Microsoft Azure Blog
Microsoft Azure Blog
C
Cybersecurity and Infrastructure Security Agency CISA
Microsoft Security Blog
Microsoft Security Blog
博客园 - 【当耐特】
N
News and Events Feed by Topic
NISL@THU
NISL@THU
腾讯CDC
雷峰网
雷峰网
Security Latest
Security Latest
李成银的技术随笔
M
Microsoft Research Blog - Microsoft Research
L
LangChain Blog
L
Lohrmann on Cybersecurity
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
C
Check Point Blog
Y
Y Combinator Blog
Recent Announcements
Recent Announcements
博客园 - Franky
N
News | PayPal Newsroom
V
V2EX
A
About on SuperTechFans
The Register - Security
The Register - Security
月光博客
月光博客
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Google Online Security Blog
Google Online Security Blog
MyScale Blog
MyScale Blog
Cisco Talos Blog
Cisco Talos Blog
Vercel News
Vercel News
WordPress大学
WordPress大学
C
Cyber Attacks, Cyber Crime and Cyber Security
The Hacker News
The Hacker News
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
爱范儿
爱范儿
A
Arctic Wolf
L
LINUX DO - 最新话题
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More

博客园 - .NET骚操作

C++ vs .NET 数组原地反转实测:小数组 C++ 碾压,大数组 .NET 反杀? Sdcb Chats 1.10 私有化代码执行器部署教程 复刻 ChatGPT 高级数据分析!Sdcb Chats 1.10 重磅发布:能分析Excel、做PPT .NET 10了,HttpClient还是不能用using吗?我做了一个实验 两天烧掉200美元!我AI大模型网关终于支持了Claude模型 Sdcb Chats 1.8:又一次底层重构,彻底将模型提供商解耦 没有前端后,我把 MCP 做进了 Chats 1.7.0 AI 网关 不服跑个分?.NET 10 大整数计算对阵 Java,结果令人意外 当加密ID需要变成Guid:为什么我选择了AES-CBC而非GCM? AES 加密模式演进:从 ECB、CBC 到 GCM 的 C# 深度实践 美丽而脆弱的天体运动:当C#遇见宇宙混沌 我是不是很有钱? Chats 1.6.8 发布:全面支持最新的 gpt-5 模型等 Sdcb Chats 1.6.6 发布,彻底移除 Azure.AI.OpenAI 专用包 那些被推迟的 C# 14 特性及其背后的故事 我最喜欢的 C# 14 新特性 更复杂的代码,为何跑得快了10倍?一次Draw Call优化引发的思考 一个被BCL遗忘的高性能集合:C# CircularBuffer<T>深度解析 当物理定律与高精度计算相遇:我的新开源项目 N-Body
从 OpenAI 兼容到 Anthropic 崛起:大模型“交错思考”协议的演进与变局
.NET骚操作 · 2026-01-13 · via 博客园 - .NET骚操作

曾几何时,大模型开发者的世界是单纯而美好的。无论是 OpenAI、Claude,还是后来的 DeepSeek、Moonshot等,大家都在讲同一种语言——OpenAI Chat Completions API

那时候,我们只需要换一下 base_urlapi_key,把之前的聊天历史(User/Assistant/Tool消息)一股脑传进去,就能无缝切换模型。工具调用(Function Calling)虽然各家微有差异,但本质逻辑也是通用的。

然而,随着“推理模型”(Reasoning Models)的爆发,这座巴别塔开始摇摇欲坠。特别是当我们需要让 Agent 进行多步工具调用(Multi-turn Tool Use)时,一个核心问题浮出水面:模型之前的“思考过程”,到底要不要传回去?如果传,怎么传?

这就是各大厂商正在混战的焦点——交错思考(Interleaved Thinking)

为什么我们需要“交错思考”?

在 DeepSeek R1 刚出来的时候,官方文档有一句不起眼的建议:“在多轮对话中,建议舍弃 reasoning_content(思维链内容)。” https://api-docs.deepseek.com/zh-cn/guides/thinking_mode
deepseek-r1

对于简单的问答,这没问题。但对于 Agent 来说,这是致命的。这里有两个核心理由,一个是显而易见的“智商”问题,另一个则是反直觉的“成本”问题。

1. 拒绝“失忆”:让模型记住决策路径

试想一个复杂的编程任务,模型在第一步通过思维链(CoT)决定了代码架构,并调用了 read_file 工具。如果我们在第二轮对话中把这个思维链丢弃了,模型就像“失忆”了一样,它只看到了自己发出的 read_file 命令,却忘记了“为什么要这么做”以及“原本计划下一步做什么”。结果就是模型被迫重新推理,甚至做出与上一步逻辑相悖的决策。

2. 意想不到的经济账:Prompt Cache 的魔法

很多人直觉上认为:回传思维链会增加 Input Token 的数量,肯定更贵、更慢。
大错特错。

在支持 Prompt Cache(提示词缓存)的计费体系下(如 DeepSeek、Anthropic 等),缓存命中的 Token 价格通常仅为未命中的 1/10 甚至更低。
思维链(Reasoning)通常位于工具调用(Tool Call)的前面。如果我们完整回传“User -> Reasoning -> Tool Call”,这整个序列作为“上文前缀”,极易触发 Prompt Cache 命中。

这意味着:回传思维链,虽然 Token 变多了,但因为缓存命中率大幅提升,实际推理速度反而更快,综合成本反而更低! 反之,如果你为了省 Token 删掉了思维链,模型可能因为上下文断裂而不得不输出更多的 Output Token 来“找补”逻辑,那才是真正的昂贵。

混乱的演进史:各家厂商的“补丁”与“创新”

为了实现这一目标,各大厂商的 API 协议分裂成了“战国七雄”。回顾 2025 年,我们可以清晰地看到这场协议演进的时间线。

1. Anthropic 的“降维打击”:Messages API 的原生引领

当整个行业还在摸索如何处理推理模型的思维链时,Anthropic 在 2025 年 2 月发布的 Claude 3.7 Sonnet 中,率先展示了什么是“原生支持”的交错思考。

在 Anthropic 的 Messages API 中,思维链不再是附属品,而是 extended thinking 协议的核心。它强制要求回传思维链,并且引入了 signature 字段进行防篡改签名。
messages-api

这种设计非常清晰、严谨。以至于后来的 MiniMax 和 DeepSeek V3.2 甚至在其官方文档中宣布支持 Anthropic Messages API 格式。这从侧面证明了该协议在设计上的优越性——它是目前做 Agent 对话和多步工具调用体验最好的协议,简单、纯粹,是名副其实的先驱。

2. OpenAI 与 Google:封闭与曲高和寡的跟随

面对 Anthropic 的先发优势,老牌霸主们的反应显得有些迟缓和复杂。

OpenAI 直到 2025 年 3 月才推出 Responses API,允许通过 include: reasoning.encrypted_content 回传加密的思维链。这种协议结构复杂,与原有的 Chat Completions 差异巨大,导致生态响应寥寥。

Google Gemini 则在 2025 年 11 月走向了另一条路。它坚定地支持了思维链回传,但它非常“高冷”——这一功能仅在 Gemini 原生 API 中提供。如果你使用的是 Google 提供的 OpenAI 兼容接口,抱歉,不支持补丁,无法回传。这种“曲高和寡”的策略,使得想用一套代码兼容所有模型的开发者必须单独为 Gemini 写一套适配逻辑。

3. MiniMax M2:从标签视觉到协议补丁

到了 2025 年下半年,国产厂商开始尝试用更直接的方式解决问题。

2025 年 10 月发布的 MiniMax M2 借鉴了 DeepSeek R1 早期的视觉标签概念,并将其强化为一种交错思考协议。它允许模型通过 <think> 标签输出思考过程,并要求用户在下一轮对话中将这些 <think> 内容按原样回传(Interleaved)。虽然也支持拆分字段,但其核心逻辑是在现有文本流中嵌入标签。这相当于给 Chat Completions API 打了一个“文本级”的补丁,虽然解决了问题,但处理字符串解析总是显得不够优雅。

minimax-m2

4. DeepSeek V3.2 的突破:完美的 API 补丁

而在 2025 年年底,DeepSeek V3.2 的出现为这场混战带来了新的曙光。

2025 年 12 月的更新中,它没有破坏 Chat Completions API 的基本结构,而是允许在输入端(Messages 数组)中直接包含 reasoning_content 字段。

deepseek-v3.2

这是一个极其聪明的“协议级补丁”。输入和输出字段高度一致,对现有生态侵入性最小。我认为,DeepSeek 的这种“增强版 Chat Completions”方案,是最有希望在未来重新统一 Chat API 江湖的路径之一

大模型“交错思考”演进时间线

为了更直观地看清这场混战,我整理了各大模型支持交错思考的关键时间点:

2025.01DeepSeek R1 输出 reasoning_content 确立了思维链字段标准,引入 <think> 视觉概念,但当时未标准化回传机制。 2025.02Claude 3.7Messages API (Extended Thinking) SOTA 级设计。必须回传,带签名防篡改。设计最优雅,被多家厂商兼容。 2025.03OpenAI Responses API 支持回传加密思维链。协议太重,生态响应冷淡。 2025.10MiniMax M2 标签包裹 / 原样回传 要求回传 <think> 内容。虽有效,但解析标签增加了协议复杂度。 2025.11Gemini 3.0 Pro原生 API 支持 功能很强,但仅限原生 API。OpenAI 兼容接口不支持回传,导致集成成本极高(曲高和寡)。 2025.12DeepSeek V3.2增强版 Chat Completions 允许输入端包含 reasoning_content最具潜力的通用方案,兼顾了兼容性与功能性。 2025.12GitHub Copilot v1.107 更新 终于支持通过改造后的 Chat API 回传 reasoning content,体感大幅提升。
时间 模型/事件 协议/特征 评价

变局:开发者该何去何从?

我们现在正处在一个“变局”之中。

一方面,Anthropic Messages API 凭借其优雅的设计,正在成为高端 Agent 开发的首选,甚至引发了其他厂商的兼容;另一方面,DeepSeek V3.2 推出的“增强版 Chat Completions”方案,凭借对旧生态的极致兼容,极有可能成为事实上的工业标准。

而最尴尬的,反而是原本的霸主 OpenAI,以及不得不切回原生 SDK 的 Google Gemini。

作为开发者,我们不想陷入这种协议的泥潭。我们需要的是:写一套代码,接入所有模型,并且都能拥有完美的“交错思考”体验,同时还能吃到 Prompt Cache 的红利。

这正是我开发 Sdcb Chats 的初衷。

在最新的 1.9.0 版本中,我重点解决了这个问题:

  1. 统一网关:无论底层是 OpenAI、DeepSeek 还是 Gemini,Sdcb Chats 都能帮你屏蔽差异。
  2. 拥抱先进协议:全面支持 Anthropic Messages API 协议格式。你可以用 Claude 的原生体验来调用 DeepSeek V3.2 或 MiniMax,享受一致的思维链回传和防篡改机制。
  3. 自动适配:对于支持“增强版 Chat Completions”的模型,网关会自动处理字段映射,你只需关注业务逻辑。

协议的战争可能还会持续很久,但你的代码不应该为此买单。

如果你也受够了写 if (model == "deepseek"),欢迎来试用 Sdcb Chats,让我们一起以不变应万变。

👉 项目地址: https://github.com/sdcb/chats