由来
2026年5月28日,Anthropic 在他们的官网发布了一篇文章,如下

官方说的话翻译过来就是,Claude Opus 4.8 在 Opus 4.7 基础上升级,判断力更强,更能诚实反馈自己的进展,也能比上一代更长时间独立工作,而且价格不变。
这句话看着没什么,但是其实隐含很多。
Claude Opus 4.7发布时就遭人诟病,能力是强了,但是变得懒惰了。
judgment、honesty、work independently。
判断力、诚实度、独立工作能力。
这三个词充分表明了Claude未来的技术路线,不再是普通对对话的模型,而是可以真正交付工作和任务的“可靠AI同事”。
一、判断力
AI 现在不缺回答,缺的是回答的可信度真的会完全相信一个 AI 吗,把他用于自己的工作上,你真的相信他给的建议、代码吗?Claude就在做这样一件事,让 AI 变得更加长期可信。
这次的更新实现一件很难的事情:AI知道什么时候该继续,什么时候该停下,什么时候该反驳你,什么时候该承认方案不靠谱了。

二、诚实度
假设你是1个长期使用AI开发项目的人,你会仔细查看AI编写的项目的实际效果来和你的要求对比吗,你会尝试找到Bug然后让AI修复吗,我想大多数人是会的,因为人们不敢完全相信AI,这是会造成灾难性后果的,且有实际例子的。
之前的AI不会告诉你,我这个没完成,哪里可能还有问题,但是Opus 4.8现在会了
所以 Claude Opus 4.8 强调“more honesty about its own progress”
一个能诚实告诉你“我还没完成”“这里不确定”“这个测试失败了”“我需要重新检查”的模型,比一个永远自信满满的模型更可靠。
下面这张图是官方测试,得分越高的模型,越容易欺诈和配合欺骗,可以看到Opus 4.8是明显低于Opus4.7的

三、更长时间独立工作
这是一句富有重量的话,这意味着什么,对开发者、产品经理、研究员、内容团队来说,这个AI开始工作后,不会隔几分钟就来问你 “接下来该怎么做”
他从按要求,完成要求,继续接要求,变成了接任务然后完成交付。
对于Claude Code、Codex这类工具来说,Claude Opus 4.8的更新让他能在此类工具中胜任更加复杂的任务,并做得更出色!

























