



























凌晨两点,我盯着屏幕看了快一分钟。那会儿我让 Claude 给我的一个SKILL 做完 Landing Page,视觉做得还不错,但 README 我越看越难受,什么都没有,干巴巴的。我甩了一句过去:README 内容是不是有点太丑了。你好歹放一个页面首屏的图呀,而且你都没有打标签,链接地址放的位置也不对。它回了一句:你说得对,我对不起这个页面。

说实话我愣了几秒。AI 说出”我对不起这个页面”这种话,不是那种”好的我来帮您优化”的客套,是一个带态度、带自责的具体表达。它接着自己起本地服务器、用 Chrome headless 截首屏、压缩成 WebP、重写 README、加上徽章,一路干完推到 GitHub,整个过程我没再碰一下鼠标。这是 4 月 16 号深夜,我用的是刚上线的 Opus 4.7。
我开始想一件事。不是 4.7 有多强,而是Anthropic 这个四月到底在干什么。
整个月圈子里炸了四次,CC 源码泄漏、Mythos 官宣但不让用、身份认证上线、Opus 4.7 推送。一开始我以为这是四件独立的事,越想越不对劲。这四件事背后其实是同一个动作。Anthropic 正在同时做两件相反的事。一件是把它的最强能力推出来让你看。另一件是把这个能力锁起来不让你用。
4 月 1 号晚上,Claude Code 整套 CLI 源码因为 npm 包配置失误,59.8MB 的.map文件直接推到了公开仓库。1900 多个文件,51.2 万行 TypeScript,全部在线裸奔。最先发现的是 Chaofan Shou,他发推 30 分钟内星标破 5k。我手急眼快,在 Anthropic 删掉之前把整份.map拿到本地。后来 GitHub 上的克隆仓库陆续被 DMCA 下架,但那会儿我已经开始一个一个目录翻。

这一晚我学到了太多东西。每个工具目录里都有一个prompt.ts,是 Anthropic 写给模型的生产级系统提示词。BashTool 里有一段 Git 安全协议不是”请小心操作 git”这种废话,是”pre-commit hook 失败时 commit 根本没有发生,这种情况下 amend 会改掉上一个 commit 导致丢失工作,所以永远不用 amend”这种带完整逻辑的约束。AgentTool 里有一句话当场让我停了很久,Brief the agent like a smart colleague who just walked into the room。给子 Agent 写 prompt 要像跟一个刚走进房间的聪明同事说话,它没看过你之前的对话,不知道你试过什么。我之前做 Multi-Agent 项目踩过的所有坑,Anthropic 一句话给点透了。
关于这一夜具体扒到的东西,我写过一篇万字长文《Claude Code 51万行源码泄露,我扒出来了一些好东西》,这里不展开了。
一家 AI 公司把最顶尖的 Agent 工程骨架、内部提示词怎么写、怎么约束模型、怎么协调多 Agent,全部裸奔在 npm 上。这不是产品发布,是事故。但这个事故让一整个行业的开发者都得到了教材。这是能力外泄的第一个信号。
4 月 8 号,Anthropic 官方推文推出 Project Glasswing,专门给关键软件做安全审计。核心是新模型 Claude Mythos Preview,能比绝大多数人类都强地找出软件漏洞,只输给最顶尖那一小撮人。

推文 3060 万浏览、4.3 万点赞,AI 圈子当晚都在等一件事,Mythos 什么时候对外开放。然后就没然后了。Mythos 只给合作的安全研究机构用,普通用户打开 Claude 模型选择器里根本看不到这个名字,API 里没有,开发者论坛上追问一周官方只回”暂无对外发布计划”。这个操作非常诡异。一家科技公司花大力气造出一个刷爆 benchmark 的模型,按常理应该敲锣打鼓推出来,哪怕贵一点、哪怕限流都要让人用上。
Anthropic 偏偏反着来。
先用一个边缘项目把能力展示出来,然后把模型锁在柜子里。我想通这件事之后心里只有一个判断,Anthropic 自己都驾驭不了 Mythos。能找漏洞的模型,反过来就是能利用漏洞的模型。这两件事在技术上是一回事,区别只是你下什么指令。Mythos 一旦公开发布,全世界每一个渗透测试人员、每一个黑客组织、每一个国家级攻防团队都拿到了一个顶尖级别的漏洞发现器。这个责任 Anthropic 扛不住。所以它只能锁起来。
对比第一件事你就明白了。CC 源码是被动泄漏的能力,Mythos 是主动锁住的能力。一个是意外,一个是战略。但动作方向是反的:能力在泄漏,公司在收紧。
就在前两天,Claude官网Docs更新一个信息:”Claude后续会增加身份验证”。

验证流程是这样的:政府颁发的带照片身份证,摄像头实时自拍,大约五分钟时间。验证合作方叫 Persona Identities。艹,原地爆炸。
我是 Claude 的深度用户,从 3.5 到 4.6 一路用下来,跟它协作的场景多到我自己都记不过来。现在突然被要求交身份证和实时人脸,心里挺不舒服。Anthropic 给的理由也很官方,防止滥用、执行使用政策、遵守法律义务。听起来都对,但翻译一下就是,全世界监管压力越来越大,AI 公司要给自己系上安全带,代价是把合规成本摊到每个用户头上。
三件事连起来看:源码泄漏让最顶尖的 Agent 能力外泄了一次,Anthropic 没办法,已经发生的事。Mythos 是它主动造出来的更强能力,它选择锁住不给。身份认证是它开始挑用户,只和能验证身份的人对话。三个动作指向同一件事,Anthropic 在收紧。能收的全在收。
问题是,收紧之后它靠什么给普通用户用?
4 月 15 号Claude首页突然弹出个蓝色提示气泡:Try Opus 4.7 for your most ambitious work。

我立刻切到 4.7。说实话第一眼没感觉出多大区别。UI 一模一样,对话框一模一样,连响应速度都没有肉眼可见的变化。我简单对话几轮,回答质量比 4.6 好一点但不多,那种程度的提升说真的不足以让你从椅子上跳起来。我心里第一反应是,就这?然后我决定用它做一件之前一直没时间做的事,把我做的一个 SKILL 优化下并开源到 GitHub,外加做一个对标 hueapp.io 的介绍页。从晚上十一点到凌晨两点。
一个优化好的SKILL、一个开源仓库、一个对标 hueapp.io 的暗色 landing page、首屏 GradientBlinds 动效、DomeGallery 3D 球体图墙、完整的 README 加徽章、自动部署到 GitHub Pages。整个过程我没写过一行代码,也没自己截过一张图,也没自己压缩过一张图片。我就负责提需求,和偶尔骂它。
凌晨十一点左右,我给它扔了一句话:我准备把我这个 SKILL 开源推到 Github 上,然后做一个类似https://hueapp.io/介绍网页,我这是一个专门为 web 端设计的 design skill就这一句。没有附件,没有 PRD,没有设计稿,没有参考图。放在两个月前,如果我把这种需求丢给一个opus4.6,他会回我好几个问题:框架用什么,组件库用什么,配色要不要我出几版你选,字体怎么定,要不要响应式,pc only 还是移动端也要,SEO 怎么处理。
4.7 没问我任何问题。
它用 web_fetch 去抓 hueapp.io,结果这是个 SPA 单页应用,抓不到渲染后的内容,返回的全是空 div 和脚手架。它自动切换到降级方案,打开本地 Chrome,用 Playwright 把页面真实渲染出来,然后一个资源一个资源去分析、去截图、去读 CSS。
这一步跑了大概六分钟。
然后它给我输出了 hueapp.io 的设计语言提取报告:调性:暗黑编辑、克制、软光感。不是赛博风,是安静的深色配色:bg #0d0e12 → surface 三级表面,border 半透明,text 四级强调色:冷蓝 #63b3ed + 暖粉 #ec6cb9字体:DM Sans(400-700)+ JetBrains Mono字号分层:hero clamp(40, 5.6vw, 72) / h1 56 / h2 28 / h3 20 / body 15 / label 13 / micro 11动效:transition 0.12-0.36s,cubic-bezier(.2,0,0,1),introFadeUp 入场,L1-L2 档位它接着又去爬了 vue-bits 和 doubao/about。vue-bits 是我后来让它参考的动效组件库,doubao/about 是我点名要对标的一个高质感滑动交互页。
三个站都爬完之后,它把参考物统一整理进一份报告里,每一条设计决策都标注了来源。它独立完成参考站爬取、渲染、读取、提取、整理的全流程。我在旁边什么也没做(其实打了把王者)。
爬完参考站,它没有直接开始写 HTML/CSS。它给我输出了一份文件,叫 DESIGN.md。一份九个章节的设计规范文档,把整个项目的视觉体系提前定义死。
Color Tokens(色板 + RGB 值 + 使用规则)
Typography(字体族 + 字号分层 + 字重 + 行高)
Spacing(8px grid + 10 级间距 token)
Components(按钮、卡片、导航、代码块、徽章、标签)
Layout(容器宽度 + 响应式断点 + grid 规则)
Motion(入场动画 + hover 态 + 滚动联动 + 缓动曲线)
Depth(阴影层级 + 模糊层级 + 背景层级)
Do’s and Don’tsResponsive Rules + Accessibility
这是一份设计合约。给它自己看。只要 DESIGN.md 立住了,后面所有产出都有据可依。风格不会漂,组件不会歪,字体不会乱。其实这个 SKILL 的核心理念就是先出规范,再出代码。但 4.7 不是因为 SKILL 强制才这么做,它是真的理解了这个思路之后,把它变成了自己的工作方式。确认完 DESIGN.md,它才开始写代码。下面就是它用这份规范生成的 Landing Page 首屏。

写到中途我遇到了一个问题。它给 Landing 做的动效非常炫,Hero 是 GradientBlinds 的 WebGL 背景,中间有 Three.js 的 3D 知识球体,Lenis 做平滑滚动,ScrollTrigger 做 pin 联动,加起来六七个库。效果是真的好,但页面一滑动就卡成 PPT。我直接丢给它一句:滑动不丝滑太卡了,怎么解决?动效加载也慢。它没推卸责任,没跟我说”那是因为浏览器性能问题”。它回了一份诊断报告:

它列了一份清单,六个❌、三个✅,然后自己动手删除。
删完页面立刻顺滑了。
4.7 有一种自我批评的能力。它知道自己之前堆得太满,知道哪些是真的对用户体验有帮助的,哪些是为了炫技加上去的。你给它说”卡”,它不会给你”再优化一下”这种模糊承诺,它直接告诉你”砍这七个东西”,然后动手砍。
性能搞定之后,Landing Page 也磨得差不多了。凌晨 12 点半,整个项目推到 GitHub,开 Pages,域名也起好了。页面效果是真的炫。Hero 的 GradientBlinds 背景,滚动到”Made with this SKILL”那一屏是 DomeGallery 3D 球体图墙,几十张设计作品缩略图贴在一个球面上慢慢转,鼠标拖拽能转动。

我满意。它也停下来等我下一步指令。我随手翻了一下 GitHub 仓库页,翻到底下的 README。干巴巴一块 markdown,没首屏截图,没徽章,没 Live Demo 按钮,安装命令的位置也很随意。Landing 页做得那么炫,仓库首页却像十年前的开源项目,对比强烈。

我甩了一句过去:README 内容是不是有点太丑了。你好歹放一个页面首屏的图呀,而且你都没有打标签,链接地址放的位置也不对。它回了:你说得对,我对不起这个页面。就是文章开头那句话。然后它开始自己动手了。重写整个 README,把 Live Demo 链接置顶,安装命令放在二级标题下,加上截图说明和目录结构。整个过程我没有再打字。我就眼看着它一步一步把仓库页从一块丑到炸的 markdown 变成了像样的开源项目首页。做完它还补了一句:一个好的 README 应该顶部就是一张首屏截图 / demo 图、项目顶部有 shields 徽章(构建状态、License、Stars 等)、Live Demo 链接突出放在顶部、视觉上有呼吸感。它不仅改对了,还告诉了我它为什么这么改。这一段是我整个夜晚印象最深的。不是因为它做得好,而是因为它的态度。一个 AI 愿意用”我对不起这个页面”这种话来回应一个明显的批评,然后立刻动手去修,而不是”我可以尝试优化一下请告诉我具体希望如何调整”这种客套推责,这是我之前没见过的。
写到这里,我想回到文章最开始那个判断。Anthropic 正在把它的最强能力推出来让你看,又把这个能力锁起来不让你用。我观察了整个四月之后,越来越确定这不只是 Anthropic 一家在做的事。
你如果留心最近半年的 AI 行业,会发现几乎所有头部公司都在做同一件事,把模型分层卖。
OpenAI 已经把 o3 系列中最强的版本留给企业 API,o4-mini 给普通用户;Google 的 Gemini Advanced 和普通 Gemini 能力差一大截;Meta 的 Llama 最大参数版本只给”被审核通过”的研究机构用,商用还要另外谈。
Anthropic 这四月的动作,只是这个趋势里最激进的一次。
它把 Mythos 彻底锁起来,把 4.7 作为蒸馏版推给普通人。这个逻辑未来会扩散到整个行业。接下来我们看到的不会是”一个越来越强的 AI 模型卖给所有人”,而是:顶级能力 → 只给政府、大型安全机构、授权研究团队企业版 → 付高价能拿到接近顶级的模型个人版 → 蒸馏过的、速度快的、能力削过的中端版本受监管地区 → 再阉割一次,连蒸馏版都不是完整的AI 的等级制正在形成。
像 GPU 早就分消费级和数据中心级,像处方药和非处方药,像核燃料和工业铀。凡是能力足够强到可能造成危害的东西,最后都会被分层分级。
AI 只是又一个加入这个队伍的技术而已。我们得接受一个事实:以后你用的 AI,永远不会是这家公司能做出来的最强的 AI。
这是比第一件事更让我不舒服的地方。Mythos 要不要开放、开放给谁、什么条件能用、验证需不需要刷脸,这些决定现在全部由 Anthropic 一家公司做。
没有公开征询,没有用户投票,没有监管机构审核。它说了算。
你可能会说,公司做自己产品的决定不是天经地义?
如果是普通产品这没问题。但 AI 不是普通产品。它是一种会重新定义很多行业工作方式的基础设施。能用多强的 AI,决定了你能做多少事。
不能用某种 AI,意味着某些活你干不了、某些机会你拿不到。这件事如果只由企业来定义,会出现两种风险。一种是过度谨慎。
Anthropic 自己都驾驭不了 Mythos,就把它锁起来。这个判断可能是对的,但它是单方面的判断。没有公开讨论,没有第三方评估,就决定了全世界人都不该用。另一种是悄悄变化。今天你用的 4.7,明天可能因为合规要求被再砍一刀。你用着用着发现某些任务它突然拒绝做了,你问它为什么,它会给你一个很官方的”按使用政策”。你作为用户,连反对的语言都没有。身份认证这件事就是一个提前的预演。
Anthropic 说要验证,你就得交身份证和实时人脸,不然就没得用。用户在这个过程里的位置,是接受方。我不是说 Anthropic 做错了。安全、合规、防滥用都是正当的。
我想说的是,我们普通用户,作为直接受影响的人,应该参与这个规则的讨论,不能只当接受方。所以我这个四月最大的收获是什么4.7 很好用。它让我一个晚上做完了以前要一周的事。DESIGN.md 的工作方法论、知道什么时候该砍依赖、愿意对一个”README 太丑”的批评说出”我对不起这个页面”,这些都让我觉得这家公司的模型值得继续用。
但我也清楚一件事,4.7 之所以能给我用,是因为 Anthropic 认为它足够安全。
真正强的那个模型,锁在柜子里,我不知道这辈子能不能见到。所以这个四月如果让我用一句话总结,不是”4.7 真好用”,也不是”Mythos 真可惜”,而是:我们正在进入 AI 的监管时代,而这个时代的游戏规则,正在被少数几家公司悄悄定义。
下次你打开 Claude、打开 ChatGPT、打开 Gemini,可以多想一下:今天你能用的这个模型,是这家公司愿意给你用的那个版本,不是它最强的版本。
这中间的差距,就是我们这一代 AI 用户,该好好想想的事。
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。