惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
Cisco Talos Blog
Cisco Talos Blog
T
Threat Research - Cisco Blogs
P
Privacy International News Feed
S
Schneier on Security
P
Privacy & Cybersecurity Law Blog
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
云风的 BLOG
云风的 BLOG
P
Proofpoint News Feed
Scott Helme
Scott Helme
人人都是产品经理
人人都是产品经理
G
GRAHAM CLULEY
O
OpenAI News
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
PCI Perspectives
PCI Perspectives
GbyAI
GbyAI
宝玉的分享
宝玉的分享
Y
Y Combinator Blog
T
Troy Hunt's Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
C
CXSECURITY Database RSS Feed - CXSecurity.com
腾讯CDC
C
Check Point Blog
Spread Privacy
Spread Privacy
L
LINUX DO - 最新话题
Recent Announcements
Recent Announcements
大猫的无限游戏
大猫的无限游戏
P
Palo Alto Networks Blog
Hacker News: Ask HN
Hacker News: Ask HN
M
MIT News - Artificial intelligence
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
The Hacker News
The Hacker News
H
Hacker News: Front Page
Microsoft Azure Blog
Microsoft Azure Blog
I
InfoQ
T
Tor Project blog
Martin Fowler
Martin Fowler
博客园 - 叶小钗
罗磊的独立博客
C
Cyber Attacks, Cyber Crime and Cyber Security
H
Heimdal Security Blog
V
Vulnerabilities – Threatpost
Simon Willison's Weblog
Simon Willison's Weblog
Latest news
Latest news
WordPress大学
WordPress大学
G
Google Developers Blog
N
Netflix TechBlog - Medium
S
Security Affairs
S
Secure Thoughts
Know Your Adversary
Know Your Adversary

InfoQ - 促进软件开发领域知识与创新的传播

Meta 收购 Manus 这事儿泡汤了 5.5万 Star 开源项目 Ghostty 被迫出走,GitHub 正在终结一代技术人的乌托邦 Slack 长时运行多智能体系统的上下文管理方案 从 T+1 到分钟级:金城银行基于 Apache Doris 构建高可靠、强一致的实时数据平台 谷歌云推出 Agents CLI,简化 AI 智能体开发全流程 Claude官方击穿高薪、高学历的安全防线!Anthropic点名10大高危职业,但有群人暂时稳了 亚马逊云科技终止 WorkMail 服务,并将 App Runner 转入维护模式 OPPO小布记忆:全模态碎片化内容的理解与智能整理实践|AICon上海 模力工场038周AI应用周榜:工具在消失,工作流在出现 Akamai CEO Tom Leighton:Agent 时代来临,云基础设施正从“中心化”转向“分布式边缘” 日均数百亿入库背后:从“人肉调度”到K8s弹性架构,度小满金融基于OceanBase重构入库架构实践 百度文库网盘发布GenFlow 4.0:月活用户超1亿,要把网盘变成全端AI工作台 Altman 投的 Agent 终端 Warp 开源了!斩获3.5万star 哪些客户需要拒, 敢让龙虾决定吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从开发到生产:为什么越来越多的机器学习团队纷纷迁移到 Snowflake | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 探索多智能体工作流:LangGraph Snowflake Cortex AI | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 腾讯云分布式缓存数据库:AI Agent - 从提示词工程到 Harness 工程 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 基于 Streamlit 为 CSV 数据构建分析智能体 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 AI 智能体:告别文档缺漏 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 构建 AI 驱动的数据管道:深度探讨 Snowflake Openflow 与非结构化数据 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 云端太贵、本地不够聪明,英特尔押注“端云混合AI”:智能体PC会替人完成工作 不到10%的存储投入,可能拖垮90%的GPU投资!IBM把AI Agent塞进存储系统,算清企业最容易忽略的一笔账 Snowpark 上手实战 | BUILD 2025_大数据_王玮_InfoQ精选视频 ClickHouse + Langfuse,构建 Agent 可观测基石 腾讯云分布式缓存数据库:Cluster Proxy 共享连接架构深度解析 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 AI 写代码太烧钱了:Copilot、Claude 一起涨价,不如把程序员请回来? 英特尔发布至强600系列工作站处理器与锐炫Pro B70 GPU,全新AI工作站来了 腾讯云分布式缓存数据库:从 Redis 到 Valkey - 开源社区如何快速创新 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 印奇这次要“从0重做”智驾模型!首谈阶跃和千里双公司布局:中国AI商业闭环要靠车跑出来 从Cursor返聘归来,90后华裔女高管带Claude开启日更模式:token成本比工程师工资低多了! 从 Coding 到 Agent:QCon 北京 2026 全景复盘,优秀出品人 & 明星讲师名单揭晓 全链路支撑大模型国产化“Day 0适配”,商汤大装置构建全栈能力底座 凌晨,OpenAI 与亚马逊云科技史上最大联合发布来了 HashiCorp Vault 2.0 发布:引入新身份联邦机制,迈入 IBM 生命周期体系 Yelp 实现超 1,000 个 Cassandra 节点零停机升级 写了 17 年开源代码,我为什么认为 Coding Agents 堆功能是在瞎折腾? 基于 Apache Camel 编排智能体与多模态 AI 管道 面向智能体与人类用户的AI记忆系统:架构设计与核心场景实践|AICon上海 Anthropic 推出 Managed Agents,简化 AI 代理部署流程 阿里HappyHorse开启灰测,720P视频生成低至0.44元/秒 讯飞联合清华团队押注量子AI:不看营收、不设KPI,一群“无人区”科学家,抢夺下代AI算力入口 小米万亿模型全面开源:MIT 协议、1M 上下文,但还是打不过 DeepSeek Cortex Code 入门指南:面向数据工程师的实践路径 | 技术实践 openJiuwen社区首发Team Skills,定义Coordination Engineering新范式 用 Snowflake Cortex Agents 释放结构化数据的最大价值 | 技术实践 Grafana 利用 Kafka 对 Loki 进行了架构重构,并发布了一款命令行工具,旨在将可观测性引入编码代理 ClickHouse重构全文索引:对象存储上跑出高性能 Full-Text Search 可观测性和遥测技术如何提升软件工程实践 Dropbox 与 GitHub 合作,将单体库大小从 87GB 缩减至 20GB Agent 的下一站:基于长期记忆系统 EverOS 的自我演进|AICon上海 同一赛道,四种收费:Agent 控制层(Harness)开始分裂 Cloudflare Sandboxes 正式发布,为 AI 代理提供持久化隔离环境 Agent 的“记忆断片”困局,该怎么破?_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选视频 数据分析师如何快速建立在 AI 时代最值钱的能力:一份可落地的行动路线图 摩尔线程最新财报:研发占比超86%,万卡级大规模智算集群落地 当云区域失效:地缘动荡环境下的高可用重构 Slack 重构通知系统,设置参与度提升 5 倍 智能体工程的隐性技术债务 “我把所有模型都换成了DeepSeek V4”:月账单将降 90%,效果还更好 阿里云智能集团高级技术专家刘少伟已确认出席AICon上海站,并分享如何构建企业 Agent 的自动化行动架构 构建生产就绪的 tRPC API:Apollo Federation 的 TypeScript 替代方案 Anthropic推出面向Claude Code的基于智能体的代码审查功能 北京车展直击:斑马智能甩出车载Agent短剧,比亚迪率先落地,AI让智能座舱又热起来了 Snowflake 作为智能体运行时:从静态管道迈向自主数据系统 | 技术实践 Snowflake 上的本体体系:基于 Cortex Code 能力实现从架构到部署 | 技术实践 Cloudflare 公布 MCP 架构方案,应对企业面临的安全与治理风险 复杂的项目管理怎么做到「AI 友好」?飞书项目用「开放」给出答案 Snowflake Cortex Code 的规范驱动开发:将 SDLC 方法论引入 AI 辅助工作流 | 技术实践 Copilot 不让注册了:从“随便用”到“全面限”,agent 把原有订价模型顶穿了 当互联网用AI卷效率时,这家公司先问了一连串“能不能” Meta 开始记录员工每一次点击:AI 要接管工作,先监控会工作的人 Meta“Token榜”逼疯打工人,一夜烧掉公司几万刀!AI时代Token焦虑越来越离谱 智源FlagOS完成DeepSeek-V4-Flash在八款芯片Day0适配,实现三重技术突破 DeepSeek V4 重磅开源!首次打通华为Ascend,也没丢掉英伟达,百万上下文夺回国产模型话语权 李志飞的“新实验”:当超级个体撞上真实组织 GPT-5.5 登顶时刻,Anthropic 亲口承认 Claude 变笨了!网友群嘲:太敷衍 那些没空写的小需求,龙虾真能做吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从 Pandas 到生产:使用任意 IDE 进行可扩展的 ML 数据管道与分布式处理 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 pnpm 11 候选版本发布,带来 ESM 分发、供应链默认设置以及新的存储格式 银行业PDF表格提取方案重构:基于Java的分层方案 GPT-5.5 赢了 Opus 4.7 和 Mythos?奥特曼晒黄仁勋内部信:英伟达全员用上 Codex! Cloudflare 推出 Think:一款面向 AI 代理的持久化运行时 1850亿美元天价支出、75%代码由AI生成!谷歌正式宣告:全面转向智能体工作流 xAI落后太多,马斯克“开大”重金求购Cursor,100亿美金“分手费”都敢签! Pulumi 新增对 Bun 运行时的全面支持 姚顺雨腾讯模型首秀!不卷参数只做 “听话打工人”,Hy3 preview登场 | 附实测 老板让你“忽悠”投资人,你敢发给龙虾吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 Gemini CLI 引入子代理机制,实现任务委派与并行代理工作流 清华系团队星工聚将完成数千万天使轮融资,轮式机器人拿下头部制造企业亿级大单 Pretext.js 绕过 DOM 布局重排,实现 120 FPS 的高级交互体验 靠“AI 云”爆红的 Vercel,栽在一个第三方AI工具手里!IPO前夕遭黑,200万美元赎金谈崩? 高能研讨会|端侧 AI 正在重写实时感知效率上限_AI&大模型_王玮_InfoQ精选视频 2050大会看这篇就够了|报名、交通食宿指引大全 Java 近期资讯:OpenJDK JEP、Jakarta EE 12、Spring Framework、Micrometer、Camel、JBang 金融智能的架构编排:基于 Snowflake Cortex Agents 实现结构化与非结构化数据统一分析 | 技术实践 在AK大神爆火的任务里,摸清国产AI真实水平 百灵Ling-2.6-flash 正式发布:高 Token 效率,以 1/10 消耗实现 SOTA 级 Agent 能力 当 PM 懂AI,当技术懂产品:AI 时代产品力的双向进化|PM x AI产品力领航者大会即将开幕 为 AI 智能体设计记忆机制:揭秘 LinkedIn 的认知记忆智能体 获奖名单公布|2026主题征文第一期|分享你最有价值的龙虾场景与核心 Skill_热门活动_InfoQ写作社区官方_InfoQ写作社区
AI 把编程这件事接管之后,作为程序员的我该何去何从?
周云龙 · 2026-05-10 · via InfoQ - 促进软件开发领域知识与创新的传播

编者按:

当“AI 正在接管编程”成为技术圈最热门、也最容易被情绪化传播的话题之一时,真正值得追问的,或许并不是“程序员会不会消失”,而是:当代码生成越来越廉价之后,软件工程中真正稀缺、也真正不可替代的能力,究竟会转移到哪里。这篇文章并不回避 AI 对初级开发岗位带来的真实冲击,也不满足于重复“程序员不会被替代”的安慰性判断。作者试图回答的是一个更具体、也更现实的问题:在 AI 已经深度介入编码流程之后,工程师的核心价值是否正在从“写代码”转向“定义问题、设计验证机制、控制风险并完成系统交付”。

前一阵看到一条新闻,Claude Code 的创建者 Boris Cherny 在一档播客里说“编程被解决了”。这句话被国内不少自媒体反复引用,标题取得很重——“程序员的时代结束了”、“AI 替你写代码的时代来了”。

如果你真去翻那期原始播客,会发现节目的标题写得相当克制:「Head of Claude Code: What happens after coding is solved」——重点不在“被解决”,而在“之后”。Boris 在节目里坦白自己自去年 11 月起一行代码都没手写过,每天提交几十个改动都靠 Claude Code,但他紧接着补了一句:所有合并请求仍然要先过 Claude 自动审一遍,再过一道人工审核这一关。主持人 Lenny 在节目里替他总结了这件事——以前的瓶颈是写,现在是审。

这个细节在传播过程中被删掉了。但被删掉的不是无关紧要的修饰,恰恰是整件事最有信息量的部分:编程没有被消灭,它的瓶颈从一处转移到了另一处。问题是——转移到哪了?转移之后,做软件工程的人到底要做什么?

这些也是这篇文章想回答的问题。我首先会承认 AI 在替代论上确实命中的那一部分,然后再解释为什么“程序员要失业了”是夸大其词,最后尝试给出一个具体的判断:工程师的工作正在从一种活变成另一种活,那个新的活叫什么、怎么练。

真的有人在被替代

先说真的那部分。

斯坦福数字经济实验室在 2025 年中期发布的一组数据显示,22 到 25 岁的软件开发者就业率,自 2022 年底高峰起已经下降了将近两成。这是一条相当陡的曲线。同期更多的数据也在印证——全球初级开发岗位过去一年缩水两到三成,英国科技行业的应届岗位 2024 年缩减了近一半,2026 年第一季度全球科技公司裁员里,明确归因到“AI 替代”的占比从去年不到一成跳到了五分之一。

数字背后是岗位品类层面的塌陷。我不需要列举太多类型,几个例子就够了:纯切图的前端、写增删改查的初级后端、套模板做后台管理系统的工程师、刚毕业还在练手的新人。这些岗位的共同点是任务清晰、变种不多、出错容易看出来——也就是说,是 AI 现在最擅长接管的那一类。

如果你的工作是五年前那种入门级任务的当代版本,那 Boris 那句话对你来说就是真的。这一段没什么好安慰的,我也不打算用“AI 创造了更多新岗位”这种空话来搪塞。新岗位会有,但不一定落到你头上、不一定按你期待的速度落下来。

但替代论的另一半是夸大的

让我举三个反例。

第一个反例,AI 编程最热情的鼓吹者之一、前 OpenAI 的 Andrej Karpathy。他在 2025 年初创造了一个词 vibe coding,大致意思是“完全把代码托付给模型,连改动都不看一眼“。但同年十月他自己开源了一个叫 Nanochat 的项目(一个迷你版的 ChatGPT 完整训练管线),他在仓库的讨论区里很坦白地写道:这个东西基本上是手写的,我也尝试过让 Claude 和 Codex 帮忙,但它们做得不够好,反而帮倒忙——大概是因为这个仓库离它们见过的数据分布太远了。vibe coding 这个词的发明者,自己做严肃技术项目时回到了手写。原因不是模型不强,是模型没见过这种东西。

第二个反例更有意思,来自 Anthropic 官方。他们在一篇讨论“长任务智能体框架“的工程博客里,公开承认了 Claude 的一个失败模式:我们观察到的最严重的失败模式之一,是 Claude 倾向于把一个功能标记为完成、但实际上没有经过真正的测试。模型厂家自己说出这种话的分量很重——你要他们承认这件事,跟让一家车厂承认自己刹车在某些工况下会失灵差不多。

第三个反例是数据。已经有相当多学术研究在跟踪 AI 写的测试到底靠不靠谱,结论很不乐观。AI 生成的测试普遍偏向“正常路径“——也就是只检查代码在最理想输入下不出错,不会去构造边界值和坏输入。一个被广泛引用的实验中,AI 生成的测试在变异测试(一种衡量测试到底能抓多少 bug 的方法)下的得分只有四成左右,而专业工程师的水平通常在七成以上。另一个实验里,AI 生成的测试准确率只有 6.3%——也就是每一百条测试里只有六条是真正在检查代码该检查的事,其他都在做无效断言。

这三个反例放在一起,指向同一个结论:AI 不是不能写代码,是不能可靠地验证自己写的代码。它能造,但它没法判断造的对不对。

真正的分界线是“可验证性”

那 AI 能不能搞定一个项目,分界线到底在哪?

很多人——也包括我自己最初的直觉——会把“AI 能不能搞定”对应到“项目复杂度”。小项目能全包,大项目就不行。但这个分法经不起推敲。Anthropic 自己用 Claude Code 来写 Claude Code,Cursor 团队用 Cursor 来写 Cursor,这些都不是小项目,是几十万行的产品代码。复杂度不是真分水岭。

更准的分法,我觉得是可验证性。具体说就是:一段代码写出来之后,确认它做对了的成本有多低?

如果验证成本低——比如写一个小工具函数,跑一下输入输出就知道——AI 可以全包,验证可以彻底自动化,错了立刻能发现。

如果验证成本高——比如改一段并发逻辑,错了可能要在生产环境跑几天才显现;改一段支付链路,错了直接是钱的损失;改一段老代码,错了破坏的是十年前某个人在某种特殊场景下做的兼容;重构一个跨服务的接口,错了影响的是其他团队的代码——这种代码 AI 不是不能写,是它写完之后你没法快速判断对不对,怀疑的代价远大于实现的代价。

这条线划清楚之后,很多事就好理解了。Simon Willison 给过一条非常硬的判断:“我不会把任何我无法向另一个人解释清楚的代码合并到我的仓库。”翻译成工程语言就是:你能不能验证代码——以你自己作为标尺——是合并的前提。Redis 作者 antirez 也说过类似的话,他用了一个更工程化的比喻——人是用来帮代码跳出局部最优解和错误的。这个“跳出”,靠的不是写代码的能力,是判断代码偏离没偏离需求的能力。两个人说的其实是一回事。

一个翻车的实例

讲一个具体的故事。这是我自己最近一段时间的项目。

我用 Claude Code 加规范驱动开发的工作流,跑通了一个九个包的中型代码仓库(一个 AI 设计工程智能体)。其中有一个版本号叫 Sprint 3.3 的任务,是把现有的元素检查器从“只读”升级为“所见即所得 CSS 编辑面”——用户在预览界面里点中元素,直接拖滑块改 padding、改圆角、改阴影,改完一键让 AI 把变化写回源码。

这个 Sprint 又拆成 13 个子任务,前 12 个是实现,第 13 个是收官——跑手工测试和端到端自动化测试。AI 把前 12 个任务做完,每一个都有自动化测试覆盖,每一个都标了“通过“。流程顺得让我开始相信这个 Sprint 一定能合入主线。

但第 13 个任务,也就是真正的需求级验证,一上手就翻车了。

翻出来的不是一个坑,是三个。第一,发布到包仓库上的客户端插件版本是上一个 Sprint 锁的旧版本,新加的“修改样式”消息处理函数根本没打进去,真实用户场景下改属性界面纹丝不动。第二,端到端自动化测试默认进入了非选中模式,鼠标点击元素被吞掉,所谓“选中”的事件压根没触发过,前面跑通的那些“通过”全是假象。第三,跨测试套件复用同一个测试夹具时状态没清干净,五个核心场景的预览容器加载到的是错的项目地址,等了 15 秒还是错的——但每一个测试用例自己都标“绿”。外加四五处体验上的小问题:输入框焦点抢占、应用按钮点完后预览闪一下、撤销快捷键在某种边界条件下会越界。每一个单独看都不致命,叠在一起,这个 Sprint 我没法上线。最后我做了一个不太好做的决定——把整个 Sprint 从主版本里撤出,界面入口隐藏,底层代码全保留留作以后重启用。十二个任务的工作,被一个收官手测全盘掀翻。

我反复看这件事的成因,最后只能归到一句话——这句话其实就写在我自己项目的规范文件里:

测试和验证清单必须从需求出发推导,禁止“读代码反过来写测试”。读代码写出来的是“代码复读机”,只验证“代码按我写的方式运行”,不会发现“代码是否满足用户需求”。

AI 写的实现“通过”了 AI 写的测试,这没什么意外的。意外的是我之前居然真的相信了那个绿色的勾。前 12 个任务的“通过”,全部是 AI 在代码层面对自己代码的自我证明,不是从需求层面对代码的真正验证。这次翻车不是 AI 的能力问题,是我把“验证”这件事整个让 AI 接管了——而验证恰恰是它最弱的那一环。

顺带一个不展开的问题

写到这里要停一下,承认一个我故意还没展开的事。

如果上面那一段数据是对的——AI 真的在快速接管入门级的工作——那五到十年经验的工程师从哪里来?没有今天的入门级新人,就没有五年后的中级、十年后的资深。一个职业的“育苗床”如果被抽掉,这个职业会怎么演化?是只剩有经验的人和一群 AI、再没有新人?是新人的入口从“写代码起步”变成“第一天就直接做需求拆解和验证机制”?是中级和资深这一档的成长曲线整个变形?

这个问题我不打算在这篇文章里展开,它需要的不是一段而是一篇文章,而且更适合让人力资源研究者、教育工作者、招聘经理来回答,不该是一个一线工程师下结论。但我提它,是想说:当我们这些已经在职的工程师讨论“如何用 AI”时,其实是在一艘自己脚下正在下沉一层的甲板上讨论。这个事不能装看不见。

编者按:如果你对这一话题有自己的观察、经验或观点,欢迎联系本文编辑(微信 caifangfang_wechat【请注明来意】),一起讨论。

工程师的工作正在从一种活变成另一种活

回到主线。

把上面这些放在一起,能画出一个我自己用了几年才明确下来的判断:在 AI 编程的时代,工程师的核心工作正在从“写代码”转向“系统性地把高成本验证的任务转化为低成本验证的任务”。

前者交给 AI,后者是人不可替代的部分。

这话听起来抽象,落到日常工作里其实非常具体。

写一个测试不再只是为了“抓 bug”——AI 写测试比你快,但它写的测试只覆盖正常路径——你的测试要从“用户怎么用、会踩哪些边界、错了怎么恢复”出发。写一个类型定义、一个接口契约不再只是“做文档”——它是给 AI 划定可以工作的边界,让它越界的时候你能立刻发现。写日志、写监控、写告警、写灰度、写回滚——这些过去被认为是“运维相关”的工作,今天变成核心工程能力。因为 AI 写的代码上线之后,你不再能像过去那样“读懂每一行所以放心”,你只能靠这些机制在它出错时第一时间知道。

代码评审也在变。过去你审的是“这段代码写得对不对、漂亮不漂亮”。今天 AI 一天可以提交几十个变更,你按这种速度审根本审不完——审不完不是程序员的问题,是审的方法已经不对了。新的审法是审验证机制本身:这个变更有没有对应的需求级测试、有没有可观测性兜底、有没有能在三十秒内回滚的开关。审一段代码可能要十分钟,审“这段代码周围的安全网齐不齐”可能只要一分钟。

Anthropic 自己的工程博客把这个判断写得很直白——模型再强,给它一个高层提示让它自己跑,它做不出生产级产品。让它能跑稳的,是套在模型外面那一圈他们叫 harness(直译大概是“挽具”,可以理解为给 AI 套上的工作骨架)的东西。换句话说,能不能交付高质量产品,不取决于模型能力,取决于框架设计能力。这不就是把“工程师的活”重新定义成“建框架而不是写代码”吗?

GitHub 2024 年开源的 Spec Kit、亚马逊 2025 年发布的 Kiro,都在沿着这条路推——把规范当成可执行的、第一类的工件,先写规范再写代码。规范驱动开发这个词在国内圈里也开始火起来。这不是孤立的产品发布,是一个行业方向。

那 5 到 10 年经验的你,应该开始做哪些准备

回到本篇文章的目标读者——已经在用 AI 写代码、但还没把“怎么用 AI”系统化的 5 到 10 年经验的工程师。如果上面这套判断是对的,这一阵子你应该开始准备几件具体的事。

学会写“需求驱动”的测试,而不是让 AI 看着实现给你反推一份。具体做法是:拿到任务后先闭眼把“用户怎么用、会踩哪些边界、出错怎么恢复”列一遍,列完再让 AI 写代码、再把这份清单变成测试。这个动作 AI 替不了你。

把过去你认为是“运维或基础设施团队管”的那些事——可观测性、灰度、回滚——纳入你日常代码工作的一部分。这是你新的安全网,AI 写得越快越多,这张网就要越密。

重新校准你的代码评审节奏。不要再花时间审风格、审命名——这些 AI 已经能管。把时间花在审“这段变更周围的验证机制是否齐全”上。

主动找一些 AI 不擅长的活儿——业务边界模糊的需求拆解、跨团队接口的对齐、老代码的判断式重构、灰色地带的产品决策——把这些当成你的核心战场,把可以让 AI 跑的部分坚决让出去。

最后说回 Boris 那句话。“编程被解决了”听起来像一个时代的终结。但如果你听完整期播客就会发现,他自己的工作并没有变得轻松——他从写代码的人变成了同时操控五个智能体、每天审一堆合并请求、不停做架构决策和验证机制设计的人。他失去的是“亲手敲代码”这件事带来的心流和踏实感,得到的是更高的杠杆和更模糊的责任边界。

这不是一个程序员失业的故事,是一个程序员的工作内容被重新定义的故事。重新定义之后,你这 5 到 10 年攒下来的东西——对系统的整体感、对边界条件的直觉、对什么会出错的嗅觉、对人和需求的理解——其中相当大一部分非但没有贬值,反而比过去任何时候都更值钱。前提是你愿意把“会写代码”这块勋章先放下。

关于文中未展开的那个问题——如果 AI 持续吞噬初级岗位,未来五到十年后的资深工程师从哪里来?中高级工程师的培养链条将如何延续?如果你对这一话题有自己的观察、经验或观点,欢迎联系本文编辑(微信 caifangfang_wechat【请注明来意】),一起讨论。

参考来源

  • Lenny Rachitsky.「Head of Claude Code: What happens after coding is solved(Boris Cherny 访谈)」. Lenny's Podcast, 2026 年 2 月. https://www.lennysnewsletter.com/p/head-of-claude-code-what-happens

  • Andrej Karpathy.「Introducing nanochat: The best ChatGPT that \$100 can buy」. GitHub Discussions, 2025 年 10 月. https://github.com/karpathy/nanochat/discussions/1

  • Anthropic.「Effective harnesses for long-running agents」. Anthropic Engineering Blog, 2025 年. https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents

  • Simon Willison.「Not all AI-assisted programming is vibe coding (but vibe coding rocks)」. simonwillison.net, 2025 年 3 月. https://simonwillison.net/2025/Mar/19/vibe-coding/

  • Salvatore Sanfilippo (antirez).「Coding with LLMs in the summer of 2025 (an update)」. antirez.com, 2025 年. https://antirez.com/news/154

  • GitHub.「Spec Kit: Toolkit for Spec-Driven Development」. github.com, 2024 年 9 月起. https://github.com/github/spec-kit

  • 经 Stack Overflow Blog 引用的斯坦福数字经济实验室数据.「AI vs Gen Z」. Stack Overflow Blog, 2025 年 12 月. https://stackoverflow.blog/2025/12/26/ai-vs-gen-z/

  • 一项关于 AI 生成单元测试有效性的实证研究. arXiv:2406.18181, 2024 年. https://arxiv.org/html/2406.18181v1

  • smile-design 项目源码与规范、记忆三件套. https://github.com/smilezyl2023/smile-design