转生到 AI 时代，我不再相信一键生成代码的传说（从需求到测试： AI 参与研发链路的实践总结）

程序员

V2EX 看到讨论"跨域"的帖子，那个她好像回来了 codex 今天真的是不稳定呀。火山方舟 Coding Plan 慎买刚问了大家 openclaw 和 hermes 在什么机器上面玩，求推荐一个机器 GPT-image-2 生成 AI 图片防伪有感 codex pro 5 小时限制已经严重缩水逆天 Antigravity 动态 JSON 序列化对强类型语言很难吗？自建了 GPT Coding Plan，遇到了定价问题，请教大家大家都是在什么设备上玩 openclaw 以及 hermes 的呀？软考还有一个月就考试了，你们学习了吗？大伙用 AI 会考虑在 user scope 的 CLAUDE.md/AGENTS.md 里交代 AI 说中文吗我发现程序员这个群体很大部分其实挺抠的最近使用 cc 总会莫名其妙的返工， codex 不会目前体验最好的远程 vibe 工具想知道大佬们抓包遇到 ssl pinning 都是咋优雅的解决的？ - V2EX 工业软件的大佬们是怎么 vibe coding 的 - V2EX 最近 chrome 是不是有 bug 啊，一搜索就卡住 - V2EX 分布式异步系统在 vibe coding 下的困境 PHP Native AOT 编译器，支持将 PHP 代码编译为可执行文件，运算性能提高 150 倍没想到 2026 年，还要浪费大量时间在跨域问题上 - V2EX DeepSeek V4 这周会出吗？中转站正式试营欢迎试用不掺不假小米 mimo 升级 v2.5,并且重置了额度 Jenkins， SCM 轮询完全不工作是啥问题啊赛博斗蛐蛐， AI 模型的简单对比(白嫖版) 使用中转站要擦亮眼睛！不说别的,倍率计算充值好乱。买了火山的 Coding Plan 测试得出计费模式给我的 AI 生成了简历和状态卡, 大家帮忙看下 Ta 能找到啥样的腾讯云太不要脸了， token plan 上 glm5.1 和 minimax-m2.7，但是 coding plan 不上 - V2EX 目前自建梯子最强的 anytls 协议不是不不更新了？刚发现 WSL2 可以通过 virtiofs 访问 NTFS 分区， IO 速度明显提升 v2board 还是其它面板更适合小团伙使用? 现在 AI 来了，如果有天不需要程序员？ gpt-image-2 太顶了你们 vibe 会让模型先输出方案来审核吗？ GLM Coding Plan 调整老套餐并停止自动续订，受影响用户获赠 2 个月新套餐权益为了浏览在线文档的时候能自定义高亮， Vibe 了一个网页高亮标记的工具从 2 月开始用 Opus 4.6，到这几天切到 4.7，一些感悟和困惑 Github Copilot 停售之后还能买什么收集了一下市面上常见的 Token Plan，可以给到大家一点参考这个生图太牛了中国的算力缺口这么大嘛？看到 2025 华为昇腾出货 81 万块，又看到各家 coding plan 不是停售就是限流做 OPC 太难了，天天焦虑阿里云 Coding Plan 增加动态限流，频繁暂停无法使用马斯克 600 亿美元收购 Cursor codex 开始灰度 GPT 5.5 了大家是如何使用 codex gpt-image-2 生图确实很顶啊，附带几张生成效果。 codex 的风评似乎在超过 Claude code？智谱 GLM 宣布停止续订无周限额的老套餐如何实现自我进化的 AI 的 Skills? 智谱(GLM)果然学习了阿里, 强制关闭了老用户套餐的自动续费各位公司有除了智能客服外真正落地的 AI 应用吗？热烈欢迎火山 Coding Plan 加入 GLM5.1 Kimi2.6 MiniMax2.7 阵容请教大佬： claude API token 太烧钱了， minmax 还要兑换码，有没有合适的中转方案开发一个面向普通用户（非程序员）的 Agent 软件，支持 skills、定时任务、对话功能，主要客户群体使用 Windows。感觉像是一个带前端的 Hermes，但是 Hermes 在 Windows 下运行不太友好，不适合非开发人员。 grok XAI 开始限制免费用户访问次数了吗？ openspec 怎么配合 superpowers 使用？阿里云的 coding plan 莫名奇妙被冻结了程序员如何学习 ui 审美开源了一个 AI Agent 认证工具 sig —— 让 AI Agent 安全访问外部系统 Vibe Coding 时代，该如何快速搭建一个 CRUD 平台？感觉大多数的 coding plan 都是被龙虾薅死的。有没有一起拼中转站的呀，找到一个中转站用了段时间感觉比较靠谱搭个 AI 中转玩玩 Zeabur + Neon 50 块以内跑通 Coinepay：一张不能用的卡，扣了我 5 个月月费 Gemini in Chrome 支持日本了，为什么我的不生效？跳板机/内网穿透方案，如何降低远程访问校内服务器延时？现在有没有什么好的 AI 图片生成 3D 模型的方案？关于科研 ai 作图为什么现在 AI SDK 默认不支持异步？建议 V2EX 加入一个 Ai App 或者 Vibe Coding 模块，把一堆 Ai 生成的产品都丢进去。如果没用 coding plan 套餐了，再继续自费上班是不是就太傻了 AI 太烧钱了，有什么好的大模型组合方案？阿里云百炼这波开始割韭菜了，下架 coding plan，改头换面 token plan 最新，腾讯云和阿里云 coding plan 购买页面均已下架，换成了 token plan 阿里云 CodingPlan 彻底没了，新上了 TokenPlan 大家看到 antigravity 那个配额监视器的广告了没？真心发问，想学后端需要学啥？ AI-Powered Log Analysis Tool - Pangu RCA 想自己写一个 code agent 玩玩，有什么开源项目可以参考吗？腾讯云 Coding Plan 下架了现在还有哪一个国产 Coding Plan 能买到吗？ 106 行业短信签名申请新规范出台， 5 月 1 日起生效最近上线了一个开发了半年的 shopify SAAS AI 就像那渣男渣女，平时哄着你温柔小意，关键时刻就坑你一波大的大家在开发智能体时，都是怎么写系统提示词的？现在大模型国内外直连越来越难买或拼车了，想试试中转站，大家有没什么推荐呀一个人写了大半年 Android App，聊聊过程中的一些取舍，第二篇智谱 coding plan 的使用 token 限制是多少？ cli-proxy-api + 中转站领的鸡蛋 = 大模型免费用是否可行？ gpt coding plan 一天试用（GPT 5.3codex 和 gpt 5.4）大家用 AI 是订阅制多还是 API 按量付费多？我用 AI 写了一个游戏，我发现我不想看代码，也看不懂代码了 AI 代码后面怎么维护,心智负担太大了中年人爱上 AI 编程，就像爱上钓鱼每月 AI 支出都超过生活费了 1000 行 rust 实现一个类似于 pytorch 的轻量级自动微分库

xiaowoli · 2026-05-21 · via 程序员

省流（ TL;DR ）

核心问题：不是 AI 不会写代码，而是需求、边界、测试、文档没准备好就让它开写，代码「看起来能用、后面难改」。
做法：用一串 Skill 把 AI 放进完整研发链路 —— 先收集上下文，再梳理需求、拷问边界、出轻量方案，然后 TDD 实现、补测试、做 review 、本地走查、导出用例、更新文档。
流程特点：10 步有顺序，但可在需求、方案、审查、走查、文档等环节回退修正，越早改成本越低。
人的角色：AI 负责整理和生成，取舍、验收、能不能合仍要人判断；目标是可控、可复用，不是一次性提速。

⏲️建议阅读时间: 10min

转生到 AI 研发时代，我不再迷信“许愿式编程”，而是把 AI 放进需求、开发、测试和文档这一整条研发链路里。

一、为什么 AI 的代码总是很难维护？

很多人用 AI 写代码，第一步就是把需求丢进去，让它直接生成。

刚开始确实很爽，速度快，效果也像那么回事。但接到真实项目里，问题就来了：写法和项目不一致、权限漏了、边界没处理、异常场景没考虑，测试也跟不上。

这些代码最麻烦的地方是“看起来能用，但后面难改”。因为它不是基于完整上下文写出来的，而是基于一段临时描述生成的。需求没说清，AI 就只能猜；项目约束没给够，AI 就按自己的习惯写。

所以很多时候，不是 AI 写代码不行，而是我们让它太早开始写代码了。需求、边界、方案、测试点都没准备好，就让 AI 开始实现，最后生成得越快，返工也越快。

二、我的整体链路

收集需求和项目上下文
使用 /requirement skill 梳理需求

使用 /grillwithdoc skill 拷问需求、边界和风险
输出轻量技术实现说明

使用 /TDD skill 实现核心逻辑
使用 /testing skill 补齐单元测试/组件测试

使用 /code review skill 做代码审查
本地运行，人工走查核心流程

使用 /testcase skill 输出 Excel ，用于导入 Transcend 项目管理平台
使用 /feature-doc-maintainer 更新文档

这条链路不是只能从 1 走到 10 的直线流程。

主流程顺序推进，但在需求拷问、技术方案、代码审查、本地走查和文档更新阶段，都可能回退到前面的步骤。发现问题就回到前面修正，越早改，成本越低。

第一步：先收集上下文，再让 AI 工作

不要一上来就让 AI 写需求、写方案或者写代码。因为在上下文不完整的情况下，AI 很容易给出看起来完整、但实际一坨的结果。

所以第一步是先把和需求相关的信息整理出来，比如原始需求、历史文档、相似功能、接口说明、权限规则等。尤其是已有的相似功能很重要，它能让 AI 参考项目里真实的写法，而不是重新发明一套方案。

上下文准备清楚了之后接下来就可以轻松的走下面的流程了，但是如果一开始信息有误，那很可能会在错误的基础上进行。

第二步：用 /requirement skill 梳理需求

上下文准备好之后，不要急着进入开发。先用 /requirement skill 把需求过一遍。

这一步主要是把零散的信息整理成结构化内容，比如功能目标是什么、给谁用、核心流程怎么走、涉及哪些字段和状态、权限规则是什么。

这里要特别注意未确认问题或者是当前没有想明白的地方，一定要先用 TODO 标记出来后面找人确认。整理完后，基本能产出一个可执行的需求文档，能够明确整体方向了。后面我们还会用 grillwithdoc 来敲定细节

这里产出的时候记得选 plan 模式

第三步：用 /grillwithdoc skill 拷问需求

有了需求文档之后，不要马上认定它就是对的。这个时候可以用 /grillwithdoc skill 再拷问一遍。

🥚使用 plan 模式的话有对话框可以一次一次确认

这一步主要是检查需求有没有说清楚，比如边界在哪里、哪些场景不做、异常情况怎么处理、权限和数据范围有没有影响、按钮控制是不是完整。很多问题在正常流程里看不出来，只有换个角度追问，才会暴露出来。这个 /grillwithdoc skill 很强，基本能把所有边界和细节明确的的很清楚。

拷问完成之后就能够得到一份宝贵的确认好细节的需求文档了

第四步：输出轻量技术实现说明

需求细节确认完之后，就可以开始看怎么实现了。

这里不建议一上来写很重的技术方案，太长了没人看，后面也不一定维护。我的做法是输出一份轻量技术实现说明，把关键内容讲清楚就行。

这一步的价值是让后面的开发有一个明确方向。特别是多人协作或者需求比较复杂的时候，有一份轻量说明，后面写代码、补测试、做 review 都会顺很多。

如果需求很简单，或者已经很明确了，这一步也可以省略，后期少维护一个文档👍

第五步：用 /TDD skill 实现核心逻辑

技术实现说明确定之后，就可以开始写代码了。

使用 /TDD skill 先处理核心逻辑。不要直接让 AI 上来一顿写，最好先让它拆出核心行为，然后先写测试，再实现代码。

这样做的好处是能限制 AI 的自由发挥。测试先写出来，AI 后面的实现就要围绕这些行为来做，不容易写偏。

/TDD skill 更适合用在核心逻辑、状态流转、工具函数、关键业务规则这些地方。如果是纯页面样式或者很简单的展示逻辑，就没必要硬套 TDD 。该轻就轻，不要把流程搞复杂。

第六步：用 /Testing Vue Vitest skill 补齐测试

TDD 做完之后，不代表测试就完成了。

TDD 更关注核心逻辑有没有写对，但页面交互、组件行为、异常分支、权限显隐这些，很可能还没有覆盖到。所以后面还要用 /testing skill 再补一轮。

补测试的时候也要结合最终代码看，不能只根据需求文档生成。否则测试看起来很多，但可能测不到真正关键的地方。

/Testing Vue Vitest skill 这个也包含了页面 UI 的单元测试

第七步：用 /code review skill 做代码审查

代码和测试写完之后。这个时候可以用 /code review skill 再过一遍。

/code review skill 也适合用来发现一些容易忽略的问题，比如重复逻辑、边界处理不完整、测试没覆盖到关键场景等。

会按照优先级输出一份质量报告

不过这里还是要注意，AI review 只能作为提前检查。最后这个代码能不能合进去，还是要人自己判断。

第八步：本地运行和人工走查

review 完之后，一定要本地跑一下。

尤其是前端功能，不能只看代码和测试。页面能不能打开、搜索分页有没有问题、新增编辑删除是否正常、弹窗回显对不对、错误提示是否合理、权限按钮有没有按预期显示，这些都要实际走一遍。

这一步纯体力活，就是人工验收。AI 可以帮你写代码、补测试、做 review ，但它不能替你真实使用一遍功能。

如果本地走查发现问题，就回到前面的步骤修。不要因为流程已经走到第八步了，就硬往后推进。

第九步：用 /testcase skill 输出测试用例 Excel

本地走查通过之后，就可以开始整理测试用例了。

这里我会用 /testcase skill 输出测试用例 Excel 。它不是只根据最开始的需求生成，而是结合需求文档、技术实现说明、最终代码改动、已有测试点和本地走查结果一起生成。

这样出来的用例会更贴近真实功能，不容易写出那种看起来很完整、但测不到重点的内容。

我们当前是把 Excel 导入 Transcend 项目管理平台。或者交付给测试，让测试评估。

第十步：用 /feature-doc-maintainer 更新文档

最后一步是更新文档。

这里的文档主要是仓库内和功能强相关的文档，比如功能说明、权限规则、接口变化、操作流程、已知限制、测试说明等。不是为了补一篇很正式的文档，而是把最终实现沉淀下来。

很多时候文档只停留在需求阶段，后面代码改了，文档没跟上。时间一长，下一次再改这个功能，又要重新理解一遍。

所以我会在链路最后用 /feature-doc-maintainer 做一次同步，把最终实现和关键说明补回去。这样这次工作的结果，不只停留在代码里，也能给后面的人（ AI ）继续用。

三、人的判断点

做正确的事，比正确地做事更重要。

这套链路虽然用了很多 Skill ，但核心判断不能完全交给 AI 。

AI 可以帮我们整理信息、生成内容、补齐测试、做初步审查，但需求取舍、技术判断、测试评估和最终验收，还是要人来负责。

需求阶段：需要判断方向是否成立，哪些范围要做，哪些先不做，哪些问题必须找产品或负责人确认。AI 可以把问题列出来，但不能替我们做取舍。
代码和测试阶段：需要判断代码是否符合项目现状，改动成本是否可以接受，测试是否真的覆盖了关键风险。代码能不能合进去、测试用例有没有价值，最后还是要人来判断。

所以这条链路不是让 AI 替代人，而是让人从重复整理、补充、检查这些工作里抽出来，把精力放在更重要的判断和取舍上。AI 负责把材料准备好，人负责判断这些东西是不是对的、能不能用。

四、这套链路带来的变化

这套链路最大的变化，不是某一步突然快了多少，而是整个过程变得更稳了。

需求问题更早暴露

通过 /requirement skill 和 */grillwithdoc skill*，很多边界、权限、异常场景可以在开发前先暴露出来，避免一边写代码一边补需求。

AI 输出更可控

每一步都有明确输入和输出，不是让 AI 自由发挥。需求、方案、代码、测试、文档都能串起来，结果也更容易检查。

返工更少

问题越早发现，修改成本越低。需求和方案阶段能解决的问题，就不要拖到代码写完之后再改。

测试更有依据

测试不再是最后临时补，而是基于需求、实现、代码改动和本地走查结果生成，更贴近真实风险。

测试用例能进入协作流程

通过 /testcase skill 输出 Excel ，可以导入 Transcend ，或者交给测试评估，不再只是本地文件。

文档能同步更新

最后用 /feature-doc-maintainer 把最终实现、权限规则、接口变化、已知限制补回去，方便后续维护，也方便 AI 继续理解上下文。

🧠人更专注判断和取舍

人负责确认方向、筛选结果和最终验收。

五、实践中的注意点

需求：先用 Plan 模式，不要直接执行

需求阶段尽量用 Plan 模式，让 AI 先问问题、拆边界、列 TODO 。

这个阶段不要急着生成代码，重点是把方向、范围、不做项先确认清楚。
代码：先用 Opus 4.7 计划，再用 Composer 2.5 执行

复杂需求可以先用 Opus 4.7 做方案和拆解，让它把改动范围、核心逻辑、风险点先列出来。

确认方向没问题后，再用 Composer 2.5 按计划执行代码修改。

这样比直接让执行模型上来改代码更稳，也更容易控制改动范围。

测试：先测核心路径，再补边界场景

不要一开始就追求测试很全。

先让 AI 覆盖核心流程，确认主路径能跑通，再补权限、异常、空数据、搜索分页、弹窗回显这些边界场景。

测试用例也要人工筛一下，没价值的不要硬留。
文档：最后再更新，基于最终实现写

文档不要太早定稿。

前面需求、代码、测试都会调整，最好在本地走查和 review 之后，再用 /feature-doc-maintainer 更新。

重点写最终实现、权限规则、接口变化、已知限制，不要写成很重的说明书。

六、总结

回到最开始的问题，为什么要把这套实践融入研发链路？

因为单纯让 AI 写代码，只能解决一小段效率问题。真正拖慢研发的，往往不是代码写得慢，而是需求没说清、边界没想全、测试补得晚、文档跟不上。问题不是没做事，而是每一步都在补前一步的缺口。

这条链路的核心不是自动化，而是可控。每一步都有输入、有输出、有检查点，也都允许人随时介入确认。AI 能力越强，越需要这样的链路来承接它。

最后要做到的不是让 AI 替我们完成研发，而是让 AI 稳定地参与研发。让需求有依据，方案有约束，测试有反馈，文档有沉淀。这样提效才不是一次性的，而是可以持续复用的。

七、本文用到的 Skill

这套链路里主要用到了下面这些 Skill：

Skill	作用
`requirement-analysis`	梳理需求，把零散信息整理成可执行需求文档
`grill-with-docs`	拷问需求边界、异常场景、权限和风险
`tdd`	用测试先行的方式实现核心逻辑
`testing-vue-vitest`	补齐 Vue 3 + Vitest 单元测试和组件测试
`code-review`	做代码审查，提前发现质量和风险问题
`diagnose`	遇到复杂 bug 或性能问题时，按复现、假设、验证、修复、回归的流程定位问题
`testcase-excel`	生成测试用例 Excel ，方便导入测试管理平台
`feature-doc-maintainer`	根据最终实现更新功能文档

如果你也想把这些 Skill 放到自己的项目里，可以参考我整理的 Git 仓库：

Git 地址： https://github.com/535803710/ai-rd-skills

这些 Skill 不是固定答案，更像一套可以继续调整的流程模板。真正落地时，建议根据自己团队的项目结构、测试规范和文档习惯做一轮改造。

此内容由惯性聚合(RSS阅读器)自动聚合整理，仅供阅读参考。原文来自 — 版权归原作者所有。

推荐订阅源

程序员

省流（ TL;DR ）

一、为什么 AI 的代码总是很难维护？

二、我的整体链路

第一步：先收集上下文，再让 AI 工作

第二步：用 /requirement skill 梳理需求

第三步：用 /grillwithdoc skill 拷问需求

第四步：输出轻量技术实现说明

第五步：用 /TDD skill 实现核心逻辑

第六步：用 /Testing Vue Vitest skill 补齐测试

第七步：用 /code review skill 做代码审查

第八步：本地运行和人工走查

第九步：用 /testcase skill 输出测试用例 Excel

第十步：用 /feature-doc-maintainer 更新文档

三、人的判断点

四、这套链路带来的变化

五、实践中的注意点

六、总结

七、本文用到的 Skill