vibe-coding-template：一次 Codex 对话文件丢失后，我整理了一套 Agent 长期协作模板，把 AGENTS.md、任务 prompt、code review 、知识讲解和 web-search 工作流快速沉淀到项目 - V2EX

V2EX

我用 AI 写代码，但终端管理反而成了累赘——于是我做了 codux - V2EX [调研] 各位在公司都用什么 ide 和 agent 写代码？老运维 share 一个运维平台新电脑 brew install node 之后，一个小设置可以提升对供应链投毒的防御 - V2EX GLM-Coding 调用持续报错： z.ai 的 Lite 套餐几乎无法使用，官方 Pro/Max 是否稳定？ - V2EX 上海漕河泾内推，本组有 2 个 hc，一个后端，一个前端，预算都是 20k 左右，不打卡，氛围好如果 V2EX 上有一组不永久保存聊天记录（比如只保存 7 天或者 24 小时）的聊天室，那么会开启哪些有用或者有趣的可能？ - V2EX gemini cli 貌似挂了，一直返回 403 - V2EX 第一次在自媒体上赚到钱收集了最近在使用的低价 GPT， Gemini，邮箱等 AI 会员的小店合集讨论个大实话：现在企业还在说 AI 编程提效 20%， 30%的，真的太落后，没用懂 AI。因为包括很多前沿公司，已经狂奔到提效 200%-500%的情况 [招聘][远程][币安] 前端/后端/QA/iOS/Android 至少 3 年以上经验目前有大量 HC 欢迎投递 Chatgpt Pro 用量用不完的可以开这些设置面试的时候好像遇到钓鱼了，给各位避个坑 cursor 年续费 22 号到期，自动续费是否还是老的计次套餐呢 - V2EX 被两件破事毁掉的一下午，琐碎的内耗消磨人的精力使用 Planet 存储 Codex 的会话或者重要信息 - V2EX 如果业务部门领导不要你开发功能，而是要求你教会它用 claude code 开发功能，你会怎么做？分享一个 MacOS 接绿联 CM818 USB 转 DP 转接器使用感受 - V2EX 我的 HR 朋友 10 年老 Java ，非全大专，大家帮忙看看简历开源了一个 AI 口语练习工具，音素级发音评分，完全免费可自部署 V2EX 上有哪些你觉得很有趣、印象深刻的妹纸？字节为啥不出个国内版 Vercel？有在大马的朋友吗? 问个运营商问题你们在有领导的公司大群发过的最大胆的消息是什么公司裁员，目前没有工作。想试试摆摊，做一个移动鲜啤打酒车我的硬盘 Memblaze Pblaze 5 Linux 下不识别，给 Linux 内核提交了补丁， AI 说有望被合并 - V2EX 只有我一个人觉得 codex 不好用？做了个 AI + 真人专家监督的广告投放平台 Auxora， 7 个品牌跑出 6x ROAS 如何走出至亲的离世 Claude Web 端貌似 claude-opus-4-7 偷偷上了？现在 Apple 开发者帳號應該是用哪个地区会更好？ - V2EX 用回测筛选因子的一点经验分享给女儿 vibe 了一个故事类的 app，做完发现，这类应用似乎上线难度极大？ - V2EX 手机格式化 bitget 钱包没了，里面开通的银行卡还有机会拿到吗 - V2EX [送码] TransVoice - 我的第一款 App 上架啦！实时转写+翻译+字幕，会议听课好助手！ PictureHub 高清摄影作品的画廊 Planet 的第一个使用 macOS 26 SDK 构建的 Insider 版本 20260416-1 - V2EX 成都二手房是不是在涨价，有点坐不住了 - V2EX claude 生态（skill mcp plugin）等 Studio Display XDR VESA 适配器脱落有在用印度区 applestore 的大哥嘛，请教一下礼品卡去哪里买呢 - V2EX 我好像知道京东家政爆火的原因了 - V2EX 薅了公司的 a 家 api key，用机场 ip 做代理容易被封吗如何在初期就识别 HR 在刷 KPI,没打算招你? [分享]精心打造一个 AI 编程知识库（算法/设计模式/提示词/Skills），助力程序员转型港版 iPhone 在国内支持联通 5GA 吗？在广东用想办港卡 AI 对 it 行业影响太大了我做了个把照片变成 iOS 小组件贴纸的 App ChatGPT Pro 5x 套餐量真的很足！ I have found a method to directly generate advertising video materials using scripts 在小城市开个店，给人写软件，有前途吗 chrome 最新的 147 版直接卡爆炸了 - V2EX 为什么厂家不在 skill/mcp 这类的工具中塞广告呢？这样不是可以大赚嘛？ minimax 真是脸都不要了，工作日下午 14:00 定时开启 529，脸都不要了。训练模型居然占用用户使用时间外资非核心部门 vs 另一家外资的核心部门,该跳吗? iTad 标签扩展加小动作 ? - V2EX 去年 H200 能买，不让买是代替快出来了？ - V2EX AI 赛事通 - 2026 年 4 月中国区新增 AI 竞赛和黑客松汇总 - V2EX V2EX › 登录现在安卓开发都在做啥 - V2EX 浏览器插件沉浸式翻译是不支持自定义模型了吗？ - V2EX Codex 里的 GPT5.4 也能降智？上午让它改两个问题，改了一个小时了， plus 额度用了一半了还是没改好，和前几天用的体感完全不一样。要它改的问题也不复杂。服了。目前有使用 claude code 的收到人脸认证的吗 - V2EX 分享一个自己做的 Nginx 管理工具，实时请求动态预览！（无奈市面上实在找不到好用的，自己撸了个） - V2EX claude code 崩了么？今天在反重力上用 claude 一点都不丝滑，有同样的感受吗？ opencode 消息周知插件今天 claude opus 和前两天比，质的飞跃 - V2EX 999 包月价？ - V2EX 一个版本， 50 项更新：我们几乎重做了整个播放页本地大模型多大显存够用？ GOGDNS 一款简易的私人 DNS 服务器 - V2EX API key (GLM) 怎么使用 claude code desktop ? Claude 这样订阅有问题吗 - V2EX 帮我爸找回了一篇赛博兰亭集序求推荐稳定、高性价比使用 Claude Opus 4.6 的渠道/平台搞个云端 claude code 防止封号 - V2EX 用 Claude 要实名了，内地用户怎么办？ OpenAI Plus 和 Team 都缩水了吗海外 Android 手机有什么好用的国内第三方应用市场推荐吗 - V2EX 把电脑伪装成电视，用 DLNA 投屏拿到视频号直播流地址 - V2EX claude 认证莫慌北京互联网法院有什么攻略么？起诉北京智谱华章科技股份有限公司退款可行么？ - V2EX Claude 开始引入身份验证求 vscode 做笔记软件的插件推荐 - V2EX 讯飞星辰的 Coding Plan 如何？ Anthropic 宣布在 Claude 平台推行身份验证机制科普一下低价 gpt 是怎么来的有没有长期关注 Claude 的朋友，我建了一个 Channel 自动抓取 Claude Team 的推文啃了那篇 54 页的 Agent Harness 综述, 给大伙讲个省流版现在那家的 coding plan 还能买到是不是最近会有什么更聪明的大模型要发布了呀？用多了 AI 后，有没有觉得 AI 生成的文章有很强的既视感？如何实践 Harness 工程？今日份 GPT 5.4 笑话如何建一个自己的号池，让 cursor 真正实现 token 自由写了三个月 Agent Harness，我终于敢让 Claude Code 全自动写代码了

liujan611 · 2026-06-15 · via V2EX

最近论坛里有很多关于 vibe coding 的讨论。我自己平时深度用 Codex 或者 GPT 开发项目，前阵子遇到了一个非常让人崩溃的意外情况。当时我登录了 Codex 的 Windows 客户端，之后回头重新登录 VSCode 的 Codex 插件，结果发现本地所有的历史对话文件瞬间全部丢失了。

我平时的开发极其依赖这些积攒下来的历史记录。我以前写 prompt 的方式比较原始，但是确实好用。之前的习惯是先去翻一下以前写得比较好、逻辑完备的提示词，把它们复制出来，再用 Codex 的 medium 推理模式结合当前代码需求生成一份个性化 prompt ，然后再切换到 high 或 xhigh 推理模式真正干活。当本地对话记录文件彻底蒸发之后，我以前很多常用的提示词也随着荡然无存了。

这次惨痛的教训让我意识到，把协作工作流只留在对话历史里是非常不安全的。这直接促使我加快开发了一套vibe coding 模板，不管以后是遇到 Codex 对话文件离奇丢失、GPT 账号突然被封号、重新开启一个完全陌生的小项目、还是入职新公司面对新的代码环境，通过复用这套 Agent 协作模板，就能快速搭建起一套非常高效的开发流水线。

这套模板主要解决什么问题

让 Agent 写出第一版代码通常不难，真正难的是长期协作。

项目一旦写久了，就会遇到很多重复问题：

换一个仓库，又要重新告诉 Agent 项目规则、测试方式、交付格式和不能乱改的边界规定。
想让 Agent 做 code review ，很难真正围绕当前 diff 、项目规则和潜在风险找问题。
想把一个高频流程沉淀下来，结果 prompt 只能解决当下任务，下次换个场景又要重新写。
深度 vibe coding 之后，自己可能反而看不懂 Agent 生成的代码和方案。遇到不熟悉的技术点，必须先补齐背景知识，把核心原理、关键术语和项目落点讲清楚，否则后续开发方向很容易失控。
任务依赖最新官方文档、论文、API 或 benchmark 时，Agent 可能凭旧知识给出很确定的回答，后续实现也会被模型幻觉带偏。

学会 Vibe Coding 工作流

vibe-coding-template 不绑定具体业务，也不替项目规定唯一开发方式。你可以把它当成一套可调整的 Agent 协作模板，复制到目标项目里，再按真实开发习惯慢慢改造为自己的工作流。

七个 skill 分别负责什么

agents-md-creator 负责生成或更新项目级 AGENTS.md。很多 Agent 协作问题，表面上是某次 prompt 没写好，实际原因是项目规则没有沉淀下来。每次都靠临时提醒，Agent 很容易忘记内容质量要求、测试方法、版本策略、修改报告记录格式、编码要求和错误处理边界。通过这个 skill 先把长期协作底线写清楚，比如代码质量如何控制、修改前必读文件、真实测试命令、版本和修改报告记录规则、错误处理原则、进度播报格式，以及不要无依据加入固定超时、长度截断等防御性编程的逻辑。
project-prompt-creator 处理一次性任务。它适合开发、修复、文档、验证，把本轮任务要做什么、先读什么、不能改什么、怎么测试、最后交付什么写成可执行 prompt 。
plan-mode-planner 用在方向不清、风险较高、需要用户先拍板决策的任务上。它解决的不是写代码能力，而是复杂任务开始前的决策顺序。很多任务失败，不是 Agent 不会写代码，而是它太早开始写代码。Plan mode 的作用是让 Agent 先慢下来，只做只读探索、阅读、搜索和静态分析，先提炼少数真正需要用户决策的问题，再进入实现。这样可以减少写完一大堆代码后发现方向错了的返工。
code-reviewer 用来生成 code review prompt 。它适合审查 diff 、PR 、指定文件、配置变更或发布前风险。它的重点是让 AI 基于真实 diff 、项目规则和证据发现问题，并给出可定位的证据、影响说明、修复方向和验证建议。
web-search 用来降低 Agent 的模型幻觉。任务依赖互联网最新信息、平台规则、论文、benchmark 、release notes 、官方 API 或技术选型时，不能只靠模型记忆下结论。它会优先使用官方文档、标准、供应商文档、官方 GitHub 、论文和 benchmark 官方页面，把来源差异整理成可追溯依据。更重要的是，检索结果最后要回到工程判断里，包括当前项目受不受影响、测试要不要覆盖真实环境等内容。
knowledge-explainer 解决的是另一类常见问题。Agent 写代码很快，但用户自己并不一定真正理解某个技术点。比如为什么数据处理流程要这样设计，为什么 benchmark 要用这种评测口径，为什么一个模型方法要拆成几个模块实现。如果这些问题没讲清楚，后续项目开发会越来越依赖 Agent 的输出，用户自己却越来越难判断代码或方案是否合理。这个 skill 适合用来做技术原理、从零教学、面试口述、项目追问和答辩准备。涉及最新资料时，再联动 web-search，先降低模型幻觉，再进入讲解。

knowledge-explainer 设计哲学

project-skill-creator 用来创建项目本地 skill 。等某个流程反复出现，并且触发条件、输入、输出和边界都稳定后，再把它做成项目长期 skill 。

设计哲学

agents-md-creator

AGENTS.md 的作用，是把那些长期有效、反复使用的规则固定下来。它应该回答几个核心问题：这个项目里 Agent 开始工作前必须知道什么？什么不能做？怎么验证？怎么汇报？

具体来说，AGENTS.md 需要包含这几类内容：

执行环境前置规则：操作系统、默认 shell 、工具链要求，避免 Agent 用错命令。
顶层代码生成约束：语言、编码、注释、命名规范等所有代码产出都必须遵守的底线。
修改前必读：进入项目后必须先读哪些文件，避免在不了解项目全局的情况下乱改。
测试验证：真实可运行的测试命令，以及验证通过的标准。
修复报告的规则：每次 Agent 做了修改如何记录。
错误处理：不能无依据加防御性编程的逻辑，哪些修改会带来隐藏的风险。
输出与验收格式：任务完成后必须说明改了什么、怎么验证、证据在哪里、哪些风险还没覆盖。
进度播报格式：长任务执行过程中，Agent 需要定期输出进度，让用户知道它在做什么、做到哪一步了，而不是全程黑箱。

其中进度播报和禁止无依据防御性编程这两个约束，来自我真实踩坑的经历。

长任务里最难受的不是 Agent 做得慢，而是用户不知道它在做什么。它可能在读文件，也可能在跑测试，也可能已经卡在某个报错里，但如果中间没有反馈，整个过程就像黑箱。进度播报格式把执行过程拆成步骤、目的、执行命令、当前结果、证据路径和备注，让 Agent 的工作过程可观察、可追溯、可复盘。

进度播报

防御性编程的问题更隐蔽。Agent 很喜欢主动加一些看似稳健的兜底逻辑，因为代码看起来没有报错，Agent 也不会主动告诉你它加了什么兜底。所以 AGENTS.md 必须明确写清楚：不要无依据加入防御性逻辑。如果确实要加限制，必须说明依据、触发条件、可见行为、误伤风险和验证方式。

AGENTS.md 的另一条重要原则是规定最小化修改的边界。默认做最小必要改动，但最小化修改不是盲目保守。如果只写最小化修改，Agent 很容易偷懒，把任务理解成只改小范围的几行代码，最后做出不符合真实用户需求、工业场景或业务实践的方案。更常见的问题是，两个平行功能本来应该保持一致，Agent 只在 A 里补了新设计，B 里却继续保留旧链路，后续维护会变得越来越割裂。所以需要明确：面向真实用户需求、解决反复未修复的 bug ，或者为了贴合真实业务实践时，可以允许更大范围重构。但大改前必须先说明根因、必要性、影响范围、回归方案和可回滚边界。

AGENTS.md 也不需要一次写到完美。更好的方式是随着项目推进，把真实踩过的坑、反复出现的偏差、已经验证过的工作流逐步沉淀进去。

web-search

这个 skill 的定位是降低 Agent 的模型幻觉。模型对热门前沿知识的记忆往往有偏差或过时。当任务依赖新版文档、平台规则、论文、benchmark 、API 或技术选型时，直接靠模型回答，Agent 给出的结论看起来很确定，但可能是错的。更麻烦的是，如果用户没有意识到这个结论有问题，后续开发和方案设计就会沿着错误方向推进，代价很大。

web-search 的核心设计是把检索结果和工程判断绑定在一起，而不是只给几个链接。它有一套明确的最小检索流程：

明确任务类型：是确认官方 API 用法、做技术选型、调研论文 benchmark 。
拆关键词：从用户原始问题出发，拆出英文关键词、同义词、库名、版本名、接口名。
优先查一手来源：官方文档、官方 release notes 、作者仓库、论文会议页面、benchmark 官方主页。社区讨论可以补充线索，但不能单独当作结论。
对来源做可信度分层：区分已确认事实、来源冲突与取舍、工程推断、仍需真实环境验证的边界。

输出结构也围绕工程判断设计：问题重述、检索关键词、核心发现（按来源类型分组）、结论分层、项目落地点、来源清单。如果检索服务于代码生成，还必须把结论转成工程约束：推荐用什么 API 或库、不推荐什么做法、当前项目的最小可行实现是什么、需要新增或更新哪些测试。

web-search 不会替代本地代码审查。正确的关系是：本地调用链分析 + 互联网最新信息 + 真实验证边界，三者一起定位问题。互联网最新信息最终要回到工程约束、测试要求、文档影响和风险边界。

knowledge-explainer

这个 skill 解决的是 vibe coding 过程中一个很容易被忽略的问题：Agent 写代码很快，但用户自己并没有完全理解某个技术点。

比如为什么数据处理流程要这样设计，为什么 benchmark 要用这种评测口径，为什么一个模型方法要拆成几个模块实现。如果这些问题没讲清楚，后续项目开发会越来越依赖 Agent 的输出，用户自己却越来越难判断方案或代码是否合理。

knowledge-explainer 的设计哲学，是把 Agent 的产出从用户能用推进到用户能理解、能判断。它不满足于解释一个名词或给出一段概念摘要，而是会把技术点放回当前项目里讲清楚：核心原理是什么，关键术语怎么理解，公式里的变量对应什么业务含义，评测指标为什么这样设计，工程实现为什么要做这些取舍。

它的优点在于能把一次讲解变成后续开发的判断依据。用户再遇到代码实现、模型选择或面试追问的相关问题时，不只是记住了一个结论，而是知道这个结论从哪里来、适用于什么场景、哪些地方还需要继续验证。

如何迁移到自己的项目里

我建议不要一上来就追求把整套模板直接照搬。首先更新一下根目录的AGENTS.md，下面是我的根目录的AGENTS.md。

# Codex 全局指令（长期生效）

## 1. 语言与表达

- 永远使用简体中文回复：包括说明、计划、总结、代码注释、README 修改建议、测试说明。
- 允许保留英文原文的场景仅限：代码、命令、报错、文件路径、域名、专有名词。
- 禁止输出英文小标题，如 Thoughts / Plan / Next steps ；统一使用中文标题。
- 如果误写了英文解释，必须立刻改写为中文。

## 3. 默认协作方式

- 优先做最小必要改动，避免无关重构；但最小不是盲目保守，若真实用户需求、反复未修复的 bug 、工业场景或业务实践要求更大范围调整，应先说明根因、必要性、影响范围、回归方案和可回滚边界。
- 先理解现有调用链、入口文件、依赖顺序，再动手修改。
- 发现风险时，先说明风险点，再给出能闭环真实问题的可行改法；不要为了追求局部最小而留下功能割裂或长期维护隐患。
- 输出尽量清晰、可复制、可执行，避免碎片化解释。

## 4. 进度播报格式

在执行命令、读写文件、测试页面、查看日志时，尽量输出简洁的中文进度块，格式如下：

> 🧩 步骤：{一句话描述正在做什么}
> 🎯 目的：{为什么要做}
> ▶️ 执行：{命令、页面、文件路径或操作}
> ✅ 结果：{当前状态}
> 🧾 证据：{可验证证据路径}
> 📝 备注：{可选；最多一句}

## 5. 默认协作风格

- 优先给出可直接落地的改法，不要空谈。
- 优先给出能闭环真实问题的可行方案；如果最小方案会导致功能割裂、不符合业务实践或留下反复返工风险，要明确说明并给出更合适的调整范围。
- 发现风险要明确指出，不要模糊带过。
- 不要为了省事而跳过测试。
- 不要把未验证写成已验证。
- 不要把推测写成事实；有证据就给证据，没证据就明确说明。

然后可以先用 agents-md-creator 生成一份项目 AGENTS.md。这份文件不用写得很长，核心是让 Agent 进入项目后先知道几件事：这个项目是什么，开始修改前必须看什么，哪些边界不能碰，怎么证明任务真的完成了。

我会优先写清楚这些内容：

项目的主目标、技术栈和关键目录，避免 Agent 按自己的想象理解仓库。
代码输出的内容质量要求。
修改前必须阅读的 README 、开发日志、测试说明、相关文件。
当前项目真实可用的测试命令。
版本号、修改报告记录这些长期维护规则。
禁止无依据的防御性编程。
最终交付时必须说明改了什么、怎么验证、证据在哪里、还有哪些风险没有覆盖。

这一步完成后，不要马上拿一个大任务测试。可以先挑一个低风险任务，比如改一小段文档、补一个局部测试、修一个很小的 bug 。

等项目继续推进，再慢慢补充 AGENTS.md 和 skill 。它们不需要一次写到完美。更好的方式是随着项目开发，把真实踩过的坑、反复出现的偏差、已经验证过的工作流一点点沉淀进去。每次更新最好对应一个具体问题，而不是凭空加原则。比如 Agent 曾经误改过某个代码，就把这个代码的处理方式写清楚；某次测试命令经常被漏跑，就把它放进任务验收要求。

后续可以按任务类型逐步使用其他 skill 。普通开发、修复、文档任务，用 project-prompt-creator 把一次性任务写清楚。方向不明确、影响范围比较大的任务，先用 plan-mode-planner 做只读探索和关键决策。代码改完后，用 code-reviewer 检查代码里的风险隐患。遇到官方文档、前沿技术等容易被模型幻觉影响的内容，就先用 web-search 建立依据。自己也没完全理解的技术点，再用 knowledge-explainer 先补齐技术原理。

这样迁移的好处是，模板不会变成一堆一次性文件，而是会逐渐变成项目自己的协作资产。对于开源项目来说，这些内容也能帮助后来参与的人更快理解这个项目应该怎么改、怎么测试、怎么 code review 。

总结

https://github.com/Philip-Cao-9527/code-note-helper/blob/main/vibe-coding-template 开发了一套把 Agent 协作变成可以复用、可以随着项目一起演进的工作流。

如果你也经常用 Codex 写项目，尤其是已经开始遇到上下文丢失、模型幻觉严重、喜欢防御性编程、反复 code review 找不到 bug 这些问题，可以把这套模板当成一个起点，按自己项目的真实内容和开发习惯慢慢迭代。觉得有用的话欢迎去 GitHub 仓库点个 star ，也欢迎在评论区交流自己 vibe coding 的经验心得！

此内容由惯性聚合(RSS阅读器)自动聚合整理，仅供阅读参考。原文来自 — 版权归原作者所有。

推荐订阅源

V2EX

这套模板主要解决什么问题

七个 skill 分别负责什么

设计哲学

agents-md-creator

web-search

knowledge-explainer

如何迁移到自己的项目里

总结