惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Cloudbric
Cloudbric
A
About on SuperTechFans
D
Docker
P
Proofpoint News Feed
G
Google Developers Blog
T
The Blog of Author Tim Ferriss
B
Blog RSS Feed
The Last Watchdog
The Last Watchdog
S
Security @ Cisco Blogs
C
CXSECURITY Database RSS Feed - CXSecurity.com
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
WordPress大学
WordPress大学
L
LangChain Blog
Cyberwarzone
Cyberwarzone
S
Security Archives - TechRepublic
Engineering at Meta
Engineering at Meta
E
Exploit-DB.com RSS Feed
Apple Machine Learning Research
Apple Machine Learning Research
Recent Announcements
Recent Announcements
N
News and Events Feed by Topic
阮一峰的网络日志
阮一峰的网络日志
S
Security Affairs
Project Zero
Project Zero
V
V2EX - 技术
N
News and Events Feed by Topic
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
C
Cisco Blogs
Forbes - Security
Forbes - Security
云风的 BLOG
云风的 BLOG
H
Heimdal Security Blog
T
Threatpost
C
Check Point Blog
小众软件
小众软件
博客园 - 【当耐特】
博客园 - 三生石上(FineUI控件)
S
Secure Thoughts
罗磊的独立博客
S
Schneier on Security
N
Netflix TechBlog - Medium
T
Tailwind CSS Blog
T
Threat Research - Cisco Blogs
C
Cybersecurity and Infrastructure Security Agency CISA
www.infosecurity-magazine.com
www.infosecurity-magazine.com
Microsoft Azure Blog
Microsoft Azure Blog
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
S
Securelist
Recorded Future
Recorded Future
AWS News Blog
AWS News Blog
Application and Cybersecurity Blog
Application and Cybersecurity Blog
H
Hackread – Cybersecurity News, Data Breaches, AI and More

BlogFinder

日常漫步 Vol.24 之漫步前山河 - 雅余 周报 #1-聊聊本周的收获 - Edwin's Blog 我的OpenCode必装插件与Skill Write Something 掌中之物未必在掌握之中 · CRIVU PiliNara,一个更顺手的 PiliPlus 分支 「NekoEcho」:做一个必有回响的猫娘主题博客 2026-05 书影音总结 简化博客主题 - 安迪 你要加油呐 我第一次发布 npm 包 拾花小记#45:中考前的二三事 – 小改学习志 黛西花园5月游 #18 枇杷又熟了的五月月报 一些奇奇怪怪的需求?word仿方正书版的几个小操作 - Xiobb's Blog 0419 御温泉之旅 修复了一些bug,网站基本上趋于稳定了 - 新锐博客 又回到四十年前 如何定义成功 迷鹿屋2026已重新上线 科技冰火两重天+一周回顾 ${title} 热度退了,我反而用得更深了-咕咚同学 我到底该不该换个域名? 随身WIFI折腾记 - 安迪 博客撰写体验提升——hexo pro插件 为什么不用相机把屏幕上的接关密码拍下来? 国清寺与天台山 – Ouroboros ★★★★☆《挽救计划》——久违的经济上行感 - Davidの3号基地 删除右键“打开方式”里多余选项 第三周刊_No.53|一切都会被支付两次 安卓APP通话记录与录音上传踩坑记录 - 子舒的博客 天量下跌 inBox 笔记 2.3.8,把工具栏交给了你-咕咚同学 我把小龙虾搬到了微信-咕咚同学 安好 - 响石潭 Compound Engineering Plugin:让每个工程单元都比上一个更容易 MOSS-TTS Family:开源高质量语音与声音生成模型家族深度解析 Crawl4AI:专为 LLM 设计的开源 Web 爬虫与数据抓取工具 Build Your Own X:从零实现你最喜欢的技术——程序员进阶的终极资源清单 Anthropic Skills:用文件夹教 Claude 专业技能的开源框架 1年的去月球(下) - 梅之夏 欢迎回来。 简单讲讲 ASN.1 与 OID DTV - 直播聚合客户端 5.22-5.27 – 不兴江 还没去过鸭川 – 不兴江 张晶晶同学三刷林志颖 关于我 – 不兴江 爱与嫉妒 – 不兴江 港股被持续做空 备案码花了四百块-咕咚同学 一句话生成封面:我给公众号做了4种风格的AI封面生成技能 「官」方認證 再谈费曼学习法 2026-05-28T00:34:11+08:00 2026-05-28T00:28:45+08:00 离谱的英语学习指南:基于AI的英语进阶系统方法论 iii:零集成架构的后端统一运行时 Claude Code Harness:让 Claude Code 工作有迹可循的工程化框架 Heretic:全自动移除大语言模型审查机制的开源工具 MarkItDown:微软开源的万能文档转 Markdown 利器 Harness:让 Claude Code 秒变多智能体协作工厂 这段时间尽折腾AI Agent了,确实极大地提高了效率 近期动态:两个新站点正式上线啦 误判解除!zhouayuan.com 腾讯安全申诉成功 - 周阿源|玩具设计・插画日常・生活随笔 Ralph:让 AI 编码工具自主循环跑完所有 PRD 任务的量产神器 全都违法 – 个人工作记录 关于zhouayuan.com被误判 “含违规信息” 的说明与申诉记录 - 周阿源|玩具设计・插画日常・生活随笔 小米 MiMo v2.5 Pro 白嫖 最大的人间清醒,兜里有钱,但是不花。 夜晚靓歌(12):于文文现场solo - 王志勇的Blog 今日插画:风扬起的倔强 - 周阿源|玩具设计・插画日常・生活随笔 回门习俗 独立网卡 - 忘记了回忆 500亿入股人工智能企业 从命令行到桌面智能体-咕咚同学 第一性原理读书笔记 行者微评论223-加班の守株待兔-博客|政治与时事-风雨行者 ZOZO开源物理接触求解器:GPU加速的可扩展仿真引擎 OpenStock:开源股票市场交易平台技术深度解析 MoneyPrinterTurbo:基于AI的全自动短视频生成工具深度解析 Claude-Mem:为 Claude Code 构建的持久化记忆压缩系统 Twenty:可代码化定制的企业级开源 CRM 平台技术深度解析 2026-05-26T22:59:17+08:00 企业级开源大模型部署平台 GPUStack 实战教程 1年的去月球(上) - 梅之夏 Sevalla - 静态网站托管服务 不用翻墙、不用注册、不用月费,普通人也能用上 Claude Code 装修灯具要注意⚠️ 黄梅天先锋 - 游子微博 公安备案顺利办结,站点备案全部完成 - 周阿源|玩具设计・插画日常・生活随笔 第三次兑换天猫超市卡了宗宗酱-三维狐少儿编程 Don't think, feel. - Rolen's Blog 人这一辈子,到底图个什么 博客迁移 - Edwin's Blog 情感赛道写作模板 再现本轮行情的典型特征 裁员与平常心-咕咚同学 别让“偷懒”,成为隐私泄露的破绽
一个大模型从业者的 Vibe Coding 一些一线经验
青藤木鸟 (qtmuniao) · 2026-06-16 · via BlogFinder

从第一个我体感“有点不一样”的 Code Agent —— Claude Opus 4.5 发布(2025年11月24日)以来,竟然才过去半年。但在这半年里,基本所有能被程序化、自动化的工作,都受到了前所未有的冲击。我们这个以代码为生的群体更是被当头棒喝,周围即使最保守的程序员,也在“卧槽”声中做了调整和转向。

现在深处漩涡中,去预测 AI 带来的社会层面变化,是我万万力所不及的。本篇只想稍稍记录下最近将 Agent 嵌入工作流的一些体验,以待将来回忆起有所凭借,零零碎碎,林林总总。主要从工作模式变迁,如何管理 Agent 和上下文,如何创建和管理 Skill 等方向聊一些一个大模型人的一线体感和经验。

同步到异步同步到异步

作者:木鸟杂记 https://www.qtmuniao.com/2026/06/16/vibe-coding/ 转载请注明出处

同步到异步

古法编程时代,将代码从脑中有节律的赶到 IDE 中是一件很容易“心流”的事情,有一种“纯手打”现榨果汁的美感。而这种设计——输入——测试——迭代的小碎步循环,基本都是同步执行的。

但在 Code Agent 强大之后,我们基本只需要粗略(此处通常有坑)的描述设计,开启 yolo 模式,Agent 就能吭哧吭哧实现个七七八八。如果 Agent TPS (token per second)足够高、我们任务足够简单,这个过程倒也可以是同步的。但目前(2026 上半年)来说,一个稍大任务布置给 Agent,通常要花几分钟到几十分钟不等,这就意味着我们很难同步地等着模型的输出,再去迭代。

由此,一般都会同时会开几个 Agent,并行做几个小任务。然后像“打地鼠”一般,循环响应执行就绪的 Agent。但,这种频繁地、零碎地切换人脑上下文,体验并不美妙。

解法有很多。

最直接地,我们可以将时间片强行拉到小时级,不再过于频繁(分钟级)地切换。在单个小时内,我们只专注于一两件事情。当然这是降低效率的,但我们的注意力资源也是要保护的。为了避免落下任务,我甚至每天用纸质小本本记下几个大的 TODO,每到时间片切换“触发边沿”,就眼动轮询下。

再比如,将其中一个 Agent 提升为 Manager(包工头),帮我们来管理其他 Worker Agent。我们平时只需要盯着包工头就行。然后不断积累实践“判例”,将一些常见、无歧义决策方法,写到其 AGENT.md 中,进一步降低我们的决策成本。类似于大脑习得一些惯常后,就下放给基底神经节去执行一样**。**

决策层级上移

决策层级上移决策层级上移

如果说公司是创始人的组织杠杆,那 Agent 就是我们干活的杠杆。杠杆的存在,都是为了保护我们有限的决策带宽;但杠杆大了,也意味着决策层级的提高。这可能会让我们一线程序员被动进入某种类 Manager 的角色。

当然不同之处在于,相比人的千面性,Agent 呈现出一种古典的“淳朴”——它多半不会骗你。但在你交代任务的(有意或者无意的)留白之处,总会进行奇怪地非线性“插值”,即在代码库现状和你给他的目标之间,沿着很多奇怪的路径“搜”过去,在耗了惊人的 Token 之后,给出了某些似是而非的实现。

而通常,在你决策层级过高只进行黑盒观测的时候,这种“雷”会延迟很久才起爆。

这似乎是脱离一线,决策层级提高后的必然后果,千百年来中国王朝周期律,大体有这种现象的影子。对于创业之君来说,起于微末,知道如何有效衡量不同层级的人的产出。而对于守成之君来说,养于深宫之中,乏于一线体感,做出的决策多少难以验证或者进行有效迭代。于是满朝文武会倾向不断自我繁殖,直到“石人一只眼”。

Vibe Coding 大类如此。如果我们对一个领域不同层级的细节有足够多的理解,就可以有效地,通过更多的先验引导 Agent 的搜索方向、通过更精确的语言限制 Agent 的实现路径。但如果,我们对某个领域底层实现缺乏了解,但又想要足够复杂的功能,不断鞭策 Agent 进行“撒丫”式的复杂度的堆叠,那代码仓库爆掉的速度,也会和隋元覆灭一样倏忽。

但也需要考虑代码本身的生命周期。我在**影响我写代码的三个 “Code”**中也聊过,如果你的代码本来生命周期也很短,比如跑一两次的脚本、比如一次性展示的网页,那正是可以 yolo 使用 Agent 大放异彩的场景。

管理上下文

上下文管理上下文管理

用 Agent 越多,越发现我们不断提效(scale 自己)的过程,就是不断精细化管理上下文的过程。

对于编程这个场景来说,最朴素想法是——将所有的上下文维护在仓库(repo)之内。简单说,仓库即上下文。具体点,让 Agent 实现以下几个文档:

  1. 设计文档:顶层设计,务必简洁,只描述直觉、思路和所以然,供人之后回忆和 Agent 理解。
  2. 实现文档:在比代码高一个层级的方式规范 Agent 方案和选型。但代码总归是最终唯一的事实来源(source of truth)。如果过于细节,还得记得保持文档和代码的一致性,这里面有很多因人而异取舍空间,比如该文档的有无、详略。
  3. 工作日志:保证 Agent 的干活过程之后可追溯和审计。
  4. AGNET.md:一些想让 Agent 写代码和干活的原则和经验汇总。

所以,对于大项目来说,只要编程语言这个中间媒介还在,那么传统以降低复杂度为核心目的软件工程的一些原则,就仍然有效。这仍然是你和其他人、你和将来的你、你和 Agent 进行有效合作的唯一手段—— Agent 的上下文窗口有限,你的心智带宽也有限。

因此,“移步换景”式的维持一个实时的、精简的上下文,就永远是一个行之有效的基本目标。古法编程时代,一些通用的抽象隐喻、一些合理的层级组织也可以沿用。

Vibe 工具的选用Vibe 工具的选用

我观察身边人驱动 Agent 进行编程、干活,有两种常见的形式:

  1. 命令行式:terminal-like
  2. 会话式:chat-like

💡 可以看出这两种都是基于文本的(text-based),这也是这一波 AI 浪潮的“本尊”——LLM,大语言模型的所决定的。其本质上是一个语言模型,因此对文本的理解和推理都是原生的(native),但对图像的理解却是通过 ViT 等方式嫁接的。因此,LLM 对图片的理解很像“盲人骑瞎马”,且不论基于图像进行原生推理的能力很有限,像素级点击按钮进行定位、精确数画面中细小对象的数量,这种图原生操作的基本能力,就一直难以稳定解决。

所谓 terminal-like,即 Code Agent 最原始的形式,比如 Claude Code 。刚开始是服务于程序员写代码的,可以使用 TUI 进行稍微复杂的结果呈现:比如中间的思考过程、比如命令行工具的调用、比如工具结果的合理展示,都让习惯了命令行干活的我们,感到相当丝滑。但短板在于:很难临时想用手机下个指令、也难以让不同 Agent 进行交互(比如让 Manager Agent 收集 Worker Agent 的反馈,指挥 Coder Agent 迭代工具)。

所谓 chat-like,则是之前火过一阵的 OpenClaw 的方式,通过各式样的聊天工具,打通我们和云端 Agent 的交互通道。让我们可以随时通过聊天软件以消息的形式跟 Agent 交代任务。但缺点也是切实的,在聊天软件中很难像在 vscode 那样进行代码审查,在需要时也很难像在终端中那样盯着 Agent 到底怎么干的活。即,由于聊天这种形式表达能力的限制,我们很难对 Agent 干活轨迹进行更精确的管控。

于是,有人利用 tmux 自带的通信协议,造了 web tmux 类似物来进行端侧(比如手机)的人- Agent 交互、进行 Agent-Agent 间的命令交互,以同时获得终端的表达能力和随时在线的通信能力。但终究不太 AI 原生。于是,又有创业团队,使用 html-based 或者 UI-based,围绕 chat ,在多端通信的情况下,增加更丰富的呈现能力,比如 paseo 。

至于未来会如何发展,我们且行且看。

Skill 的创建和迭代

skill 创建和迭代skill 创建和迭代

从刚开始的 mcp 到现在的 skill,如何给 Agent 提供合适的弹药,让它解决我们各自领域内的问题,也是一个有相当多实践的议题。

我们先从 skill 的生命周期来聊聊:

  1. 创建:识别到工作中一些例行( routine )的干活过程,然后想将这个大致固定的流程封装为一个 Skill,便可调用每个 Agent 自带的 skill-creator 来创建 Skill。
  2. 迭代:随着使用场景的泛化——自己在相似但不同的场景用、将 Skill 分享给别人用,就需要对其进行不断地调整。

在创建的 Skill 的时候,一开始时,我们会倾向纯用自然语言来描述。但用着就会发现其在多次执行时的执行过程的漂移。这时,我们很自然的想将确定的过程通过附加脚本固定、将模糊的过程通过给例子来引导。用脚本时,我们又可以在 setup 阶段写明如何固定环境、如何使用相对路径来保证不同环境执行的稳定性。

迭代 Skill 也很有意思。因为创建 Skill 的成本足够低,我们重用 Skill 的时候,如果改动很多,完全可以不维护进行重做;我们在将 Skill 分享给别人的时候,对方也完全可以不做兼容,完全复用框架但重做执行路径(Copy-then-Write)。所以维护还是新造,也没有个定则,需要根据不同场景进行不同取舍。

另外,我将和 Agent 的协作,以 Skill 为界,大体分为两个“结界”——写代码干活。和 Agent 协同进行写代码造工具(命令行和 Skill),然后驱动 Agent 利用前述工具进行干活。在不同模型 “token 纯度”不同的眼下,正好可以利用这个分野,造工具可以利用强一些、贵一些的模型;用工具可以用弱一些但便宜些的模型。

在用 Skill 干活时一个很重要的功能就是定时任务,在线各家 Agent 也都越来越原生支持了。

小结

以上,是最近和 Agent 协同干活的一些想法。由于基础模型能力还在快速提升,很多实践注定是——学的慢就可以不用学了。但在大变革、大浪潮时代下记录下的一些一线的体感,待到尘埃落定时回头来看,或许可以建立一点自己从状态到决策的预测链路样本库,也是一个很有意思的事情。

关于 Agent,大家都有什么有意思的想法,欢迎分享。

题图故事

将之前拍的北京的一些地标性建筑,让 AI 用插画风格统一生成了下,做了个集锦将之前拍的北京的一些地标性建筑,让 AI 用插画风格统一生成了下,做了个集锦


我是青藤木鸟,一个喜欢摄影、专注大规模数据系统的程序员,欢迎关注我的公众号:“木鸟杂记”,有更多的分布式系统、存储和数据库相关的文章,欢迎关注。 关注公众号后,回复“资料”可以获取我总结一份分布式数据库学习资料。 回复“优惠券”可以获取我的大规模数据系统付费专栏《系统日知录》的八折优惠券。

我们还有相关的分布式系统和数据库的群,可以添加我的微信号:qtmuniao,我拉你入群。加我时记得备注:“分布式系统群”。 另外,如果你不想加群,还有一个分布式系统和数据库的论坛(点这里),欢迎来玩耍。

wx-distributed-system-s.jpg