惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

S
Schneier on Security
Hugging Face - Blog
Hugging Face - Blog
V
Visual Studio Blog
博客园 - Franky
酷 壳 – CoolShell
酷 壳 – CoolShell
Last Week in AI
Last Week in AI
博客园 - 叶小钗
博客园_首页
阮一峰的网络日志
阮一峰的网络日志
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Application and Cybersecurity Blog
Application and Cybersecurity Blog
TaoSecurity Blog
TaoSecurity Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
J
Java Code Geeks
爱范儿
爱范儿
宝玉的分享
宝玉的分享
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
量子位
N
News and Events Feed by Topic
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
Recent Commits to openclaw:main
Recent Commits to openclaw:main
SecWiki News
SecWiki News
MyScale Blog
MyScale Blog
AI
AI
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
博客园 - 【当耐特】
Security Archives - TechRepublic
Security Archives - TechRepublic
F
Fortinet All Blogs
V2EX - 技术
V2EX - 技术
T
Troy Hunt's Blog
有赞技术团队
有赞技术团队
W
WeLiveSecurity
Project Zero
Project Zero
T
Tor Project blog
Help Net Security
Help Net Security
L
LINUX DO - 最新话题
IT之家
IT之家
The Hacker News
The Hacker News
腾讯CDC
Schneier on Security
Schneier on Security
N
News and Events Feed by Topic
C
Cisco Blogs
博客园 - 聂微东
Webroot Blog
Webroot Blog
Forbes - Security
Forbes - Security
M
MIT News - Artificial intelligence
C
Cyber Attacks, Cyber Crime and Cyber Security
雷峰网
雷峰网
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
A
About on SuperTechFans

博客园_首页

Plist 二进制格式 Milvus 和 PGVector,哪个更好? OpenClaw 已过时?在 VS Code 中运行 Hermes Agent! 第30篇文章:一个大三计科生的自白 Manim如何在数学公式中完美显示中文? Docker 部署 RocketMQ 5 并发编程核心概念辨析 C#事务处理最佳实践:别再让“主表存了、明细丢了”的破事发生 CLI 是什么?为什么大厂突然集体卷命令行? 【从0到1构建一个ClaudeAgent】协作-自主Agent UIImageView 设置图片不生效的原因排查 最小二乘问题详解20:无先验约束下的增量式SFM自由网平差 痞子衡嵌入式:大话双核i.MXRT1180之XIP应用里借助MU实现可靠Flash IAP的方法 AI Chat 封装, SemanticKerne.AiProvider.Unified 已发布 Windows下右键编辑js文件无法打开记事本——在注册表中使用环境变量 在后台服务中使用 Scoped 服务,为什么总是报错? H200 安装驱动并使用sglang启动模型 wireshark 抓包Trap上报告警内容 我用 AI 辅助开发了一系列小工具(2):图片压缩工具 [A Primer On MC and CC] 2.1 Memory Consistency 1 - 指令重排序和 SC 模型 Oracle数据库SCN推进技术详解与实践指南 玩转控件:封装个带图片的Label控件 Claude Code 4.7 真正该升级的不是模型,而是你的工作流 前端小白一句话,AI 帮我做了个颜值拉满的桌面媒体播放器。当代码不再是门槛,一句话编程就是现实。 5. WorkBuddy: 小龙虾的灵魂三件套,让你的小龙虾不只是工具 SQLite 分片方案实战:三种分片策略的深度对比 告别简陋 UI!一款基于 Fluent Design 和基于 WinUI 的开源免费、现代化的 Avalonia UI 控件库 关于二进制排列组合枚举的总结 AI开发-python-LangGraph框架(3-27-LangGraph从零实现大模型智能决策工作流) ElasticSearch主分片和副本分片概念详解 【002】HTTPS 粗解:证书、TLS 握手与对后端配置的影响 Hermes Agent 一周暴涨五万 Star,但我劝你别急着追 明明连接的是Redis的DB0,为什么能查到DB3的数据? 【从0到1构建一个ClaudeAgent】协作-Agent团队 熟悉电子元器件之后,电子小白下一步该怎么走? MAF快速入门(23)通过C#类定义Skills .NET 高级开发 | 手写一个对象映射框架 FastAPI数据库ORM怎么选?我肝了三个Demo后,终于不再纠结了 mysqldump 参数拾遗:在遗忘与铭记之间 C# .NET 周刊|2026年3月5期 Claude code入门 - 陈彦斌 一文学习入门 ThingsBoard 开源物联网平台 GitHub 热门项目 | 2026年04月16日 如何为GIT设置全局勾子,为每次提交追加信息 Number.isFinite和isFinite与isNaN()和Number.isNaN的区别 PortSwigger SQL注入LAB2 推荐一个测试人必备的Skills,从功能到性能全搞定(附详细实操和安装下载方式) 筑基期:掌握Odoo基础核心知识点02(Odoo XML 开发方式详解) GLM模型这么火,咱们用vllm也咧一个呗! 深入理解 AbortController:从底层原理到跨语言设计哲学 字符串学习笔记 多租户系统框架的基础模块设计和分析设计 Apache SeaTunnel Zeta 为什么能做到“又快又稳”? AI开发-python-LangGraph框架(3-26-LangGraph基本概念及第一个简单样例) Vue 3 组件通信,别只会用 Props 和 Emits 了,这几个狠活儿你得看看 ElasticSearch7.X版本配置密码 用Manim实现动态交点计算--从一个动点问题说起 团结引擎+Addressable+Instant Game打包抖音小游戏 function call 实战:让 LLM 自动判断 pod 异常、调用日志工具并完成故障分析 bubseek —— 让 Agent 的足迹,变成团队的洞察 通过 C# 读取并导出 PDF 书签 如何用 GitHub Actions 实现 Steam 自动化发布 【从0到1构建一个ClaudeAgent】并发-后台任务 .NET 高级开发 | 定制 ASP.NET Core 框架 电子小白:什么是运算放大器(运放) zero2Agent:面向大厂面试的 Agent 工程教程,从概念到生产的完整学习路线 堆上的ORW HC32F460 USB CDC通信异常:非对齐访问异常排查 20260413-Hyperbridge 攻击事件:发生在默克尔山上的验证绕过 那些喊着AI 要淘汰你的人,正在靠你的焦虑赚大钱! 深度学习进阶(八)Swin Transformer 最小二乘问题详解19:带先验约束的增量式SFM优化与实现 SnapTranslate 3.0 正式发布:全局划词翻译 + 完整英语学习闭环,一站式搞定查词、记词、复习 工作的意义、工作的困难认知再思考 .NET + AI 进阶实战:基于类的技能开发 - 打造可治理的 Agent 能力模块 【从0到1构建一个ClaudeAgent】规划与协调-技能 上周热点回顾(4.6-4.12) 电子小白的工具三件套:面包板、杜邦线、万能板 单表五亿数据的查询优化 | Mysql、StarRocks 2. WorkBuddy:从“我是谁”到“帮我干活” C# 如何减少代码运行时间:7 个实战技巧 基于HelixToolkit.SharpDX 渲染3D模型 - 笺上知微 从零开始的双臂具身VLA起源及现阶段发展综述 - SkyXZ 记对 xonsh shell 的使用, 脚本编写, 迁移及调优 - pluvium27 受够了Vibe Coding的失控?换个起点,让AI事半功倍 从开始配置漏洞环境到漏洞复现流程 - 難しい 关于10年工作经验的程序员对OpenClaw的实战经验分享以及看法 - 虚无境 Any metadata 的内存布局 C# .NET 周刊|2026年3月2期 - InCerry 我帮你测过了,测试圈排名第二的 Skill 依然很牛逼 Skill Discovery | 无监督技能发现的经典工作总结 - MoonOut 上下文工程是什么?过时了么?一文讲明白! - 一枫说码 开了 TUN 模式还是直连?90% 的人都踩过这个坑 AScript扩展多种脚本语言 - rockey627 AI 学习笔记:Agent 的记忆机制 你能被装进一个文件里吗?——7 万人把同事"蒸馏"成了 AI - 我没有三颗心脏 Claude Code 通关手册(七):给 AI 装上技能包——Skills 完全指南 - 暮色之狐 在浏览器中快速编辑代码:VSCode Web 集成实践 - Newbe36524 蒸馏自己 skill?基于 Deepseek 的蒸馏器,丐版蒸馏方式,简单便捷 - To_Carpe_Diem Spring AI Aliababa和AgentScope,哪个更好? - 苏三说技术
让每个命令都能精准路由:HagiCode Preset Task 的多技能支持实战
Newbe36524 · 2026-06-23 · via 博客园_首页

让每个命令都能精准路由:HagiCode Preset Task 的多技能支持实战

一个 preset 里塞了多个命令,却只能共用一份技能要求?这次改造,让每条命令都能独立声明自己依赖的 skill,并在可视化面板上把这种绑定展示出来——徽标、摘要、一键安装,一气呵成。

背景

先说点背景。

HagiCode 的 preset task 是一套插件化的小工具系统。用户不必手敲命令,只要在可视化面板里填几个字段,点一下,就能创建一个自动任务会话。每个 preset 本质上是一个目录,里面通常长这样:

  • manifest.json:preset 的身份信息
  • panel.json:可视化面板的表单定义
  • commands.json:实际要执行的命令清单
  • task-preset.jsonprompts.json:任务参数和技能要求

这套东西用起来确实方便,可我们很快就撞上了一个别扭的地方。

早期版本里,skill 只能在 preset 层级的 requirements 数组里声明。什么意思呢?就是同一个 preset 内的所有命令,共享同一份技能要求罢了。听起来好像没啥,可实际用起来是这样的场景:

一个 preset 里有五条命令,其中第一条想走 last30days 这个 skill,第三条想走 ui-master,剩下三条不需要任何 skill。在旧设计下做不到。你想让不同命令路由到不同 skill,就得把这些命令硬拆成好几个 preset,配置一下就膨胀了。

这就是提案 extend-preset-task-multiple-skills-support 想解决的问题:让每条命令独立声明自己依赖的 skill,并且把这种绑定在 UI 上可视化出来。

关于 HagiCode

本文分享的方案,来自我们在 HagiCode 项目里的实践经验。HagiCode 是一个 AI 代码助手项目,preset task 系统正是它面向用户的快捷操作入口。下面讲的每一处改动,都是我们实际踩坑、实际优化出来的——毕竟纸上得来终觉浅。项目源码在 HagiCode-org/site,感兴趣的可以先去点个 Star。

先把问题想清楚:为什么不是一张映射表

动手之前,最容易想到的方案是:再开一张 commandSkillMappings 映射表,把"命令 ID → skill"的关系单独存起来。听起来很干净,职责分离嘛。

可仔细一琢磨就发现不对劲。

commands.json 里每条命令已经有一个 ID,映射表里又得把这个 ID 抄一遍。两份文件、同一个 ID,只要哪天有人改了命令忘了同步映射表,数据就漂移了。这种"为了分离而分离"的设计,后期维护成本远大于它带来的那点整洁感。到头来,只是徒增烦恼而已。

所以我们最终选了一条更直接的路:把可选的 skill 字段直接放到命令定义上。一条命令自己声明自己绑哪个 skill,就近维护,谁也不会跟谁失联。

这个决定背后,还有一条更重要的设计原则,值得单独拎出来说。

核心一:两层数据职责分离

这是整个改造里最关键的一个认知。

很多人第一反应是:既然命令上有了 skill,那做 requirement check(技能门禁检查)的时候,是不是应该去扫每个命令的 skill 字段?

不是。

我们刻意把这件事拆成了两层:

  • commands.jsonskill 字段:只负责声明绑定。它告诉系统"这条命令要绑哪个 skill",用于渲染 prompt 前导和 UI 展示。
  • task-preset.jsonrequirements 数组:才是权威枚举。它是真正的门禁,决定一个 preset 需要满足哪些技能才能运行。

换句话说,skill 回答的是"绑哪个、渲染什么",requirements 回答的是"到底允不允许跑"。两件事,别混在一起。

这么分的好处,是 check 逻辑天然简单。因为门禁始终基于 preset 层的 requirements,按 CacheKey 去重,多条命令绑同一个 skill 也只会探测一次,不会重复打点。命令级 skill 不引入任何额外的探测开销。

这条原则,也是我们否决映射表方案的根本原因——映射表会让人误以为"绑定即门禁",把两层职责又搅回去了。聪明反被聪明误,不过如此。

核心二:命令定义长什么样

改造后的命令定义,就是在原来的基础上多了一个可选的 skill 字段。以 last30days 这个 bundled preset 为例,它的 commands.json 大致长这样:

{
  "$schema": "../../schemas/commands.schema.json",
  "version": "1.1",
  "commands": [
    {
      "id": "research",
      "skill": "last30days",
      "prompt": "调研一下最近30天大家对 {topic} 的真实讨论"
    },
    {
      "id": "summarize",
      "prompt": "把上面的调研结果整理成一份摘要"
    }
  ]
}

几个要点说明:

  • version 升到了 1.1,对应的 schema 也加了可选 skill 字段。
  • 第一条命令 research 绑了 last30days skill,执行时会路由到这个技能。
  • 第二条命令 summarize 没绑 skill,它只是一条普通指令,走默认路径。
  • 注意这里没有在命令里写任何 requirement。真正的门禁,在 task-preset.jsonrequirements 里:
{
  "requirements": [
    {
      "key": "last30days",
      "cacheKey": "skill:last30days"
    }
  ]
}

research 命令绑的 last30days 必须出现在这份 requirements 里,否则就出问题了——这正是下一节要讲的硬约束。强扭的瓜不甜。

核心三:加载期的交叉校验

光在数据上声明绑定还不够,得有人兜底,防止"命令绑了一个 skill,可 requirements 里压根没声明"这种孤儿绑定溜到线上。

这个兜底就是 ValidateCommandSkills。它在 preset 包加载的时候跑一遍,逐条检查每个命令的 skill 是否都能在 preset 层的 requirements 里找到对应项。找不到,就判定为非法包,直接禁用整个 preset,并抛出诊断码 command-skill-not-in-requirements

为什么要禁用整个包,而不是只跳过那条命令?因为 preset 是一个整体,命令之间往往有依赖关系(前一条的输出喂给下一条)。如果悄悄跳过一条,后面的命令拿到空输入,行为就完全不可控了。毕竟人心隔肚皮,代码也隔肚皮。宁可让用户看到明确的报错,也不要让任务在半路上莫名其妙地跑歪。这一点,马虎不得。

这个校验是在加载期完成的,也就是说问题在 preset 注册的那一刻就会被发现,不会拖到用户真正点"运行"才暴雷。对用户体验来说,早报错永远好过晚报错。

核心四:prompt 前导的幂等拼接

接下来,是执行链路上最微妙的一环。

当一条命令绑了 skill,比如 last30days,系统在真正执行前,要把这个 skill 信息"拼"到命令前面,形成一个完整的单行指令交给执行器。这个过程由 CombineCommandSkillPrelude 负责。

举个具体的例子。research 命令的 prompt 是"调研一下最近30天大家对 {topic} 的真实讨论",绑的 skill 是 last30days,那么最终交给执行器的指令大致是:

/last30days 调研一下最近30天大家对 {topic} 的真实讨论

也就是在 prompt 前面加了 /last30days 这个前导。执行器看到这个前导,就知道要先把上下文切到 last30days 这个 skill 上。

这里有个容易踩的坑:幂等性。

为什么要强调幂等?因为有些场景下,prompt 本身可能已经带了这个 skill 前导(比如用户手动写了一半,或者从别的地方拷过来的)。如果系统傻乎乎地再拼一次,就会变成 /last30days /last30days 调研...,执行器要么报错要么行为异常。

所以 CombineCommandSkillPrelude 在拼接前会先检测一下,如果前缀已经存在,就不重复加。这一步看似不起眼,可能挡掉一类很隐蔽的 bug。

值得一提的是,这整套前导注入逻辑都在 preset 定义层(PresetTaskCatalogProvider 里的 BuildCommandPrelude)完成,SessionsController 这边的会话创建代码完全不用动。这也是职责分离带来的好处——执行入口保持稳定,技能路由的复杂度被收敛在定义层内部。

核心五:前端怎么把绑定展示出来

后端把数据模型和执行链路都理顺了,最后一步,是让用户在界面上能"看见"这种绑定。毕竟一个功能如果用户感知不到,那约等于没做。

前端这边做了三件事。

第一,命令选择器上加徽标。 在 command-picker 里,每条绑了 skill 的命令旁边会显示一个小徽标,标明它依赖哪个 skill。用户扫一眼就知道哪条命令是"带技能"的,哪条是普通命令。

第二,requirement-check 摘要区块。 面板上有一个专门的摘要区域,列出当前 preset 需要满足的所有 skill 要求,以及每条命令分别绑了哪个。这个区块的数据来源于 commandSkillsByRequirementKey 这个映射——把命令按它绑的 requirement key 分组聚合,方便用户一眼对照"要求"和"实际绑定"是不是对得上。画虎不成反类犬,大概就是这样——所以聚合逻辑要做得直给,别花哨。

第三,失败时的一键安装深链。 如果 requirement check 发现某个 skill 没装,用户不必自己去翻文档找安装入口。界面直接给出一个深链按钮,点一下跳到对应的安装流程。这一步把"发现问题"和"解决问题"之间的距离压到了最短。

前端类型这边也很克制,命令类型只是加了一个 skill?: string,并且做了归一化处理(|| undefined),避免空字符串这种边界值在后续判断里惹麻烦。

实践:五步走完整套改造

把前面零零碎碎的点串起来,整套改造其实就是五步:

  1. 扩展 schemacommands.schema.json 加上可选 skill 字段,版本号升到 1.1
  2. 解析 + 校验NormalizeCommands 负责解析命令定义,ValidateCommandSkills 做交叉校验,命令 skill 必须能在 preset 层 requirements 里找到。
  3. 注入前导BuildCommandPrelude 在执行前把 /skill 前导幂等地拼到命令前,不需要改动 SessionsController
  4. 迁移 bundled presetlast30daysui-master 这两个内置 preset 的 commands.json 改一下,给相应命令补上 skill 字段。迁移只动 commands.json,不碰其他文件。
  5. 前端可视化:类型补字段、command-picker 加徽标、requirement-check 加摘要区块、失败时给一键安装深链。

几条实践中的注意事项,单独列一下:

  • 一条命令只能绑一个 skill。这是当前的约束。如果一个场景真的需要一条命令触发多个技能,逃生舱是在 preset 层的 requirements 里声明多个 skill,让它们在 preset 级别共存。
  • 校验失败的诊断码command-skill-not-in-requirements,排查问题时直接搜这个码。
  • 前端归一化记得 || undefined,别让空串混进判断逻辑。
  • 迁移时只动 commands.json,requirements 那边保持不动,避免引入意外变更。
  • 后端测试覆盖三类场景:命令 skill 在 requirements 里(通过)、不在(禁用包)、多条命令绑同一 skill(去重正常)。

总结

这次 preset task 的多技能支持改造,表面上只是给命令加了个 skill 字段,可它背后牵出的是一个挺值得琢磨的设计问题:绑定和门禁,到底该不该分开?

我们的答案是分开。skill 字段只管"绑哪个、渲染什么",requirements 才管"允不允许跑"。这两层职责一旦搅在一起,无论是用映射表还是别的什么形式,都会让后续的校验、去重、UI 展示变得别扭。分开之后,每层都简单了:门禁永远基于一份权威枚举,绑定就近维护不会漂移,前导拼接幂等可控,UI 只是把已经清晰的数据展示出来。

回头看,整个改造没有用什么花哨的技术,靠的就是把职责切干净,然后把每一层该兜的底兜住。HagiCode 的 preset task 系统经过这一轮打磨,总算能让每条命令都精准路由到它该去的 skill 了。说到底,事情本来就该这么简单……

参考资料

  • HagiCode-org/site:项目源码,preset task 系统的完整实现都在这里。
  • HagiCode 官网:了解 HagiCode 的整体能力。
  • OpenSpec 提案 extend-preset-task-multiple-skills-support:本次改造的原始设计文档,包含 proposal、design 和 tasks。

原文与版权说明

感谢您的阅读,如果您觉得本文有用,欢迎点赞、收藏和分享支持。
本内容采用人工智能辅助协作,最终内容由作者审核并确认。