惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

S
Security Archives - TechRepublic
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
Microsoft Azure Blog
Microsoft Azure Blog
V
Visual Studio Blog
美团技术团队
GbyAI
GbyAI
The Cloudflare Blog
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
N
Netflix TechBlog - Medium
Jina AI
Jina AI
G
Google Developers Blog
H
Help Net Security
Blog — PlanetScale
Blog — PlanetScale
有赞技术团队
有赞技术团队
Martin Fowler
Martin Fowler
J
Java Code Geeks
F
Fortinet All Blogs
云风的 BLOG
云风的 BLOG
Google DeepMind News
Google DeepMind News
IT之家
IT之家
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
博客园 - 司徒正美
博客园 - Franky
博客园 - 三生石上(FineUI控件)
MyScale Blog
MyScale Blog
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
Stack Overflow Blog
Stack Overflow Blog
Y
Y Combinator Blog
阮一峰的网络日志
阮一峰的网络日志
aimingoo的专栏
aimingoo的专栏
博客园_首页
MongoDB | Blog
MongoDB | Blog
T
The Blog of Author Tim Ferriss
U
Unit 42
Hugging Face - Blog
Hugging Face - Blog
M
MIT News - Artificial intelligence
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
雷峰网
雷峰网
博客园 - 【当耐特】
NISL@THU
NISL@THU
Engineering at Meta
Engineering at Meta
P
Proofpoint News Feed
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
G
GRAHAM CLULEY
V
Vulnerabilities – Threatpost
K
Kaspersky official blog

博客园_首页

Linux实操--组管理、权限管理和定时任务 Java + EasyExcel 实现单个接口导出多个Excel Mem0 源码解析系列(二):提示词工程的深度剖析 Openclaw TaskFlow究竟是什么?和普通Skill技能有什么区别 博文阅读密码验证 - 博客园 嘉立创开源:应该是全网MicroPython教程最多的开发板 Hermes Agent 集成实践:从协议到生产 2026年AI编程工具横评:Cursor、Codex、Claude Code、Zed、Windsurf Java程序员必看的RAG入门教程 2026 AI效率神器:Superpowers + Claude Code 保姆级教程 本地大模型部署全攻略:从 0 到 1 玩转 Ollama 【从0到1构建一个ClaudeAgent】内存管理-上下文压缩 .NET 高级开发 | 设计、实现一个事件总线框架 电子小白入门之NE555 3. WorkBuddy:隐藏玩法,一键召唤专家,让 AI 以"专家身份"给你干活 和AI一起搞事情#3:Claude Teammate 游戏开发翻车实录 【OpenClaw】通过 Nanobot 源码学习架构---(7)Memory C# .NET 周刊|2026年3月3期 我在 Debian 11 上把 K8s 单机搭起来了,过程没你想的那么顺(/opt 目录版) 深度学习进阶(七)Data-efficient Image Transformer CLI+Skill搭建浏览器AI自动化框架,告别一切重复枯燥任务 告别Token账单无底洞:OpenClaw本地部署,重塑企业数据主权的唯一解 FastAPI+Vue:文件分片上传+秒传+断点续传,这坑我帮你踩平了! SBTI 爆火后,我做了个程序员版的 CBTI。。已开源 + 附开发过程 多模态检索开始进入工程期:用 Sentence Transformers 搭建可落地的 Multimodal RAG 100多行代码实现一个最简单的Agent(用ReAct) Claude Code 通关手册(八):推荐 5 个 Hooks,代码质量提升 3 倍 老板:“有人截图了!”。安全部门:“收到,马上查暗水印!” - why技术 技术之外,皆是人间 C#/.NET/.NET Core技术前沿周刊 | 第 69 期(2026年4.01-4.12) Snack JSONPath 项目架构分析 Claude Code Buddy 小析:一个非核心功能,如何体现产品的细节完成度 AI新时代下的图床管理方案-Cloudflare图床+MCP+Skills方案指南 化繁为简:顺丰速运App如何通过 HarmonyOS SDK实现专业级空间测量 从零实现富文本编辑器#13-React非编辑节点的内容渲染 AI开发-python-langchain框架(3-23-OpenAI Functions风格Tool Calling智能助手) .NET + AI 进阶实战:基于类的技能开发 - 打造可治理的 Agent 能力模块 【从0到1构建一个ClaudeAgent】规划与协调-技能 上周热点回顾(4.6-4.12) 电子小白的工具三件套:面包板、杜邦线、万能板 单表五亿数据的查询优化 | Mysql、StarRocks 2. WorkBuddy:从“我是谁”到“帮我干活” C# 如何减少代码运行时间:7 个实战技巧 基于HelixToolkit.SharpDX 渲染3D模型 - 笺上知微 从零开始的双臂具身VLA起源及现阶段发展综述 - SkyXZ 记对 xonsh shell 的使用, 脚本编写, 迁移及调优 - pluvium27 受够了Vibe Coding的失控?换个起点,让AI事半功倍 从开始配置漏洞环境到漏洞复现流程 - 難しい 关于10年工作经验的程序员对OpenClaw的实战经验分享以及看法 - 虚无境 Any metadata 的内存布局 C# .NET 周刊|2026年3月2期 - InCerry 我帮你测过了,测试圈排名第二的 Skill 依然很牛逼 Skill Discovery | 无监督技能发现的经典工作总结 - MoonOut PbootCMS 网站内容数量多导致访问慢?这些实用优化方案帮你提速! - 家兴网络技术工作室 上下文工程是什么?过时了么?一文讲明白! - 一枫说码 网站漏洞怎么发现并修复?一篇实用指南(附完整流程) - 家兴网络技术工作室 开了 TUN 模式还是直连?90% 的人都踩过这个坑 Github日报|2026年04月12日 - AI一族 AScript扩展多种脚本语言 - rockey627 AI 学习笔记:Agent 的记忆机制 你能被装进一个文件里吗?——7 万人把同事"蒸馏"成了 AI - 我没有三颗心脏 Claude Code 通关手册(七):给 AI 装上技能包——Skills 完全指南 - 暮色之狐 在浏览器中快速编辑代码:VSCode Web 集成实践 - Newbe36524 蒸馏自己 skill?基于 Deepseek 的蒸馏器,丐版蒸馏方式,简单便捷 - To_Carpe_Diem Spring AI Aliababa和AgentScope,哪个更好? - 苏三说技术 Etsy 把 1000 个 MySQL 分片迁进 Vitess:425TB 数据背后的真正问题不是性能,而是运维规模 MicroPython LVGL基础知识和概念:底层渲染与性能优化 - FreakStudio 数据库草图算法 Python 潮流周刊#146:CPython 引入 Rust 的进展 - 豌豆花下猫 最小生成树 - mofei1116 红日靶场七:从外网入口、容器逃逸到 AD 接管的完整利用链复盘 - YouDiscovered1t 分享四款开源且实用的 Kafka 管理工具 - 追逐时光者 vLLM 权重加载机制全解析:从挑战到理想架构 LCT 学习笔记 - ACehomoxue Avalonia UI 12.0.0 正式发布:架构演进和性能飞跃 - 张善友 当 AI Agent 把调用链拉长,延迟开始成为一门生意 conhost.exe 无法显示 U+2717 - 145a 太秀了,我把自己蒸馏成了 Skill!已开源 - 程序员鱼皮 ASP.NET Core 内存缓存实战:一篇搞懂该怎么配、怎么避坑 基于 Ghostty 带有分割标签页和为 Claude 编程设计的通知终端 - BugShare AI 焊死入口:教育的“操作系统级”重塑 - 郝hai 初级Java开发工程师使用sql脚本编写代码的过程是简单而且不糊涂 - CoderOilStation Claude Code通关手册(六):MCP协议完全指南 - 暮色之狐 边框灯光环绕动画特效实现指南 - Newbe36524 开源:子木蒸馏版的 SEO 审计工具 seo-audit-skill v1.0 我所理解的Python元模型 【从0到1构建一个ClaudeAgent】规划与协调-TodoWrite - 程序员Seven Claude 和 Codex 在审计 Skill 上性能差异探究 - ACai_sec AScript如何实现中文脚本引擎 - rockey627 【渗透测试】HTB Season10 Garfield 全过程wp - dynasty_chenzi Android 开发者为什么必须掌握 AI 能力?端侧视角下的技术变革 树状数组正确性证明 - AC-wyr 你的 AI 焦虑,可能比 AI 本身更危险——ATM 机没有消灭银行柜员,但恐慌消灭了你的判断力 - 我没有三颗心脏 一个拉胯的分库分表方案有多绝望?整个部门都在救火! - 冰河团队 动态规划入门必学之走方格问题 - Ofnoname PostgREST 与 PostgreSQL 角色权限配置全解析(生产级实践) - SheepDog1998 使用 UEFI 图形输出协议 GOP 在屏幕上显示图像的方法 - 阿源- Claude Code通关手册(五):组建你的AI专家团队,子代理系统 - 暮色之狐 一个程序员到架构师的催婚路之感悟(整整10年后的催婚相亲感悟) - MisterLip 用 Agent Skill 自动生成工作周报 - 赵康
和AI一起搞事情#7. 给游戏NPC接入Hermes?
风雨中的小七 · 2026-06-15 · via 博客园_首页

上一周一直在搞图片拆PSD图层、海报文字编辑的功能,有一阵没做游戏了,咱接着回来做中医游戏。好了不废话,这期咱们聊聊怎么给游戏NPC装个"智能大脑",顺便看看开发过程中Hook这个老朋友的新玩法。

先汇报一下进度

✅ 对话卷轴+Hermes:青木先生现在能查病案、翻背包、看进度,还会按教学大纲给你上课,触发辩证游戏,再给你的辩证打分
npc对话

✅ 炮制游戏:当归 + 黄酒炮制 -> 酒制当归
炮制

✅ 病案集:不想跟NPC聊天?行,自己选病例玩辩证游戏
病案

✅ 后端DataBase:前后端增加了数据库进行状态管理,这样可以保证npc工具查询和前端展示数据的一致性。

为什么NPC需要"智能大脑"?

虽然咱没怎么玩过游戏吧,但是也能看过游戏视频呀!那种一碰npc就只会跟你说“向东走那里有意想不到的收获。“”是一件很无聊的事情。所以我们希望NPC有自己的灵魂,同时也能根据游戏状态动态变化,最好能直接操控游戏给玩家发布任务。

Agent选型:Python才是真爱

最后选了Hermes而不是Lobster(龙虾🦞),理由简单——我熟Python。

别笑,这事儿很严肃。AI确实降低了跨语言开发门槛,但就像用翻译软件能看懂法语菜单、不代表你能跟法国大厨讨论烹饪技巧。遇到复杂问题时,母语开发效率能差3-5倍,心理压力也完全不同。

所以有些python的开源项目,真的是赢在会python的人太多了...

接入方案:从gateway接入简单快速

核心思路:把游戏当成一个聊天平台,通过Gateway接入Hermes。

Hermes是个三明治架构🥪:

┌──────────────────────────────────────────────┐
│            顶层:平台适配器层                  │
│  Telegram | Discord | Slack | WhatsApp | ...  │
│  (翻译官:把各平台事件转为统一格式)            │
└──────────────────┬───────────────────────────┘
                   ↓
┌──────────────────────────────────────────────┐
│           中间层:Gateway 核心               │
│  会话路由 | 授权鉴权 | 限流 | 定时任务        │
│  流式传输 | 媒体处理 | 审批按钮 | Hooks       │
└──────────────────┬───────────────────────────┘
                   ↓
┌──────────────────────────────────────────────┐
│           底层:AIAgent 核心                 │
│  LLM 调用 | 工具调用 | 记忆 | 会话历史        │
│  (对平台一无所知,只管思考和回答)             │
└──────────────────────────────────────────────┘

三层架构的设计,提供了可以灵活接入各个平台的Gateway层,在游戏中灵活的接入Agent的能力,只需要把游戏当做一个平台,提供对应的适配器,来处理流式消息即可。

给NPC装外挂:技能+工具

同时为了让NPC更智能,还需要为每个智能体提供外挂,包括技能、工具、每个智能体的角色文件

技能层主要是npc的日常SOP工作流,包含以下
image

而工具层会更复杂一点,因为需要完成所有游戏状态的获取和更新、触发操作,包括

  • 状态获取:获取玩家的背包、病案进度、整体学习进度
  • 状态更新:创建学习任务、触发诊断配伍游戏、记录更新记忆(这里没有完全使用hermes内置的记忆模块,因为非结构化记忆在教学场景的稳定度不满足要求)

image

工具现在还很基础,更多问题其实需要真实开始场景模拟后暴露出来再进行修复了,不过数据库已经初步接入进来,后续的调整也会更多在数据SCHEMA层所以复杂度还好。主要是记忆和任务模块的边界我还没太想好,走一步看一步吧~

Hook的花样玩法

很多人觉得Hook就是"到点执行固定脚本"——比如任务完成发个通知、调用工具前检查权限。但我觉得Hook的本质是:在AI自主决策的缝隙里,塞入人类的理性。

本质上更像是在LLM自主执行的多个行动之间通过链表的形式穿插进固定的状态和流程。

和/ultrawork的思路互补,一个是自主之中有编排,另一个是编排之中有自主,最终或者会走向统一?

并且毫无意外的是并不引入新的语法,而是就基于coding本身实现编排,毕竟这是AI当前完成最好,最容易校验的任务。

那在游戏的开发中我们用到了哪些hooks呢?

Pre-tool Hook:Key泄露拦截器

血泪教训:某天让AI帮我提交代码,结果它把我的OpenAI Key一起push到GitHub了😱。

赶紧用git-filter-repo把所有历史commit扫了一遍(⚠️ 警告:这玩意会重写Git历史,操作前务必备份!)

于是立刻马上就让CC增加了安全扫描Hook,也是最基础的“脚本型”Hook,具体的指令流程如下。

image

Hook的开发其实可以类比接入新API,先去官网拉取Hook开发规范并写入文档,这样之后开发新的hooks也不需要在查规范直接先看文档就完了,之后再开始开发hook,并E2E测试后再接入。

最搞笑的地方来了....

因为安全拦截做的太强,导致写好的hook代码本身无法commit了....

然后AI看到拦截消息,回复“我太强了”

哈哈哈哈,笑不活了.....

Post-Tool Hook:设计文档审查官

问题:让AI设计功能时,它经常被用户的提问"带偏"。

比如我说"背包数据显示不一致",AI只会修修补补解决表面问题,而不会意识到根因是缺少统一的状态管理数据库。

解决方案:加个"事后诸葛亮"的反思Hook

当检测到工具输出是对docs/superpowers/specs进行文件写入时,当自动触发审核任务。

这个Hook更复杂些,是一个“脚本型”hook,因为所有反思评估都需要在新的上下文中执行。通过脚本启动独立CC进程进行设计文档的审核,从整个设计文档需要解决的问题触发,审核文档是否有遗漏、模糊、矛盾待澄清的设计点。

AI圈其实是个圈,没过一阵就会发现历史的风又吹风回来了。所以自主虽好,但self-evaluation(reflection)在当前的模型能力下依旧有加成的。
image

这和superpowers自带的spec-review有啥区别?

  • 自带的:细节微调,像语文老师改错别字, 并且纯靠指令触发,国产模型长上文的触发概率并不高...以至于我看源码前都不知道这个功能竟然存在......
  • 我的Hook:全局审查,像技术总监做Code Review,并且通过hook强制触发
    image

Pre-Compact + Session-Start Hook:记忆交接棒

个人体验CC的compact效果比较一般,也或许不同类型的项目本就需要不同的跨session信息传递方式。

所以还是自己上手做了,好不好另说,至少肯定不会再埋怨别人,只会蛐蛐自己。

选择的方案是在compact之前同时创建“handover.md” + "STATE.md" + "PROGRESS.MD"这三个文件,还是那个思路文件持久化,作为唯一真相源,他们分别存储

  • STATE:项目状态描述,长期
  • PROGRESS:当前进行中任务状态描述,短期
  • handover.md: 简要概括STATE+PROGRESS并引用对应文档,然后给出下一步todo指令

然后再下一个session start的时候通过Prompt hook,在上下文中自动载入handover.md就行了。

所以整个Agent循环总共涉及到了以下Hook的触发流程

image

如果涉及到多个Agent并发工作,例如teammate模式之类的,注意需要配合git worktree一起使用,不然会出现更新冲突哟。