


























这是一个创建于 41 天前的主题,其中的信息可能已经有所发展或是发生改变。
1 mooncakeSec 4 月 15 日核心目标是通过约束验证保证质量吧,因为人的注意力在 ai coding 中是无法提升的瓶颈,要放弃 review |
2 kenshinhuOP @mooncakeSec 我看到的实践都是哪里是卡在人类的就用 AI 介入,如果不能完全介入就是人类和 Agent 协助。 |
4 kenshinhuOP @momogzp 对的,这个也有看过,可以对整个 Agent 的處理流有更深入的了解。同时我在想,如果现在有新的业务要做新的项目,該怎样可以让 Agent 在预期来完成需求(而不是有 人类介入 vibe 这種) |
5 NoobNoob030 4 月 15 日我之前遇到了跟你一样的困惑: https://www.v2ex.com/t/1202411 我在阅读了许多相关文章和项目之后,看的云里雾里,似懂非懂。然后我带着模糊的概念,直接进入实战,尝试各种框架( superpowers ,gstack ,gsd ,openspec ,omo ......),用过才知道咸淡。 我建议直接实践一个项目,只是问和看却不做,很难构建出清晰的认知 |
6 glacer 4 月 15 日还是 TDD 那一套,要将需求边界、测试用例确定后再进行开发 |
7 kenshinhuOP @NoobNoob030 我的了解不知道是不是这样子的,請大佬指点业下: |
11 NoobNoob030 4 月 15 日@kenshinhu #7 我理解 harness 是能让 AI 更好的完成任务的一套架构,针对不同需求,架构的内容也不同。如果理解成字面意义上的“马具”,那么“需求定义”“自动化执行”“多 agent 交互”这些就相当于“缰绳、马鞍”,你提到的“把需求定义好,分 里程->phase->PR ”也能算是 harness 。 |
13 darksword21PRO 只能说老外挺能发明概念的 我理解所谓的 harness 是不是就是之前就有的帮助 llm 处理的东西,现在把他们打包称为 harness ? |
14 kenshinhuOP @NoobNoob030 例如测试工具如果具备完善的 CLI 接口,就可以被纳入 CI/CD 流程, 从工程结构来看,这一层本质上就是 harness , 它不是前期任务,而是 Agent 能否稳定运行的基础设施。 還是通过一个 todos h5 的 webapp 試試过,還需要是实践一下才知道是怎么一回事 |
15 Clannad0708 4 月 15 日我来回答你把,在这个概念火之前,有个 cursor 的工程师来做分享。说他们内部做了大量的工程来实现 harness 。这个东西在我看来就是一套“规则说明” 他不是某个具体的框架或者技术,而是说一系列的包括提示词 prompt ,边界约束,工具描述等。一系列相关的东西来对 agent 进行 规则说明。 你要做的不是 直接告诉他 帮我实现 xxx 功能,而是详细的描述这个功能是什么样的,怎么测试他是否正常。通过一系列的 精雕细刻的设置说明和限制以及你的期望。他就能工作的更好 |
16 kenshinhuOP @Clannad0708 对这个我也想过是否是通过 prompt 来驱动,但这样整 个 LOOP 還是需要 人类介入,就如描述 好了让 Agent 處理,把他的结果看一下,再把瑕疵的地方再輸入新的 Prompt 再處理最后这样好像又变化 |
17 huaweii 4 月 15 日 via Androidopenai 是站在商业公司的立场,宝玉是在站在高级打工人的立场。 |
18 sqlNice 4 月 15 日我最近也在实践,目前项目是微前端架构。 总结:如果在使用 AI 过程中产生了手动修改代码的行为,那么这个行为都视为应该改为 skill 或增加自动化流程。 缺陷:vue2 项目没法做单元测试,目前只能把报错扼杀在发布之前。 |
19 sqlNice 4 月 15 日我是如何开始的: 后续: |
22 kenshinhuOP @sqlNice 有感而发,旧项目使用 harness 才有价值,新项目使用 harness 就好像有點带偏。可能 specs + TDD 也够。 旧项目的话更多是需要对旧有的代碼和业务 有个归纳,这个过程 中肯定 会有一些细节的损失,需要好次迭代才能也旧项目拉到一个新的高度,当然旧有的项目是意大利面条这種的就另说了,可能 重新再做会更快 |
23 joyyu 4 月 15 日Harness 本质还是围绕构建稳定可靠 Agent 的工程,和 web 开发没很大关系。 |
24 qianxaingmoli 4 月 15 日我的理解以及实践是,harness 是针对 llm 驱动的 agent ,langgraph 这种始终是 workflow 框架,束缚 llm 。 |
27 NizumaEiji 4 月 15 日感觉概念都是看的云里雾里的,目前学到的一个点就是强约束若约定。简单说就是你对 ai 提的要求它未必遵守,所以所有的要求都要有对应的约束去限制, |
28 xiaomushen 4 月 15 日宝玉的文章不错,上次和他吃火锅,还是 2008 年时候的事儿了 |
29 Huyii 4 月 15 日楼上说得对,harness 是用在 agent 上的,有个公式是:agent = harness + model 。不过我还是不太清楚如何工程实践它,挺模糊的 |
30 YanSeven 4 月 15 日@darksword21 我也这么理解的,就是围绕 prompt 和软件工程实践做的升级和打包概念。即在上下文窗口的约束之下,通过 prompt 管理来让 llm 践行软件工程最佳实践。 |
32 kenshinhuOP @Huyii 因为我一直在想,harness + model 是怎样處理需求精细化的,就像 前端 ( APP / H5 ) 里有很多细节,这種還是需要人类介入比例比较 重的,但对于像 agent 这種就真的控制 好边界就可以了 |
34 NizumaEiji 4 月 15 日@kenshinhu #31 |
36 meeop 4 月 15 日对于大部分人来说,你什么都不用做,等待 agent 自己升级就行,你做什么大概率都会被快速追赶。 |
37 bytesfold 4 月 15 日 via iPhone我已经做了两套 harness 了, |
39 visper 4 月 16 日规则约束,行为验证,任何结果都给反馈。 |
40 kerryeva 4 月 16 日我理解 harness 就是在一定程度上践行 PDCA 循环 |
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。