背景介绍
我之前有过几次阅读小组的经验(参考 t/1138988 DDD 、t/1111500 Agent Harness ),最近在做 AI Agent 相关的工作,想沿着 Harness Engineering 这条线深读几篇论文。
刚啃完《 Agentic Harness Engineering 》( arXiv:2604.25850 ,复旦+北大+奇迹智峰),论文核心思想:在模型能力趋同的时代,决定 coding agent 表现上限的是围绕模型搭建的工具链( harness )。10 轮自动迭代从 69.7% 涨到 77.0%( Terminal-Bench 2 ),超过人工调了几个月的 Codex-CLI 。
接下来的计划(阅读小组投票选举)
前沿论文
- Meta-Harness (arXiv:2603.28052) — Stanford ,AHE 同期工作
- SkillRL (arXiv:2602.08234) — skill 自进化
- SkillClaw (arXiv:2604.08377) — skill 集体进化
工程实践
- Anthropic Harness Design — Anthropic harness 经验
- OpenAI Harness Engineering — skill library 和工具进化的奠基/扩展工作
预计 6-8 周左右,根据进度灵活调整。
形式
- 时间:周一至周五晚上 8:00 PM - 9:00 PM Shanghai
- 平台:MS Teams 会议
- 形式:一读三问(分节阅读 / 有不懂的地方需要讨论吗 / 有重点内容需要分享吗 / 有需要总结吗)
- 不强制参与,有事跳过,但希望意志力强一点
补充说明
- 招 2 个人,目前已经有 4 位成员,每次最多 6 人,有 3 人参与当天即可继续阅读
- 要求 8:00-9:00 PM 这个时段稳定有空,对不加班的业界朋友友好
- 有 AI Agent 相关工作经验或兴趣最佳
感兴趣的朋友微信联系 cHlsb24ucGVuZ0BnbWFpbC5jb20=