惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Simon Willison's Weblog
Simon Willison's Weblog
P
Privacy International News Feed
www.infosecurity-magazine.com
www.infosecurity-magazine.com
T
Troy Hunt's Blog
Hacker News - Newest:
Hacker News - Newest: "LLM"
Attack and Defense Labs
Attack and Defense Labs
S
Secure Thoughts
V2EX - 技术
V2EX - 技术
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
O
OpenAI News
Cloudbric
Cloudbric
Google Online Security Blog
Google Online Security Blog
Schneier on Security
Schneier on Security
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Help Net Security
Help Net Security
Cyberwarzone
Cyberwarzone
G
GRAHAM CLULEY
L
Lohrmann on Cybersecurity
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
Spread Privacy
Spread Privacy
NISL@THU
NISL@THU
N
News and Events Feed by Topic
T
Tenable Blog
S
Security @ Cisco Blogs
N
News and Events Feed by Topic
The Hacker News
The Hacker News
C
CXSECURITY Database RSS Feed - CXSecurity.com
宝玉的分享
宝玉的分享
月光博客
月光博客
酷 壳 – CoolShell
酷 壳 – CoolShell
美团技术团队
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Google DeepMind News
Google DeepMind News
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
T
Tailwind CSS Blog
V
Visual Studio Blog
P
Proofpoint News Feed
Webroot Blog
Webroot Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
博客园 - 三生石上(FineUI控件)
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
Jina AI
Jina AI
雷峰网
雷峰网
T
The Blog of Author Tim Ferriss
Hugging Face - Blog
Hugging Face - Blog
腾讯CDC
L
LangChain Blog
The Register - Security
The Register - Security
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
博客园 - 聂微东

Steve Sun

【译文】循环工程的艺术 【译文】请不要搞个 【译文】自主长时运行编程 Agent 【译文】/goal + 损失函数:如何用一条指令在 30 小时内蒸馏一个产品 我怎么用 Hermes Agent 写代码 【译文】运行一个 AI-native 的工程团队 【译文】运行一个 AI-native 的工程团队 【译文】你可以直接这么说 【译文】你可以直接这么说 如何设计一个智能体(AI Agent) 如何设计一个智能体(AI Agent) 【译文】为什么你的"AI-First"策略很可能是错的 【译文】为什么你的"AI-First"策略很可能是错的 记忆的层级,和 AI 智能体的记忆管理 AI Agent 工具对比:MCP 为什么只是个过渡产物 AI Agent 工具对比:MCP 为什么只是个过渡产物 外部化的J人 外部化的J人 Omarchy 一些中文环境下的设置 Omarchy 一些中文环境下的设置 AI Agent + 产品经理 = 产品测试工程师 AI Agent + 产品经理 = 产品测试工程师 遇到 Linux 系统 Kernel Panic 了该如何应对 遇到 Linux 系统 Kernel Panic 了该如何应对 如何与「老登」相处 Cursor等AI编程工具的背后原理 为什么不应该让AI生成单元测试
【译文】我们现在是工厂工程师,不是产品工程师
https://github.com/stevedsun · 2026-06-25 · via Steve Sun

原文We are now factory engineers, not product engineers·· 作者:Zach Lloyd·· 声明:本文由 AI 翻译,可能包含错误

这是我们与 Warp 团队分享的一篇备忘——关于构建 Warp 这件事应该如何重新理解。它混合了我们从客户那里听到的反馈、我对开发未来的判断、以及 Warp 团队要如何调整才能保持领先。

过去一年里,我们经历了从 AI 自动补全到交互式编码 Agent 的跨越。未来六个月,范式将再次进化到 Automated Development

在 Automated Development 的世界里,工程师的工作不再是写代码。甚至不再是直接构建产品。而是构建一套内部的机器——一座云端的软件工厂——让这座工厂来替你生产产品。工厂的目标是交付卓越的产品,但工程师的日常工作不是直接造产品,而是造那个造产品的系统。

成功的衡量标准不是某个工程师交付了多少功能——那是一个失败的指标。真正的尺度是:多大比例的变更实现了全自动交付,以及成本是多少。“全自动"意味着一个 agent 完成了所有工作:从 Triaging、写规格说明、实现、审查、验证到监控。如果一个变更还不能全自动地交付(当前很多还不能做到),那目标就是半自动化——即使人类仍然需要在审查环节介入,也让 agent 去做 triage 或验证。尽一切可能让 agent 来完成。

每个工程师的职责是提升他们团队的产品工厂(Product Factory)的效率。工厂效率大约等于:交付的产品 ÷(推理成本 + 人工时间成本)。

公司会用 ROI 来评估工厂的效果:如果在自动化上花了一美元,业务能否收回超过一美元的价值?交付产品并非衡量价值的完美尺度,但现阶段够用了。

给所有工程师无限 token 预算、让他们随意使用交互式编码 Agent 的日子正在终结。取而代之,公司会把软件生产视为可变成本,而不是研发费用。它将出现在利润表的 COGS(销货成本)行上——因为公司想知道,在软件工厂上投入越多,边际收益是多少。

我写这些是因为,这就是 Warp 需要拥抱的心态。每个工程师必须停止认为自己是在直接修改代码库和产品,而应该通过"改善工厂"的视角来看待一切。

当然,在建设和改进工厂的过程中,你仍然需要直接改善产品——毕竟我们交付的产品才是为客户和用户创造价值的东西。但每当我们的工厂失败时,我们需要从中学习,下一次再往自动化的方向推进一步。随着时间的推移,自动化的比例会越来越高,直到我们的工作纯粹是提升效率,而不是把车从流水线上搬下来自己去造。

这对 Warp 尤其重要,因为我们的公司现在本身就是做工厂的生意。我们运营着一座工厂来改进开源的 Warp 终端——近百万开发者依赖它持续变好。同时我们也在推出一个叫 Oz 的平台,帮助其他公司把同样的工作流复用到他们最重要的产品上。工厂生意将是唯一重要的软件生产力生意——既然我们在卖这个,我们最好自己先拥抱它。

需要改变什么:自动化审计

第一,我们必须衡量吞吐量和效率。我们必须严格审视产品中有多少比例是自主交付的、成本是多少。我们现在还没有做到。当前最需要追踪的指标是:全自动完成任务的比例,以及完成这些任务的成本。

第二,我们必须强迫自己以"自动化优先"的思维方式面对一切。也就是说,每次使用交互式 agent(即人类在回路中)写代码,都要把它视为一个需要学习的失败。对每项任务,都应该遵循工厂的工作流,只在真正需要的时候才把东西从流水线上搬下来。现阶段我们经常需要这么做,没问题。但目标是越来越少。

工厂工作流很简单:

  1. Triage Agent 运行,尝试理解和复现问题
    • 如果判定任务可以自动化 → 交给 Implementation Agent
    • 如果因为模糊性或范围问题需要规格说明 → 交给 Spec Agent
    • 如果仍不明确 → 获取人类输入并重试,或暂缓处理
  2. [如果需要] Spec Agent 运行
    • 人类审查规格说明,然后交给 Implementation Agent
  3. Implementation Agent 写代码
  4. Code Review Agent 审查代码
  5. Verification Agent 通过计算机使用或其他方式进行验证
  6. 人类审查代码和验证输出
    • 如果需要,回到步骤 2、3、4 或 5
  7. CI / CD
  8. 交付
  9. Monitor Agent 运行,如果有问题则创建 issue,完成闭环

这个工作流应该看起来很熟悉——它就是我们为拥有 60k star 的开源项目建立的流程。你可以在 build.warp.dev 看到它的实际运行状态。我的判断是,它发挥了大概一半的效用,但我们还没有真正全身心投入。我看到 build.warp.dev 上的 ready-to-implement 状态里堆积了 1300 个 issue,心里想的是:“我们还等什么?让 agent 去实现它们。” 我们必须让它完全跑起来。

每当我们不得不让人类介入流程,我们的平台 Oz 就需要记录这一点,并且让自我改进 agent 尝试优化流程,减少人类再次干预的概率。同样,我们需要自我改进 agent 持续监视工厂相关的对话,寻找 token 浪费的模式并建议效率提升方案。我们应该定期评估不同的 harness 和 prompt,记录哪些在下一次执行中表现更好。

作为 Warp 的工程师,我们的首要工作是确保这套工作流顺畅运行,并让 Oz 提供尽可能最好的支持体验。如果我们做到了,工厂最终将达到递归自我改进的状态。这是黄金路径。

这听起来可能像是对苦差事的拥抱,或者是一个理想主义但不切实际的愿景——好像我们不能再摆弄代码了,或者要把所有时间花在审查 agent 生成的垃圾上。

我的看法不同。我认为这是软件工程最后一个、也是最重要的一个问题——可以称之为元工程:设计一个让 coding agent 能够最高效地构建和交付有用东西的系统。

是的,短期内会有一大堆痛苦——agent 失败,我们不得不审查它们的垃圾代码。但我们必须让自己经历这些痛苦,这样才能找到自动化解决它们的方法。如果我们不做,别人会做。

我们的使命始终是赋能开发者更快地交付更好的软件。让所有人学会构建、管理和调优云端的软件工厂——就是这个使命的最终形态。