惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
C
CXSECURITY Database RSS Feed - CXSecurity.com
博客园_首页
H
Hackread – Cybersecurity News, Data Breaches, AI and More
T
ThreatConnect
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
博客园 - 聂微东
H
Help Net Security
T
Threat Research - Cisco Blogs
Blog — PlanetScale
Blog — PlanetScale
A
Arctic Wolf
G
Google Developers Blog
量子位
U
Unit 42
I
InfoQ
V
V2EX
F
Fox-IT International blog
P
Privacy & Cybersecurity Law Blog
V
Visual Studio Blog
J
Java Code Geeks
大猫的无限游戏
大猫的无限游戏
C
CERT Recently Published Vulnerability Notes
博客园 - 三生石上(FineUI控件)
T
The Exploit Database - CXSecurity.com
T
Tailwind CSS Blog
SecWiki News
SecWiki News
Know Your Adversary
Know Your Adversary
MyScale Blog
MyScale Blog
宝玉的分享
宝玉的分享
The Hacker News
The Hacker News
Project Zero
Project Zero
Application and Cybersecurity Blog
Application and Cybersecurity Blog
月光博客
月光博客
Recent Commits to openclaw:main
Recent Commits to openclaw:main
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
G
GRAHAM CLULEY
C
Cisco Blogs
I
Intezer
Simon Willison's Weblog
Simon Willison's Weblog
O
OpenAI News
Recorded Future
Recorded Future
T
Tenable Blog
W
WeLiveSecurity
腾讯CDC
Stack Overflow Blog
Stack Overflow Blog
T
The Blog of Author Tim Ferriss
www.infosecurity-magazine.com
www.infosecurity-magazine.com
D
Docker
C
Cybersecurity and Infrastructure Security Agency CISA
PCI Perspectives
PCI Perspectives

News Hacker | 极客洞察

GPT-4o 上更粗鲁的 prompt 略准,样本与语气定义遭质疑 《Permanent Upper Crow》:礼帽、债务与资本主义讽刺 美国量子计算豪赌遭质疑:合法性、补贴与泡沫 Claude Opus 4.8:小幅升级,honesty 与 adaptive thinking 争议 20年聊天记录分析:社交圈收缩、旧友怀旧与隐私争议 纽约对第二套房征税:超富税还是住房政策? Zendesk 涨价4倍逼客户48小时重建,评论聚焦PE、AI自建与SaaS护城河 Continue? Y/N:AI agent 权限疲劳游戏与全放行争议 FPGA上的神经形态 Ising 机:被质疑是 buzzword 拼盘 Google AI Mode逼人迁移,DuckDuckGo涨28%但基数极小 OpenWrt 室内 Wi‑Fi 漫游:802.11r/k/v 与兼容坑 Meshtastic、MeshCore、Reticulum:离网 mesh 的价值与极限 五个 frontier LLM 对 1k 真实 fact-check claim 67% 分歧,No Abstain 争议大 Apple/Google 把 push 通知变成营销与控制战场 YouTube自动标记AI视频:误判、AI slop与过滤争议 EU罚Temu 2亿欧元:非法商品、CE标与跨境直邮争议 Ruby/Java/TypeScript 做 DOCX 插件:MCPB 打包、GraalVM 原生编译与 Ruby 争议 📉 UC STEM 教员要恢复 SAT:新生数学基础严重下滑 Gemini、Gopher、Finger:HTTPS之外的轻量网与反adtech讨论 AMD 对 Vivado Linux 免费版改收费引发众怒 Claude Code显现PMF,但盈利与开源竞争仍存疑 Temu 因危险商品与合规失责被欧盟罚 2 亿欧元 Hallucinate:MIT 开源的匿名多人在线 Rave 压力破坏海马体记忆整合与推理,教育体系却爱加压 SimCity 3000 4K版:经典等距城建与现代写实之争 企业 AI 账单爆表:tokenmaxxing 与高层乱推 CIA官员家藏4000万美元金条,FBI介入疑涉黑金 Rapira:苏联俄化 Pascal 解释器 Ferrari Luce EV遭讽成iPad车:设计和品牌双翻车 AI提效后:休假、加薪还是裁员? GPU-free AI 数据中心:HPC 旧瓶装新酒? 越狱 Kindle 跑 Rust/Slint,顺带聊 jailbreak 与 Kobo 替代 Go 将支持泛型方法,社区再吵“早该有还是补洞” Lua 的“绿色”能耗优化与 JIT 争议 Qwen3.7-Max 35小时优化未知硬件kernel获10×提速,引发真实性与基准质疑 Typst+Pandoc 模板:Markdown 直出 PDF 工作流 2MB“人类烹饪”被质疑:样本不全,更像食材搭配库 WSL 中 Claude Code 贴图失效:Windows Terminal 抢占 Ctrl+V,桥接可修复 AI取代中层管理?会议、关系与跨团队协作 Last.fm 独立回归:老用户怀旧、推荐争议与数据主权 依赖别乱更:锁版本、供应链与 CI 争议 Fano 平面式 Raft:少数节点也能达成共识 GitHub PR/API 再故障,评论区质疑 AI、Azure 与微软 Mini Micro虚拟复古电脑:硬件版与开源争议 Claude Code 日用:CLAUDE.md、Skills、subagents、MCP 命令碎片化与锁定争议 加拿大转向瑞典军机,摆脱美国军购依赖 伊朗互联网流量回升:停火信号、经济恢复与网络战争争议 MacBook 暖手妙招:CPU 烤机、Intel 机型与冷凝风险 Joanna Rutkowska:自由潜水、具身性与 Claude 隐喻 特拉华 Fenwick Island 允许公司房主投票,空壳漏洞引争议 Steam Deck涨价逾200美元,AI抢RAM与通胀争议升温 Labubu与hyperreal:怪萌、稀缺炒作和中国潮玩出海 GPU 矩阵乘法会因数据可预测而提速 Tech CEO陷AI妄想:LLM迎合放大高层失真
Claude Code 动态工作流:多代理并行与 token 争议
2026-05-29 · via News Hacker | 极客洞察

🎯 讨论背景

这篇关于 Claude Code(Anthropic 的命令行编程助手)的博文在讲 dynamic workflows:把一个编码任务拆成多个阶段,让多个 agent 并行工作、互相复核、必要时反复修正,并且可以在本地或 cloud 运行,工作流脚本用 JavaScript 编写。文中拿 Bun(一个 JavaScript runtime)从 Zig 语言重写到 Rust 作为代表案例,声称借助大量并行 agent、双重 reviewer 和后续 fix loop,完成了几十万行到上百万行级别的迁移并保持很高的测试通过率。评论区的争论点主要不是“AI 能不能更快”,而是“AI 能不能更正确”:一边担心这只是更高效地烧 token,另一边认为多代理对抗和 test suite 才是关键。讨论里还提到 Cloudflare(云服务公司)也用了同名功能,以及 Claude 过去的 /ultrathink 等模式,说明 agent orchestration 已经进入产品化竞争阶段。

📌 讨论焦点

更像 token 烧钱器

很多评论者认为,真正的瓶颈不是 Claude 能跑多快,而是能不能做对。与其让更多 agent 并行吞 token,他们更想要的是更细粒度的中断、回退、手动注入想法,甚至直接编辑文件读取过程来纠偏。有人把这种方向讽刺成 tokenmaxxing,担心长时间、多轮复核只是在更贵地放大错误。还有人提到,大型任务里 AI 常会悄悄改坏不该动的东西,甚至把测试系统本身弄坏,导致 CI 绿了但质量并没提升。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10] [来源11]

多代理对抗与 ground truth

另一派从设计逻辑上替它辩护:让多个 agent 从不同角度独立工作,再互相挑错、互相反驳,直到结果逐步收敛。这里的关键不是“大家达成共识”,而是拿 test suite、详细 spec 或真实可运行结果来做 ground truth。评论里把这类思路类比为长期存在的 adversarial ML 方法,强调这是把对抗式验证搬进代码工作流。也有人补充说,人和 AI 都可能对错误形成共识,所以最终必须以真正能工作的结果为准。

[来源1] [来源2]

内部大规模改写与工程优化

Anthropic 团队成员列出了不少内部用例,试图证明 dynamic workflows 在大规模机械迁移和重复性优化上很有用。最醒目的例子是 Bun(一个 JavaScript runtime)从 Zig 重写到 Rust:据说用了约 75 万行 Rust、11 天、99.8% 测试通过率,还通过多个 workflow 并行处理字段 lifetime、文件迁移和后续的性能修正。除此之外,还有减少 token 效率浪费、把 tree-sitter、WASM 相关模块迁到 TypeScript、加速 CI、修 flaky tests、降低误报权限提示、优化 Claude Agent SDK 启动时间、以及批量删除上万行代码等案例。质疑者则认为这些多半是机械重构,本来就适合 agent,未必足以证明“动态工作流”本身有多新。

[来源1] [来源2] [来源3] [来源4] [来源5]

复用、共享与跨产品落地

不少问题集中在怎么把这套能力真正用起来,而不只是看演示。有人关心 workflow 能不能复用、能不能在团队间共享、是否会提供作者和分享文档,以及能不能让不同成员保持一致的质量。也有人追问它是用什么语言写、跑在本地还是云端,得到的答案是 JavaScript,而且可本地或云端运行;Anthropic 还表示功能会尽量落到 Claude Agent SDK(Anthropic 的 agent 开发层)里,供 CLI、Desktop、VSCode 和 cloud 共享。还有评论希望它别锁死在 Anthropic 模型上,最好能把部分步骤交给本地模型或其他 LLM。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9]

并非全新:和现有方案撞车

一些人觉得这和已有的 sub-agents 或多 agent orchestration 差别不大,只是把更多 agent、分阶段流程和更长运行时间包装成了新功能。有人直接概括说,主要区别就是能并行更多 agent,再加上半结构化的分步执行。也有人注意到 Cloudflare(云服务公司)刚发布了同名 Dynamic Workflows,质疑 Anthropic 为什么也用这个名字。更有评论觉得,这类流程在 Claude 和 OpenAI 里早就能手工拼出来,像是 /ultrathink 时代的回潮。

[来源1] [来源2] [来源3] [来源4]

📚 术语解释

dynamic workflows: 把任务拆成多步、可分叉、可回环的 agent 编排方式,强调并行、复核和迭代。

tokenmaxxing: 一种带讽刺意味的说法,指刻意让系统消耗更多 token 的做法。

ground truth: 用于校验结果的外部真实标准,通常指 test suite、spec 或实际可运行行为,而不是模型自己的共识。

Claude Agent SDK: Anthropic 的 agent 开发层,供 Claude Code 的 CLI、Desktop、VSCode 和 cloud 等产品共享能力。

WASM: WebAssembly,一种可在浏览器或接近原生环境中运行的低级字节码格式。