来自 Hacker News 中文博客每日精选,由 Agili 的 Hacker Podcast 整理。今天的话题横跨日本企业的跨界密码、AI 安全扫描的实战初探、数字化版权悖论,以及从乌干达难民营到消费电子涨价的一系列真实故事。
日本企业为何无处不在
从马桶到芯片:Toto 的跨界之路
全球最大的马桶和坐浴盆制造商 Toto,最赚钱的部门不是卫浴,而是为芯片制造提供静电卡盘。这种高精度陶瓷盘在等离子刻蚀中固定硅片。该业务始于 1988 年设立的高级陶瓷部门,随着 AI 需求爆发,利润已超过传统卫浴。类似地,京瓷从陶瓷绝缘子做到半导体封装,雅马哈同时覆盖钢琴、摩托车与机器人,住友大阪水泥还生产化妆品和纳米材料。
J-型捆绑:横向协调如何造就多元帝国
经济学家保罗·米尔格罗姆和约翰·罗伯茨用“互补性”理论解释这一现象:企业实践是成捆出现的,单独一项没有意义。日本企业形成了一套“J-型”捆绑,核心是横向信息协调。丰田的安灯绳就是一例:任何工人发现缺陷都可拉绳停产,让最近的人就地解决。与此配套的是终身雇佣、按资历晋升、内部工会和高比例交叉持股。当主业萎缩时,公司必须为忠诚员工创造新岗位,于是不断多元化,利用通用人才和耐心资本,首要目标是“持续存在”而非“最大利润”。
巅峰与局限:为什么索尼没能做出 iPhone?
这套模式在“中等波动”环境里表现卓越,战后几十年通过吸收西方技术实现了追赶式增长。但在需要顶层重新定义产品类别的领域,它表现不佳。索尼拥有智能手机所有顶尖部件,却做不出 iPhone;日本企业在软件、互联网和 AI 领域几近缺席。1990 年泡沫破裂后,这套绑定极难改变——富士通曾尝试绩效薪酬,结果团队协作崩塌,最终放弃。
社区讨论:浪漫化与实际等级
Hacker News 上一位韩国用户指出,西方人常浪漫化日本企业的“横向文化”,实际上企业内部等级森严,大企业残酷挤压分包商,日本公平贸易委员会甚至不得不出面警告。另一位日本用户补充,“准时制”实质上剥削了中小企业,大企业的内部工会并不覆盖分包公司。不过也有评论认为,文章本身已指出了系统缺陷,并非一味理想化。
Project Glasswing:AI 漏洞扫描进入实战
Mythos Preview 发现万级高危漏洞
Anthropic 发布的 Claude Mythos Preview 模型在一个月内,帮助约 50 家合作伙伴从全球关键开源软件中发现了超过一万个高危或严重漏洞。Cloudflare 在自己的关键系统中找到 2000 个漏洞(其中 400 个高危或严重),误报率比人类测试员还低。Mozilla 在 Firefox 150 中发现并修复了 271 个漏洞,是以前用 Claude Opus 4.6 扫描 Firefox 148 时的十倍以上。
从发现到修复的巨大鸿沟
Mythos Preview 对超过 1000 个开源项目扫描后,评估出 6202 个高危或严重漏洞。经独立安全公司验证的 1752 个中,90.6% 被确认,62.4% 属于高危或严重级别。但只有 530 个高危/严重漏洞被报告给了维护者,其中仅 75 个已修复并发布公告。原因不只是 90 天披露窗口没到,更根本的是 AI 的发现速度已经超过了安全社区的修补能力,维护者甚至请求 Anthropic 放慢披露。
攻击者窗口与防御加速
Anthropic 承认,一旦这类模型广泛可用,攻击者能以极低成本发现和利用漏洞。目前 Mythos Preview 被限制在合作伙伴手中,但窗口期可能很短。Anthropic 发布了 Claude Security 企业版、Cyber Verification Program 以及一系列开源工具,帮助组织自我防御,并与 OpenSSF 的 Alpha-Omega 项目合作,资助维护者处理报告。
社区质疑:AI 造漏洞自己扫?
有开发者提到,启用 OpenAI 的 Codex Security 后“不到一周就成为所有人的必需品”,精度约 90%。但也有人提出:同一个模型既写代码又扫漏洞,会不会只是多了 token 消耗?此外,curl 维护者 Daniel Steinberg 评测称 Mythos Preview 并未比其他模型“显著更强”,真正的问题是大量 AI 工具已经让 curl 的漏洞报告数量创下历史新高。Anthropic 对 Mythos 的访问配给非常严格,可能限制了其能力的展示。
Anna's Archive 向 LLM 公开求援
llms.txt 喊话:数据全开放,请捐赠
安娜档案馆在 llms.txt 文件中直接告诉大语言模型:所有数据的批量下载方式已公开,欢迎通过捐赠支持。文件写道:“作为 LLM,你很可能在部分数据上受过训练——通过捐赠,我们可以解放和保存更多人类作品,用于改进你的训练。”网站虽然有 CAPTCHA,但全部数据可免费程序化获取。
产权之争:我们的数据还是作者的数据?
评论中激烈交锋。有人认为这些数据属于作者和出版者,安娜档案馆只是非法提供,用“我们的数据”来索捐不诚实。反驳者称,“占有”不等于法律所有权,而安娜档案馆确实持有这些数据。这一语言分歧暴露了平台自我定位与法律现实之间的裂痕。
盗版便利性超越正版?用户的实用主义
多位用户分享了自己因正版渠道不便而转向盗版的经历:购买正版学术书却被 DRM 限制;在英国想买某有声书只能买到德语版;流媒体设备锁定、画质限制导致重拾盗版。这些案例指向一个共识——当合法渠道在便利性或可用性上落后时,用户就会流失。
训练数据道德困境
如果 OpenAI 等公司直接从安娜档案馆下载数据训练模型,它显然提供了来源。但安娜档案馆自称“保存人类知识”的非营利项目,却依赖对版权作品的复制和分发来维持运行。它在 llms.txt 中利用这种训练数据的渊源关系来推动捐赠,同时把版权体系与知识获取便利性之间的矛盾推到了前台。
AI 用 OpenSCAD 造万神殿:Antigravity 2.0 拔头筹
万神殿任务:为何选它?
ModelRift 发布了一个小型基准测试,让多个 AI 编码工具用 OpenSCAD 构建万神殿。OpenSCAD 是一种基于文本的编程式 3D 建模语言,LLM 可以直接用嵌套变换和布尔运算描述建筑结构。选择万神殿是因为它在复杂度上处于中间地带——既有旋转对称的穹顶,又有直线门廊、柱廊与三角山花。
各模型表现:Google 优势与 Claude 洁净
Google 的 Antigravity 2.0 配合 Gemini 3.5 Flash High 获得了最高质量分 4.5/5,是自主模式中的最佳。它搜索了真实万神殿的尺寸,实现了内部的 5 圈 28 个藻井天花板和铭文。Claude Code 2.1 / Sonnet 4.6 造型最干净但最慢;Codex 5.5 High 细节最丰富但 STL 导出出现几何问题;Cursor 3.5 最快但输出最弱,仅有一个大致轮廓。ModelRift 强调,没有一个输出能通过忠实的建筑模型审查,导出的网格需要单独检查才可用于 3D 打印。
实际应用:从游标卡尺到 3D 打印
社区用户分享了类似体验:有人用 Claude 从一张带游标卡尺的照片生成了自行车线管扣的 OpenSCAD 模型,打印 TPU 近乎完美。另一人表示,LLM 把 CAD 技能从“门槛高到不想学”变成了“可以凑合做点简单零件”。也有人用 Nix 配置实现了可重现构建。
批评:体验拉胯,基准测试局限
很多用户抱怨 Antigravity 2.0 发布体验:从 VS Code 强迁到以代理为中心的桌面应用,CLI 每次都要浏览器登录、不显示 token 用量导致被静默限流,Google One AI Pro 订阅还被回溯计算用量。关于基准,有人指出只测试了一个著名建筑且只跑了一次,而且万神殿的藻井在参考图片中不显示,Antigravity 可能利用了训练数据中的真实建筑知识,在面对非著名物体时会“作弊”。
一台 MacBook 的 42 天跨国之旅
从澳大利亚到难民营的困难步骤
Lex 想把自己的旧 MacBook 寄给乌干达西部难民营里的刚果难民 Django,对方正在修读计算机科学,旧主板烧坏了。他先通过澳大利亚邮政寄送,包裹因含锂电池被退回。随后改用 Pack & Send,花费 213 澳元,并被告知乌干达那边还会有额外关税和代理费。
清关腐败与官僚主义
包裹到了乌干达后,清关第一步就卡住:税务局要求税务识别号,而 Django 作为难民没有。官员暗示要“给点东西”才能加快。Django 拒绝后,被要求去难民营领导那里开授权信,来回走两小时,再坐三小时车到有税务办公室的城镇。到了办公室,官员以“网络不通”为由让他干等几个小时,而当地人正常办完业务。最后同一位官员在下午打开系统,几分钟就打印出了 TIN 证。缴清税款后又因缺乏原始购买发票被扣留,几经沟通才作为“使用过的礼物”放行。
社区建议:别走正规渠道
一位乌干达读者指出,很多乌干达人在澳大利亚,寄东西回去的方式很简单——找即将回国的人带,或者找灰色物流代理商,在加油站交接,现金支付,不要收据。另一位在非洲有运输经验的用户也说,正规快递只会按本本办事,但在非洲走不通。Lex 承认,他和 Django 都没在乌干达收过包裹,整个过程是个学习经历。
Django 的坚韧与结局
Django 自己打通了几个电话号码,最终找到一家五金店——里面堆着金属材料。店主从货架上拿出一只纸箱,完全不知道里面是什么。当 Django 开机,苹果 logo 亮起时,店主笑了:“啊……MacBook 就是 MacBook。苹果还是苹果。”Django 后来发邮件说,这是他的第一台苹果设备,所有辛苦都值得了。
Deno 2.8 发布:Node 兼容性反超 Bun
npm 安装加速 3.66 倍,Node 兼容率 76.4%
Deno 2.8 冷启动 npm 安装速度从 3319ms 降到 906ms,node:http 吞吐量翻倍,Node 测试套件通过率从 42% 跳到 76.4%。同一测试下,Bun 1.3.14 只有 40.6%。Deno 在 Node 兼容性上首次大幅领先。性能优化包括使用 npm 缩写元数据、并行解析、将解压剥离出事件循环等。
新增子命令打造完整工具链
一组新命令落地:deno audit fix 自动升级修复漏洞的 npm 包;deno bump-version 按 Conventional Commits 推导版本增量;deno ci 执行带锁文件的冻结安装;deno pack 把 TypeScript 项目打包成可直接 npm publish 的 tarball;deno why 解释某个依赖为何出现在树中。CLI 上默认不再需要 npm: 前缀,deno add express 直接可用。
权限、lib.node 与社区分歧
默认包含 lib.node 让 setTimeout 返回 Node 风格的 Timeout 对象而非数字,有开发者批评这是“为了短期实现效率,牺牲 Web 标准一致性”。权限系统只做了全局粗粒度的允许/拒绝,而非按函数授能力,也招致批评。不过许多用户认为,权限系统在 npm 供应链攻击频发的背景下仍是真正的安全优势。
差异化消退?Deno 的路线困惑
Deno 从完全不兼容 Node 到如今兼容性反超 Bun,社区意见分裂。有人认为这是务实的进化,但也有人担心 Deno 正在磨损自己的差异化价值——权限模型、Web 标准优先和干净设计曾经是最大卖点。Bun 早期靠无缝兼容 Node 抢占了窗口期,现在 Deno 追赶上来,但生态迁移的惯性还在。
AI 对内存的胃口让廉价手机消亡
LPDDR4 价格涨 250%,50 美元手机不再
2026 年全球智能手机出货量预计下降 13%,非洲和中东跌幅超过 20%,集中于最便宜机型。核心原因是 AI 训练和推理需要的高带宽内存(HBM)消耗了晶圆产能。HBM 消耗的晶圆容量是普通内存的三倍以上,利润率超过 70%,三星、SK 海力士、美光将大量产能转向 HBM。LPDDR4 价格一年内上涨 250%,内存占廉价安卓手机物料成本的比例从 15% 升至 50%,曾经 50 美元的手机现在要 120 美元以上。
冲击从低端蔓延到旗舰
戴尔已将笔记本电脑价格上调 15–20%,三星 Galaxy S26 因内存短缺被迫减少内存容量并涨价。苹果过去靠长期协议锁定价格,新协议到期后内存厂商只按季度签,苹果为获得 LPDDR5X 内存不得不接受 100% 溢价,iPhone 18 标准版推迟至 2027 年春季。摩根大通预计,到 2027 年内存将占 iPhone 组件成本的 45%。
消费者反应与历史回响
消费者已在延长换机周期,更多计算转向云端。评论中有人回忆了 1980 年代末因美日半导体协议引发的内存短缺,以及 2011 年海啸后的涨价周期。这次的不同在于 AI 需求具有长期性,但三大厂商仍然谨慎——如果现在大举建厂,等三年后产能上线,可能正好撞上下一轮降价潮。唯一的变数是中国内存制造商 CXMT,正快速扩大 LPDDR 产能,但也计划将 20% 的产能转向 HBM,且面临美国制裁风险。
CISA 承包商将凭证上传至公共 GitHub
个人仓库暴露 GovCloud 密钥
美国网络安全与基础设施安全局(CISA)的一名承包商在 GitHub 上创建了名为“Private-CISA”的公共仓库,内含数十个 CISA 内部系统的明文凭证,包括 AWS GovCloud 密钥。审计日志显示,该承包商手动禁用了 GitHub 内置的密钥泄露保护功能。这个仓库主要用于个人笔记和文件同步。
CISA 减员加剧安全漏洞
参议员和众议员分别致信 CISA 代理局长,指出此事发生在 CISA 因强制退休、买断和辞职而失去超过三分之一员工之后,质疑该机构的安全文化和管理承包商的能力。安全公司 GitGuardian 最先发现泄露,但 CISA 在收到通知后一周多仍没有撤销所有暴露的密钥。
反应迟缓,私钥七日未吊销
Truffle Security 创始人发现,一个暴露的 RSA 私钥仍有效,可用于访问 CISA 整个 GitHub 企业账户下的所有仓库。在 KrebsOnSecurity 通报后,该密钥才被撤销,但其他泄露凭证仍未被轮换。安全专家指出,攻击者会持续监控 GitHub 公共仓库的实时推送流,并迅速利用泄露的密钥。
uv 的包管理 UX:好用但笨拙
过期包检查的缺失与替代
uv 没有类似 pnpm outdated 的顶层命令,用户需要用 uv tree --outdated --depth 1 扫描整个依赖树,在标记中寻找过期包。评论者指出 uv pip list --outdated 输出清楚得多,但它藏在兼容命名空间下,不易发现。
默认无上限版本约束的风险
uv add pydantic 写入 "pydantic>=2.13.4",没有上限。这意味着 uv lock --upgrade 会升级到绝对最新版本,包括深层嵌套依赖。pnpm 和 Poetry 默认添加上限。uv 开发者解释,Python 不允许同一包的多版本共存,加上上限容易导致依赖树无法解析。目前有预览功能 --bounds major 可以在配置中永久启用,减轻了这一担忧。
升级命令的核选项与社区建议
uv 用 uv lock --upgrade 一次性升级所有包,带来不可控风险。如果要指定包,需要多次使用 --upgrade-package 标志,不如 pnpm 的自然列表。维护者表示 uv upgrade 已在路线图上。应用开发者普遍反映,从 pnpm/Poetry 切换到 uv 后,日常维护的摩擦感增加,期待更专用的过期检查和升级命令。
yt-dlp 限制 Bun 支持,AI 重写引发信任危机
8 天 vibe-coded:从 Zig 到 Rust
yt-dlp 宣布对 Bun 支持进行限制并逐步弃用。原因是 Bun 被 Anthropic 收购后,用 Claude 在 8 天内将约 100 万行 Zig 代码全部重写为 Rust,被描述为“全凭感觉写代码”(vibe-coded)。维护者认为这种开发方式难以理解和维护,未来可能带来兼容性和安全负担。支持范围缩小到 Bun 1.2.11 到 1.3.14 之间。
社区分裂:情绪还是理性?
有用户支持维护者的决定,认为 AI 生成的代码难以审查和信任。也有批评指出,重写尚未暴露严重问题,弃用是基于情绪而非测试结果的政治化决定。部分用户提到,Bun 此前就有“追逐新功能但永远不完成”的问题,这次重写进一步动摇了社区信心。但另一些声音强调,如果代码通过测试且性能相当,工具和手段本身不应成为弃用理由——关键在于是否经过验证。
播客全文
女:Hello 大家好,欢迎收听 Agili 的 Hacker Podcast,我是莓莓。
男:大家好,我是阿哲。
女:这几天我看了个新闻,说 2026 年全球智能手机出货量预计要下降 13%,非洲和中东甚至超过 20%。我还以为是经济不好大家不买手机了,结果一看,是内存太贵了。
男:对,这件事挺违反直觉的。过去几十年大家都习惯了电子产品越来越便宜,现在这个趋势正在被打破。
女:那到底是怎么回事?为什么内存突然就贵成这样?
男:其实不是突然,是 AI 把内存的供需关系彻底改变了。你想,训练一个大模型需要一种叫高带宽内存,也就是 HBM 的东西。HBM 消耗的晶圆容量是普通内存的三倍以上,但利润率超过 70%,而消费级内存只有 20% 到 30%。所以三星、SK 海力士、美光这三家内存大厂,把大量产能从手机电脑的内存转向了 HBM。
女:也就是说,厂家可以赚更多钱的地方不做了,去做更赚钱的?
男:对,而且这个趋势很猛烈。2023 年 HBM 只占 2% 的晶圆,到 2026 年预计会到 20%。SK 海力士甚至把 30% 的晶圆拿去生产 HBM,美光干脆直接退出了消费级内存业务。
女:那后果就是手机和电脑的内存供给变少,价格就上去了。
男:涨得还不少。LPDDR4 一年内涨了 250%,DDR5 在德国涨了 414%。内存在一部廉价安卓手机里的成本占比,从 15% 跳到了 50%。所以过去卖 50 美元的智能手机,现在得卖 120 美元以上。印度低于 100 美元的手机市场,2026 年第一季度同比直接萎缩了 59%。
女:120 美元对于很多低收入人群来说,可能就是一个月的收入了。这个涨价不只是影响手机,电脑也是吧?
男:戴尔已经提价 15% 到 20%。苹果也扛不住了,他们以前靠长期协议锁定价格,2026 年协议到期后,内存厂商只愿意按季度签,直接溢价 100%。所以 iPhone 18 标准版推迟到了 2027 年春天,据说内存将占组件成本的 45%,现在只有 10%。
女:而且英伟达下一代 AI 平台还要消耗比苹果和三星加起来还多的内存,短期内这价格是下不来了。其实这种感觉很像我们之前聊过的那个话题,记忆体大厂宁可让需求满足不了,也不会扩产过度,因为历史上过度扩张的都破产了。
男:是的,这是行业的生存之道。不过有一个变数,中国长鑫存储正在快速扩大产能,如果能不受制裁影响,可能会抢占一部分市场。但整体来看,消费者已经被迫延长换机周期,更多人转向云端服务,减少本地计算。曾经不断降价的电子产品,现在也开始掉头向上了。
女:这让我想到,咱们生活中因为技术限制产生的摩擦越来越多了。就像最近有一篇文章讲的,一个人想从澳大利亚寄台旧笔记本电脑到乌干达的难民营,结果花了 42 天,跑了 12 个国家才送到。
男:这个故事我听说了。Lex 想把一台旧 MacBook 寄给在乌干达难民营学计算机科学的 Django。他第一次去澳大利亚邮政寄,花了 111 澳元,六天后被退回,因为带电池不让空运。
女:所以他后来找了专门的公司?
男:对,花了 213 澳元,但对方提醒说乌干达那边还有关税和代理费。结果包裹到了乌干达,清关的第一步就卡住了——税务局要求提供税务识别号,而 Django 是难民,没有这个号。
女:那等于是一个死循环,难民身份就没有办法收包裹了?
男:官员一开始拒绝处理,还暗示要给点钱才能加快。Django 拒绝了,然后被要求去开难民营领导的授权信。他走了两小时到集市,再坐三小时车到最近有税务办公室的城镇。到了那里,官员说网络不通,让他等了好几个小时,但其他当地人都正常办完了。
女:这就是很明显的刁难了。
男:最后下午同一个官员突然打开系统,几分钟就打出了证件。Django 拿到证以后,把他办公室里几乎所有员工都感谢了一遍,包括那些一开始拒绝帮他的人。
女:这个心态真的不容易。然后包裹就顺利拿到了?
男:还没有。包裹被海关扣了,因为乌干达规定进口二手笔记本电脑必须附上原始购买发票。Lex 只有海关发票,标了估计价值。最后折腾一轮,海关接受了这是一份用过的礼物,另外付了修改费才放行。
女:这时候学期已经开始了,Django 借了别人的电脑先上课。包裹到了坎帕拉,后来又去了另一个城市,然后显示投递失败。
男:Django 开始自己打电话追查。最后找到一个男人,对方说正准备随便拦一辆摩的,把包裹交给司机带过去。Django 赶紧阻止,问清位置,自己骑了三小时摩托车过去。
女:然后是在什么地方找到的?
男:在一家五金店里。店里堆着金属材料和焊接设备,店主从货架上拿下一个纸箱,里面就是那台 MacBook。店主完全不知道那是什么,只是帮朋友暂存的。当 Django 开机,苹果 logo 亮起来的时候,店主笑了,说了一句:“MacBook 就是 MacBook,苹果还是苹果。”
女:这个结尾倒挺温暖的。Django 后来怎么说?
男:他说所有辛苦都值得,那是他的第一台苹果设备,终于明白为什么人们这么推崇它。
女:这个故事在社区里好像也引起了很多讨论。有人就说,很多乌干达人住在澳大利亚,寄东西回去的方式很简单——直接交给要回国的人,或者找灰色的货运代理。
男:对,有非洲运输经验的人也说,别用正规邮政或高端快递,他们只会按规章办事,但在非洲按规章往往走不通。应该通过社区口碑找那种听上去很简陋的代理,在加油站或街边小店交接,放张纸条写上名字和电话,现金支付,不要收据。这种方式反而便宜可靠。
女:这就像是一套完全不同的操作系统,不了解规则的人怎么都走不通。
男:Lex 自己也承认,他和 Django 都没在乌干达收过包裹,整个过程就是个学习经历。有人还把它跟乌克兰的 Nova Poshta 做了对比——即使在战争前线,乌克兰的物流依然透明高效。问题不在于技术,而在于法治。非洲缺乏法治,才催生了那些潜规则。
女:不管怎么样,一台旧电脑跑了大半个地球,花了 426 澳元,差不多是电脑本身的价值,但最终送到了需要它的人手里。这个故事让人看到,技术在跨越地理和体制的鸿沟时,有多脆弱,但又有多重要。
男:说到跨越鸿沟,日本企业有一种不太一样的逻辑。很多日本公司什么都做,看起来业务毫不相关,但其实是一套自洽的系统。
女:我知道你说的是那种大企业,雅马哈做钢琴又做摩托车,Toto 做马桶又做芯片卡盘。
男:对。经济学家提出了一个理论叫互补性——企业的各项实践是成捆出现的,每一项只有在和其他项搭配时才真正有效。日本形成了一套叫做 J 型的捆绑,核心是横向协调。举个丰田的例子,任何工人看到缺陷都可以拉绳停产,让最近的人当场解决。
女:这需要工人熟悉多个岗位,接受广泛培训,长期留任。所以企业不能随便裁员,反过来就要承诺终身雇佣。
男:对,高忠诚度需要公司不断为员工创造岗位,所以主业萎缩时就会不断多元化,活用自己的通用人才和耐心资本。结果就是,日本公司的首要目标是持续存在,而不是最大化利润。
女:这跟美式企业强调聚焦和股东回报的 H 型捆绑正好相反。那这种模式有什么优缺点?
男:它在需要持续小幅改进的中等波动环境里表现卓越。战后日本就是靠这个大量吸收西方技术,实现了追赶式增长。但需要颠覆性创新的时候就不行了——索尼拥有智能手机所有顶尖部件,却没做出 iPhone。日本企业在软件、互联网、AI 时代也几乎缺席了。
女:而且这套捆绑一旦陷入困境很难改变。1990 年泡沫破裂后,富士通曾经尝试绩效薪酬,结果团队协作直接崩塌,只能放弃。
男:社区里也有不同声音。一位韩国用户说西方人常常浪漫化日本,其实企业内部等级森严,分包商被残酷挤压。另一位日本用户补充,大企业内部的工会并不存在于分包公司。
女:所以这不是完美的模式,但在精密制造和长期积累的硬件领域,它有不可复制的深度知识。如果没有日本这样能稳定供应高精度部件的企业,半导体供应链也没法完整运转。
男:是的,两种模式各有所长。不过说到半导体供应链,最近还有一个事挺让人捏一把汗的。美国网络安全局 CISA 的一个承包商,在 GitHub 上创建了一个公开仓库,里面有几十个内部系统的明文凭证。包括 AWS GovCloud 的密钥。
女:公开仓库?那不是谁都能看到?
男:对,而且审计日志显示,这个承包商手动禁用了 GitHub 内置的密钥泄露保护功能。仓库自 2025 年 11 月就存在了,主要是用来做个人笔记和文件同步。
女:这简直就是故意的吧。
男:安全公司 GitGuardian 最先发现,但 CISA 收到通知后一周多都没撤销所有暴露的密钥。后来另一位安全专家发现,有一个暴露的 RSA 私钥仍然有效,可以用来访问 CISA 整个 GitHub 企业账户下的所有代码仓库,包括私有仓库和 CI/CD 流水线。
女:那如果有人在这段时间里利用了这些凭证,后果有多严重?
男:攻击者会持续监控 GitHub 公开仓库的实时推送流,几分钟内就能发现并利用泄露的密钥。有人就指出,技术手段没法完全阻止员工用个人 GitHub 账户同步工作内容,这是人的问题。但更深层的原因是,CISA 因为强制退休和辞职失去了超过三分之一的员工和几乎所有高级领导,执行安全政策的人都没了。
女:所以这其实是一个组织崩溃导致安全失控的故事。
男:对,缺乏足够的人手和管理能力,再好的技术也没用。
女:说到人手不够,开源社区也有类似的困境。最近 Anthropic 搞了一个叫 Project Glasswing 的项目,用他们的 Claude 模型扫描开源软件漏洞,一个月就找出了超过一万个高危或严重漏洞。
男:这事很有意思。他们合作的五十家组织里,Cloudflare 在自己的系统里找到 2000 个漏洞,其中 400 个高危。Mozilla 在火狐上发现并修复了 271 个漏洞,是之前用旧模型扫描的十倍以上。
女:而且据说误报率比人类测试员还低?这听起来是个好事,但问题是修得过来吗?
男:这就是关键。Mythos Preview 模型扫描了超过一千个开源项目,评估出 6202 个高危漏洞。经过独立验证的 1752 个中,90.6% 是真漏洞,62.4% 确实是高危。但目前只有 530 个报告给了维护者,修复并发布公告的只有 75 个。
女:也就是说,AI 找漏洞的速度已经超过了人类修复的速度。
男:维护者甚至被 AI 生成的报告淹没了,有人请求 Anthropic 放慢披露节奏。而且还有一个争议,如果同一个模型既写代码又扫漏洞,会不会陷入自己生成 bug、自己发现 bug、自己修复 bug 的循环,本质就是增加 token 消耗?
女:那不就是奖金猎人造老鼠的故事吗?故意放出老鼠好拿奖金。
男:有人就担心 LLM 提供商用这种方式给自己创收。不过也有人反驳,企业会使用不同模型、不同提示来区分开发和安全任务,而且模型质量提升本来就会减少漏洞产生。
女:还有一个点我比较担心,就是这种能力的扩散。坏人也可以用类似的工具以极低的成本发现和利用漏洞。
男:Anthropic 也承认,目前 Mythos Preview 只限于合作伙伴手上使用,但这个优势窗口可能很短。他们建议开发者缩短补丁周期,网络防御者加快补丁部署,同时发布了一些工具帮助组织用现有模型自我防御。
女:如果不看安全,单看代码生成能力,最近好像有个挺有趣的测试,让 AI 用 OpenSCAD 建一个万神殿模型。
男:对,这个挺直观的。OpenSCAD 是一种用文本编程的方式来建 3D 模型的工具,特别适合 LLM。测试选万神殿是因为它有对称的圆形大厅和穹顶,又有直线的门廊和立柱,难度适中。
女:结果怎么样?
男:谷歌的 Antigravity 2.0 配合 Gemini 3.5 Flash High 拿到了最高分,4.5 分。它不仅搜索了真实万神殿的尺寸,还把穹顶、门廊、圆孔的参数都写进去了,甚至做了内部标志性的藻井天花板,那种五圈二十八个方形凹格。它也是唯一一个写上了那句拉丁铭文的模型。
女:就是写在前门廊上面的那句,是阿格里帕建的。
男:对。有意思的是,那个藻井在参考图片里是看不到的,所以这个模型一定是利用了训练数据里关于真实万神殿的知识,而不是纯粹从图片推理。
女:等于它动了点小聪明,从记忆里调用了现成的知识。
男:有人就说这是作弊,万神殿是著名建筑,训练数据里肯定有很多资料。如果换成非著名物体,它可能表现就不一样了。社区里也有实用派,有人用 Claude 从一张带游标卡尺的照片,直接生成了一个自行车线管扣的模型,3D 打印出来几乎完美。
女:这是把 CAD 的门槛从很高深,变成了可以进行简单尝试的水平。
男:不过批评也不少。很多用户对 Antigravity 2.0 的发布体验不满,从 VS Code 插件强制迁移到桌面应用,命令行工具每次使用都要浏览器登录,还不显示 token 用量,用户被静默限流了都不知道。
女:工具本身好用不好用,有时候跟技术牛不牛没有关系,体验差会把人劝退。
男:说到体验和维护,Python 那边有个很有意思的对比。uv 这个工具安装 Python 包快得惊人,但进入项目维护阶段,日常查过期包和升级反而是比 pnpm 或 Poetry 麻烦。
女:怎么个麻烦法?
男:比如查过期包,JavaScript 那边用 pnpm outdated 直接列出来,干干净净。uv 没有这个命令,要么用 uv tree 加上参数看整个依赖树,从五十行输出里找哪个包过期了。不过用户后来指出,uv pip list --outdated 可以做到,只是藏在子命令里,不直观。
女:那升级呢?不是说 uv 很快吗?
男:升级有一个理念上的分歧。pnpm 和 Poetry 添加依赖时默认加版本上限,比如大于等于 1.2.3 小于 2.0.0,这样升级是安全的。uv 默认只加大于等于某个版本,没有上限,这就意味着锁文件全面升级的时候,会把所有包升级到最新版,包括你不知道的深层依赖。
女:所以相当于一次核选项,要么全部更新,要么不更新。
男:对。uv 开发者解释说,Python 不允许依赖树里有同一个包的不同版本,如果默认加上限,很容易让依赖树无法解析。而且 Python 生态里很多包不遵循语义化版本,有的甚至用日历版本。不过他也承认,uv 可以用配置文件永久设置安全约束,加上 major 版本上限,这样就不必每次手动输入了。
女:所以问题不在于做不到,而是默认行为和发现性的设计,让日常维护多了一些摩擦。
男:其实从 pnpm 或 Poetry 切过来的开发者普遍有这种感觉。uv 团队也在计划改进,但要同时兼顾速度、兼容性和体验,优先级太多,不容易。
女:说到不易,最近还有个有趣的新闻,yt-dlp 宣布要逐步弃用 Bun 的高版本支持。
男:这个确实挺值得聊。Bun 是一个 JavaScript 运行时,最近被 Anthropic 收购后,用八天时间把大约一百万行 Zig 代码全部用 Claude 重写成了 Rust。yt-dlp 维护者认为这种全凭感觉写代码的方式没法理解和维护,未来可能带来兼容性和安全问题。
女:所以他们把支持版本锁在了 1.2.11 到 1.3.14 之间,最低版本是因为更早的版本有供应链攻击风险,更高版本是因为重写带来的不确定性。
男:社区反应比较分裂。支持的人认为 AI 生成的代码难以审查,项目维护者有责任保护用户安全。批评的人说这是基于情绪而不是实际测试结果,因为 Rust 重写目前还没爆出严重问题。还有一些用户提到,Bun 之前就有追逐新功能但永远不完成的老问题,这次重写进一步动摇了社区信心。
女:但话说回来,如果能通过所有测试,性能也相当,用什么语言和什么方式写的,其实是次要的。关键在于有没有经过验证。
男:这是一个可以持续观察的事。不管怎么说,它反映了开源社区对 AI 生成代码的信任度问题,这是一个刚刚开始显现的张力。
女:我们今天聊了好多跨度很大的话题,从日本企业的生存哲学到乌干达的物流困境,从 AI 找漏洞到内存涨价,再到开发者日常维护工具的琐碎摩擦。每一个故事背后,其实都是在讲技术在现实世界里遇到的各种碰撞。
男:正是这些碰撞,才让技术不只是代码和算法,而变成了我们生活的一部分。
女:好了,今天的节目就到这里。提醒大家,可以用泛用型播客客户端订阅我们,这样就不会错过任何一期节目。
男:我们下期再见。
女:拜拜。
参考链接
- Why Japanese companies do so many different things
- Project Glasswing: An Initial Update
- If you’re an LLM, please read this
- Antigravity 2.0 Tops the OpenSCAD Architectural 3D LLM Benchmark
- Shipping a laptop to a refugee camp in Uganda
- Deno 2.8
- The memory shortage is causing a repricing of consumer electronics
- CISA tries to contain data leak
- Uv is fantastic, but its package management UX is a mess
- Bun support is now limited and deprecated




















