惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Microsoft Security Blog
Microsoft Security Blog
T
The Exploit Database - CXSecurity.com
MyScale Blog
MyScale Blog
D
Docker
GbyAI
GbyAI
MongoDB | Blog
MongoDB | Blog
Y
Y Combinator Blog
C
Check Point Blog
The GitHub Blog
The GitHub Blog
云风的 BLOG
云风的 BLOG
Vercel News
Vercel News
Engineering at Meta
Engineering at Meta
月光博客
月光博客
Microsoft Azure Blog
Microsoft Azure Blog
Google DeepMind News
Google DeepMind News
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
Hugging Face - Blog
Hugging Face - Blog
Scott Helme
Scott Helme
C
Cybersecurity and Infrastructure Security Agency CISA
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
Security Archives - TechRepublic
Security Archives - TechRepublic
I
Intezer
P
Proofpoint News Feed
D
Darknet – Hacking Tools, Hacker News & Cyber Security
Simon Willison's Weblog
Simon Willison's Weblog
阮一峰的网络日志
阮一峰的网络日志
Project Zero
Project Zero
人人都是产品经理
人人都是产品经理
A
About on SuperTechFans
AWS News Blog
AWS News Blog
T
Tor Project blog
Know Your Adversary
Know Your Adversary
B
Blog
美团技术团队
A
Arctic Wolf
IT之家
IT之家
G
GRAHAM CLULEY
P
Privacy International News Feed
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
Martin Fowler
Martin Fowler
酷 壳 – CoolShell
酷 壳 – CoolShell
C
Cisco Blogs
博客园 - 【当耐特】
V
Visual Studio Blog
T
Threat Research - Cisco Blogs
L
LINUX DO - 热门话题
H
Hacker News: Front Page
PCI Perspectives
PCI Perspectives
Jina AI
Jina AI
腾讯CDC

Agili 的 Hacker Podcast

Agili 的 Hacker Podcast 2026-06-27 Agili 的 Hacker Podcast 2026-06-26 Agili 的 Hacker Podcast 2026-06-25 Agili 的 Hacker Podcast 2026-06-24 Agili 的 Hacker Podcast 2026-06-23 Agili 的 Hacker Podcast 2026-06-22 Agili 的 Hacker Podcast 2026-06-21 Agili 的 Hacker Podcast 2026-06-20 Agili 的 Hacker Podcast 2026-06-19 Agili 的 Hacker Podcast 2026-06-18 Agili 的 Hacker Podcast 2026-06-17 Agili 的 Hacker Podcast 2026-06-16 Agili 的 Hacker Podcast 2026-06-15 Agili 的 Hacker Podcast 2026-06-14 Agili 的 Hacker Podcast 2026-06-13 Agili 的 Hacker Podcast 2026-06-12 Agili 的 Hacker Podcast 2026-06-11 Agili 的 Hacker Podcast 2026-06-10 Agili 的 Hacker Podcast 2026-06-09 Agili 的 Hacker Podcast 2026-06-08 Agili 的 Hacker Podcast 2026-06-07 Agili 的 Hacker Podcast 2026-06-06 Agili 的 Hacker Podcast 2026-06-05 Agili 的 Hacker Podcast 2026-06-04 Agili 的 Hacker Podcast 2026-06-03 Agili 的 Hacker Podcast 2026-06-02 Agili 的 Hacker Podcast 2026-06-01 Agili 的 Hacker Podcast 2026-05-31 Agili 的 Hacker Podcast 2026-05-30 Agili 的 Hacker Podcast 2026-05-29 Agili 的 Hacker Podcast 2026-05-28 Agili 的 Hacker Podcast 2026-05-27 Agili 的 Hacker Podcast 2026-05-26 Agili 的 Hacker Podcast 2026-05-25 Agili 的 Hacker Podcast 2026-05-24 Agili 的 Hacker Podcast 2026-05-23 Agili 的 Hacker Podcast 2026-05-22 Agili 的 Hacker Podcast 2026-05-21 Agili 的 Hacker Podcast 2026-05-20 Agili 的 Hacker Podcast 2026-05-19 Agili 的 Hacker Podcast 2026-05-18 Agili 的 Hacker Podcast 2026-05-17 Agili 的 Hacker Podcast 2026-05-16 Agili 的 Hacker Podcast 2026-05-15 Agili 的 Hacker Podcast 2026-05-14 Agili 的 Hacker Podcast 2026-05-13 Agili 的 Hacker Podcast 2026-05-12 Agili 的 Hacker Podcast 2026-05-11 Agili 的 Hacker Podcast 2026-05-10 Agili 的 Hacker Podcast 2026-05-09 Agili 的 Hacker Podcast 2026-05-08 Agili 的 Hacker Podcast 2026-05-07 Agili 的 Hacker Podcast 2026-05-06 Agili 的 Hacker Podcast 2026-05-05 Agili 的 Hacker Podcast 2026-05-04 Agili 的 Hacker Podcast 2026-05-03 Agili 的 Hacker Podcast 2026-05-02 Agili 的 Hacker Podcast 2026-05-01 Agili 的 Hacker Podcast 2026-04-30 Agili 的 Hacker Podcast 2026-04-29 Agili 的 Hacker Podcast 2026-04-28 Agili 的 Hacker Podcast 2026-04-27 Agili 的 Hacker Podcast 2026-04-26 Agili 的 Hacker Podcast 2026-04-25 Agili 的 Hacker Podcast 2026-04-24 Agili 的 Hacker Podcast 2026-04-23 Agili 的 Hacker Podcast 2026-04-22
Agili 的 Hacker Podcast 2026-06-28
Agili 的 Hack · 2026-06-29 · via Agili 的 Hacker Podcast

今天的话题关于选择的智慧:DNS 解析器怎么挑、大模型请求往哪里发、正则表达式该信哪个标准,甚至博客生成工具该不该用 1200 行 Bash 脚本。Agili 的 Hacker Podcast 和你一起看看这些来自技术现场的取舍。

如何选择公共 DNS 解析器

从隐私、过滤到 CDN 路由,取舍远不止快慢

evilbit.de 制作了一份交互式指南,提供三个步骤:按需求筛选(加密传输、DNSSEC 验证、IPv6、日志策略等)、本地速度对比、以及 29 个全球公共解析器的特征表。工具本身用起来像选配一辆车,每项配置背后都对应一个现实权衡。

自建递归还是信任第三方?

社区讨论中,自建派和托管派分得很开。不少人说自己跑 Unbound 或 AdGuard Home 已经十多年,所有查询都在自己机器上完成,不留日志、不经第三方过滤。但细看并不完美:直连根服务器的查询仍是明文的,ISP 看得到一切。真要加密,还得在外部托管一个 DoH/DoT 端点。一位用户说他每小时用 cron 预热 Cloudflare 前两万域名再加上自己的高频查询,既加快响应又用“噪音流量”覆盖真实访问行为。

过滤功能是双刃剑

Quad9 的主地址自动拦截恶意域名,但误报让 gist.github.com 和私有 tracker 都躺过枪;Cloudflare 的 1.1.1.2 也曾阻挡 archive.is。多数评论者倾向无过滤地址,或者用 NextDNS、Control D 这类可自定义白名单的服务。另一方面,当过滤没有误伤时,在移动设备上拦截广告 SDK 的效果又相当显著——这个取舍就变得很个人。

EDNS Client Subnet 与 CDN 的地域困局

Cloudflare 和 Quad9 默认不发送 ECS(客户端子网信息),这让 CDN 无法把用户引向就近缓存节点,看 YouTube、Google 视频时下载变慢。使用 Google Public DNS 或 ISP 提供的解析器反而能拿到正确的本地 IP。这就是隐私和性能的直接对撞,指南里已经为每个解析器标注了 ECS 状态,读者可以按需过滤。

Marfa 公共电台用无聊文件帮你入睡

枯燥到让人扛不过简介的播客

得克萨斯州 Marfa 公共电台在募捐季推出了一档睡眠播客,内容是员工用平缓语调朗读 FCC 合规条款、塔台管理条例、德州行政法典,甚至 2025 年《拨款撤销法案》。一位听众说:“我连简介都没撑过去。”这正是它要达到的效果。

在众多助眠节目中找到一个新位置

听众把它和“Boring Books for Bedtime”(有时选材太有趣)、“Sleep With Me”(主持人用漫无边际的独白打断叙事逻辑)做了比较。还有人觉得它像 Adult Swim 的“Joe Pera Talks You to Sleep”。小镇本身的魅力也成了话题:几位去过的人说,想起 Marfa 沙漠和艺术氛围就让人感到最惬意的那种困意。

用两台 Strix Halo 组建 RDMA 集群,跑超单机容量的大模型

100GbE 直连把延迟降到微秒级

这篇指南把两台 Framework Desktop 主板(AMD Ryzen AI MAX+“Strix Halo”)用 Intel E810 网卡直连,构建 RDMA 集群,让 vLLM 通过张量并行(Tensor Parallelism)推理超出 128GB 统一内存的模型。没有 RDMA 时,节点间走 TCP 延迟约 0.074 毫秒;启用 RoCE v2 后,延迟只有 5.23 微秒,下降了一个数量级。

硬件和软件的每一步都有坑

Framework 主板只提供 x4 PCIe 插槽,需要用转接卡适配 x16 网卡。作者提到一块主板的插槽被超声波刀切开以便直插,但不建议用户模仿。软件上需要 Fedora 43、rdma-core、冰和 irdma 驱动,BIOS 设 iGPU 为 512MB,并在 GRUB 里加入 iommu=pt 等内核参数。自行编译的 librccl.so 提供了 Strix Halo 所需的 gfx1151 支持,启动集群时必须打开 Eager Mode 避免 CUDA Graphs 死锁。

价格与性能的双重现实

社区一边倒认为硬件太贵:去年 128GB 迷你主机约两千欧元,如今 Framework 主板标价 7899 欧元,部分 Mini PC 也涨到四千美元。有评论说这价格不如二手 A100/V100 基板。但对于本地 AI 研究,两万人民币以内拿到 128GB 统一内存仍比 Mac Studio(512GB 版二手约三万美元)有吸引力。性能受限于内存带宽,Strix Halo 集群的预充速度远慢于同内存量的 Mac,但已经算是接近“云级”本地算力的可行路径。

Decomp Academy:在浏览器里学逆向 GameCube 游戏

从汇编到逐字节匹配的 C 代码

这个交互式平台教用户把 PowerPC 汇编反编译为与原版完全一致的 C 代码,后端用真实的 Metrowerks 编译器逐字节验证。课程从寄存器、整数运算、控制流,一路覆盖到浮点、ABI、编译器优化和 64 位整数,最后用《星际火狐 大冒险》的真实函数做实战。

AI 能做多少,人必须守住什么

有人用 Fable 把九十年代 Windows 软件转成原生 Mac 应用,效果惊人,但匹配型逆向会卡在最后 5%——简单的 if/else 和三元运算符就能难住模型。作者说这正是他决定深度学习的原因。版权方面,评论提醒 AI 生成的代码在美国法律下可能不被视为转化性使用,而纯人工逆向已有大量保护先例。

用 LXC 隔离 X11 应用,但不是绝对安全

把浏览器装进无特权容器

作者使用 LXC 创建非特权容器,通过 UID/GID 映射让容器内 root 在宿主机上对应一个不存在的用户,以此运行浏览器等高风险 X11 程序。关键步骤包括设置 idmap 声明宿主用户可使用 100000~165535 范围、挂载宿主的 X 套接字和修改过的 .Xauthority 文件、以及通过 PipeWire PulseAudio 兼容层转发音频。

每一个转发的通道都是墙上开的洞

X11 套接字一旦共享,容器内任何应用都能读取其他应用的键盘输入和窗口内容,甚至操控宿主机桌面。Firefox 自身有沙箱(RLBox),但 X11 协议本身没有细粒度权限控制。评论提到 Wayland 将窗口隔离建在协议中,而 XNamespace 是 X11Libre 项目正在做的新扩展。替代方案里,Firejail 提供了更开箱即用的配置,Xephyr 或 Xpra 可以进一步嵌套隔离,但都会增加复杂度。

罗宾·威廉姆斯给 AI 内容的回答:你读过但没活过

一场 1997 年电影独白成了当代隐喻

作者 Jay Acunzo 借《心灵捕手》里肖恩对威尔说的那段话——“你能说出西斯廷教堂的气味吗?”——来区分知识与生活。AI 读遍了互联网,但它没有站过教堂穹顶下,没有握过垂死朋友的手。而当下有太多声音在说服人们停止生活,用工具和捷径取代个人经历。

表演、同理心和自我指涉的反讽

评论点出剧本是二十岁出头的阿弗莱克和达蒙写的,他们也没经历过战争或丧偶,却能写出打动人心的独白。表演又借用了罗宾·威廉姆斯个人的挣扎与失落。这说明靠同理心和观察也可以接近真实,仅凭“没活过”否定 AI 的创作潜力可能不成立。而如果一篇捍卫人类独特性、对抗 AI slop 的文章本身经过 AI 润色,那又构成了一个奇特的循环。

真的有“到处通用”的正则表达式吗?

从 Perl 向命令行工具的妥协之旅

作者 John D. Cook 希望写出一套在 sed、awk、grep、Emacs 里都能跑的正则表达式。他的清单包括 . ^ $ * ? + | {n,m} \w \s \b 和反向引用,前提是使用 GNU 工具并给 sed/grep 加上 -E。但社区很快指出众多裂痕:Go 的 regexp 库不支持反向引用,macOS/BSD 的 sed 不认 \w\s\b,必须用 POSIX 字符类和 [[:<:]] 代替。真正完全通行的只剩下字符类和最基础的四个符号。

方言太多,文档又常不说明

很多软件文档只说支持“正则表达式”,不提具体方言。Google Sheets 和 Excel 会注明 RE2 还是 PCRE,但在配置文件里用户根本猜不到底层是什么语言。RFC 9485(I-Regexp)和 JSON Schema 推荐的子集都是试图标准化的努力,而 SNOBOL 语言里的模式匹配则被看作一条被人遗忘但更优雅的路。

奋进号航天飞机以发射姿态垂直展示

六个月的“Go for Stack”让轨道器重新站起

2024 年 1 月,加州科学中心完成奋进号的垂直堆叠,依次安装尾裙、固体火箭助推器、外部燃料箱,最后用起重机将 122 英尺的轨道器与其余部分对接。这是首次在 NASA 设施外精准复原发射构型。今后 Samuel Oschin 中心将拥有世界唯一完整、真实的航天飞机系统垂直展示,且不额外收费。

人们的记忆与误解

有人一开始误以为“20 层楼高的垂直展示”是装了一块巨屏。也有参观过全部航天飞机的观众说,现在三架分别代表发射、轨道和着陆三种状态。奋进号 2012 年穿越洛杉矶街道、经过 Wendy's 和 Randy's Donuts 的场景,被形容为城市游行;企业号通过驳船经过海滩也曾给人们带来惊喜。

纯 Bash 脚本生成博客:有人爱极简,有人怕麻烦

一个 1200 行的脚本,零依赖

Bashblog 只需一个 bb.sh 文件,执行 ./bb.sh post 就能用默认编辑器写文章,生成 HTML 页面、RSS 和标签索引。它只依赖 date、grep、sed 等基础工具,适合 128MB 内存的轻量服务器,或是只想在 SSH 进去后立刻写点东西的人。

社区撕开了极简与可维护性的分界线

支持者认为在只有厨房刀的情况下用来砍树就是本事,它不需要 Ruby/Python/Node,刚好填满想要最少工具的人的需求。批评者则指出 1200 行 Bash 在引号、空格和 BSD/GNU 差异上全是坑,不如用静态生成器在本地生成好再 rsync 上去。也有人分享自己用 find 和 pandoc 拼出来的脚本,还有回忆 NanoBlogger 的老用户。bashblog 无意取代 Hugo,它服务的场景非常具体:一个脚本、一个公共文件夹、一台能跑 shell 的机器。

Wayfinder Router:靠提示词结构决定大模型发给谁

不调用任何模型,毫秒级判决

Wayfinder Router 根据提示词的长度、标题、列表、代码等特点计算复杂度分数,把简单请求送到本地或廉价模型,复杂请求转发到云端。整个过程离线、确定性,不消耗 token,延迟不到一毫秒。它不替换客户端,只是在原有 OpenAI 兼容客户端和实际后端之间加一个判断层,改动 base_url 就行。

多轮对话与 OS 级 API 的想象

社区有人提出这种路由思路应该进操作系统:统一的 LLM API,本地不够用就自动转发云端。但多轮对话时频繁切换模型会破坏上下文的连贯性和缓存效果,反而抵消省钱效果。作者回应首几轮用强模型,后续简单任务用弱模型仍能省钱,且两个模型的缓存都会保持温度。另一些评论质疑不同模型在 agent 框架中的行为差异会导致路由失效;作者说 Wayfinder 只做难易二元判断,模型选择可以交给另一个路由器组合使用。

播客全文

女:Hello 大家好,欢迎收听 Agili 的 Hacker Podcast,我是莓莓。

男:大家好,我是阿迪。

女:今天天气不错,特别适合……睡觉。没错,我们这期节目就从睡觉开始。阿迪,你听过那种专门帮你入睡的播客吗?

男:听过,比如那种读说明书,或者念枯燥文件。不过我一般听雨声就睡着了。怎么了,有新的?

女:德克萨斯有个叫 Marfa 的小镇,那儿有个公共电台在募捐季搞了个创意:让员工用特别平缓的语调,朗读 FCC 的合规条款,塔台管理条例,甚至读了 2025 年的一份《拨款撤销法案》。这档节目就叫“Marfa Public Radio Puts You to Sleep”,目的是让听众无聊到睡着,顺便给电台筹款。

男:哈哈,把无聊变成一种公益。FCC 条款那玩意儿,念出来确实比安眠药管用。我看过他们塔台的管理文件,光是“天线高度必须低于多少米”这种话重复三遍,人就过去了。

女:听众的反应也特别逗。有人说“这个播客真的够无聊,我连简介都听不完”,还有程序员说自己整天写代码,下班就需要这种没有信息增量的背景音放松。有人甚至说,光是想起了西得克萨斯那个沙漠小镇,就已经产生了最棒的那种睡意。

男:这我信。Marfa 那个地方我去过一次,人特别友好,周围都是荒漠和艺术装置,节奏很慢,傍晚在电台后面的小院子里喝杯酒,感觉时间都凝固了。这种环境产出的助眠内容,自带氛围感。

女:不过也有人较真,在网上讨论哪种助眠机制更有效。有人喜欢这种单调人声,有人需要白噪音,还有人聊到一个叫“fastsleep.app”的网页应用,让你想象一个平静的场景,隔几秒提示一下,用来打断胡思乱想。另一个需求也挺实在——希望睡眠播客能记住你听到哪儿,半夜醒了不用亮屏幕就能继续。

男:我个人最大的困扰是耳机。有一次戴着 AirPods 听助眠音频睡着了,半夜翻身按到了播放键,突然切到重金属。现在有些播放器有“入睡时暂停媒体”的功能,这个很必要。

女:说到耳机和半夜的焦虑,你有没有想过,我们的 DNS 解析器在我们睡着的时候都在干什么?

男:你是指公共 DNS?它们确实二十四小时不停地在把你的域名请求翻译成 IP 地址。最近正好看到一份很详细的指南,教大家怎么选公共 DNS 解析器,里面列了 29 家,包括 Cloudflare、Quad9、Google 这些大厂,也有一些社区和个人运营的。

女:29 家?这个数字吓我一跳。普通人真的需要在意 DNS 服务商的区别吗?

男:要是在意隐私,就得在意。比如你输入一个网址,你的 DNS 查询在默认情况下是明文的,你的 ISP 能看到你访问了哪个网站。所以现在很多公共 DNS 支持加密传输,像 DoH 和 DoT,就是把查询过程加密。但这份指南里提到,有 25% 的 DoT 服务提供商给的 TLS 证书甚至是无效的,加密了个寂寞。

女:所以不是所有的“加密”都靠谱。那选择的时候,除了加密,还要看什么?

男:有一个特别有意思的权衡点叫 EDNS Client Subnet,简称 ECS。简单说,就是 DNS 服务商要不要把你的部分 IP 地址告诉网站的 CDN 服务器,好让人家给你分配最近的缓存节点。

女:这个很有用吧?比如看视频,如果被分到离自己近的节点,肯定更快。

男:对,这就是问题。像 Cloudflare 和 Quad9 这些注重隐私的,默认不发送 ECS,你的 IP 不会被泄露给 CDN。但代价就是,你看 YouTube 或者 Google 视频时,可能被指向一个很远的缓存服务器,下载巨慢。有用户说用 ISP 自带的 DNS 或者 Google Public DNS 就能获得本地缓存 IP,速度立刻不一样。这就是一个隐私和速度的取舍。

女:所以就是一个天平:要绝对隐私,可能就得忍受慢视频;要速度,就得牺牲一些位置信息。那如果我既不想被跟踪,又不想看视频卡顿,怎么办?

男:很多人给出的答案是:自己搭递归解析器。在社区讨论里,好多人说自己用 Unbound、AdGuard Home 跑了十多年,完全不依赖第三方的过滤或者日志策略,所有记录都在自己手里。

女:自建听起来一劳永逸。但阿迪,你刚才说默认的 DNS 查询是明文的,自建服务器直接去根服务器查询,ISP 不一样能看见所有请求吗?

男:你问到痛点上了。就是这样。你自建递归器,去根服务器的那一跳,还是明文,ISP 根本不需要破解你啥都能看见。如果你想加密那一跳,就得在外部托管一个 DoH 或 DoT 端点,套一层壳。还有人玩得更绝,他在自己的定时脚本里每小时去抓取 Cloudflare 的前两万热门域名,再加上自己常去的网站,提前解析好。这样既加快了本地响应,也制造了大量垃圾流量掩盖你真实的浏览行为。

女:这个就像点了一桌子菜,但只有一两道是自己吃的,服务员就不知道你到底喜欢吃啥。那关于广告过滤呢?我发现很多 DNS 服务都带这个功能。

男:这是个坑。不要默认启用广告或恶意软件拦截。Quad9 的主地址 9.9.9.9 默认拦截恶意域名,这听起来很好,但也出过事——它曾经误判 gist.github.com 为恶意站,还有私人的 BT tracker 也被封过。Cloudflare 的 1.1.1.2 也曾错误地阻挡了 archive.is。对于需要绝对可靠访问的人来说,最好用无过滤的地址,或者干脆选允许自定义白名单的服务,比如 NextDNS 或 Control D。

女:这就像小区的保安把送快递的和可疑人员全拦了,快递也进不来。你们工程师折腾 DNS 是为了自由和隐私,那普通人在这个信息过载的世界里,会不会反而更想屏蔽一些东西?

男:你指的不只是 DNS 级别的屏蔽,还包括内容?

女:对。我最近看到一篇文章,在反思 AI 生成内容和我们人类独特体验的关系,居然是从《心灵捕手》里罗宾·威廉姆斯的一段独白说起的。

男:哦?就是那个在公园长椅上,他对着马特·达蒙说的那一段?我记得他说,你能引用所有名句,但你没闻过战火,没握过垂死朋友的手。那是我最喜欢的电影台词之一。

女:文章作者 Jay Acunzo 就用这段来回应现在的 AI 噪音。他说 AI 读遍了互联网,但它没“活过”。知识和生活是两回事。AI 依赖大型语言模型,而我们人类依赖一生中那些微小的瞬间。现在有太多声音在说服我们放弃生活,去用工具和捷径,去相信自己的经历不重要。他举的例子是演员——同一个剧本,只有罗宾·威廉姆斯能演成那样,因为他把自己和毒瘾搏斗、失去朋友的经历揉进去了。

男:但评论区有一个特别犀利的反击。有人说,这段台词本身就是本·阿弗莱克和马特·达蒙二十几岁时写的,他们也没经历过战争和癌症陪护,不还是写出来了?表演或许需要借用个人经历,但创作本身,同样可以依靠同理心和观察来讲述未曾亲历的事。这逻辑反推回去,仅凭“没活过”来否定 AI 的创作潜力,有点站不住脚。

女:这个反击太狠了。不过,还有人说,最能引起不适的,是 AI 经常用“我通常觉得”“我个人更喜欢”这种说法。因为它根本不具备任何主观体验,这种拟人化的表述会让人觉得心里发毛。但如果人能从电影和书本里获取认知,这不也是另一种“影子学习”吗?和柏拉图的洞穴比喻一样,AI 看的是文字的影子,我们大多数人也没闻过真正的战火和硝烟。

男:所以焦点变成了:当输出质量已经难以区分时,人如何保留下那些依靠“灵魂”的部分。或者说,大伙儿其实是在争论“谁才是真正的 slop”。那篇文章里作者甚至被怀疑,这篇捍卫人类独特性的文章,是不是也用 AI 润色过,因为它带有明显的 ChatGPT 痕迹。要是真的,那可就成了一个完美的循环论证。

女:这让人有点不寒而栗。我想到你们搞技术的人经常干的一件事——反编译。就是把已经写好的程序变回人能看懂的代码。AI 在逆向工程这种需要创造力和经验的工作上,能做到像罗宾·威廉姆斯那样注入灵魂吗?

男:说到这个,最近有个叫 Decomp Academy 的网站挺火。它是一个交互式学习平台,专门教你反编译 GameCube 游戏的汇编代码。比如,把你的 C 代码写出来,然后用当年 GameCube 的编译器(叫 MWCC)去编译,必须生成和其他开发者一模一样的机器码,一个字节都不能差。

女:这个要求有点变态。写 C 代码去匹配汇编,就像要求你写一篇作文,字数、标点、甚至行间距都必须和原文完全一致。这平台怎么训练人?

男:它先教你看 PowerPC 汇编,然后从整数算术、控制流,一路讲到指针、结构体、浮点运算和编译器优化。最后的大作业是拿《星际火狐大冒险》里的真实函数让你练手。几百个练习,有 XP 和进度条,感觉像在打游戏。

女:那 AI 能完成这个任务吗?毕竟 AI 写代码的能力也不差。

男:作者自己的回答很有意思。他说 AI 在做这种“逐字节匹配”的逆向时,能搞定 95%,但总是卡在最后那 5%。特别是简单的 if/else 和三元运算符,编译出来的汇编可能完全不一样,AI 束手无策。所以他才选择自己深度学习。而且评论区还有人提醒,AI 生成的代码在美国法律框架下可能不被认为是“转化性使用”,有版权风险,而纯人工逆向已经有大量法律先例保护。

女:所以在这个细分领域,人脑那种对细微差别的敏感度,目前还是护城河。这让我想起咱们接下来要聊的另一个话题:自从 AMD 出了那个内存巨大的 Strix Halo 处理器,你们这帮人在本地跑大模型好像又折腾出了新玩法。

男:Strix Halo 的 128GB 统一内存确实是个梦想,能本地加载很多大模型。但一个人的钱包和板子是有限的,一块跑不动 300B 参数的模型,那就需要把模型拆开,放到好几台机器上一起跑。最近有位大神发了一篇详细的指南,教大家怎么把两块 Framework Desktop 主板,用 100GbE 网卡直连起来,组成一个小集群。

女:两块主板绑在一起当一台用?这听着就像把两辆小轿车焊在一起当大巴开。能跑起来吗?

男:关键是一种叫 RDMA(远程直接内存访问)的技术。不用 RDMA,两块板子通信大概要 70 到 100 微秒的延迟,用了 RDMA,直接降到 5 微秒。这个数量级的下降,让它们真的感觉像是一台机器。作者实测,以太网延迟 0.074 毫秒,RDMA 是 0.00523 毫秒。

女:这个数字差距确实很大。但折腾这个集群,除了延迟,还有什么难题?

男:价格。评论区里一片哀嚎。去年 Strix Halo 的 128GB 迷你主机大概 1600 到 2500 欧元,现在光是一块 Framework 的主板就标价 7899 欧元。有人吐槽说,这个价格都能买二手的 A100 企业卡了。不过也有人很乐观,认为对本地 AI 研究来说,两万块人民币拿到 128GB 统一内存,还是比苹果的 Mac Studio 划算——苹果 128GB 版已经停产了,512GB 的二手要 3 万美元。

女:听起来还是适合愿意动手的极客。这种东西,不仅要懂硬件,还得自己编译内核、打补丁。你们是不是看到这种要自己 DIY 的东西,就发自内心的兴奋?

男:这是一种“可控感”带来的快感。你想想,哪怕是用 Linux 容器(LXC)把浏览器这种高风险应用隔离起来,虽然麻烦,但我们能把握住每一个权限映射的细节。最近也有篇文章讲怎么用 LXC 隔离 X11 应用,就是让浏览器在一个无特权容器里跑,就算被攻击了,逃逸出来也没法控制宿主机。

女:这个隔离听起来像是给家里的危险分子建了个软垫病房。但 X11 的老毛病,是不是让这个房间的墙有点薄?

男:你猜对了。X11 套接字转发进去,就等于在墙上开了个洞。容器里的任何程序都能读到其他程序的键盘输入,甚至控制桌面窗口。文章自己也承认这并非绝对隔离。有评论指出,真正的解决之道应该是 Wayland,它把窗口隔离做进了协议本身。但 Wayland 在混合 DPI 和一些老旧 X11 应用的兼容性上,步子还没完全跟上。

女:在系统层面上追求可移植和“到处都能跑”的,不只你们搞硬件的。我发现连用正则表达式的工程师都梦想写出一段代码,能在所有工具里通用。但好像是个奢望?

男:没错。前两天有篇文章,作者是个 Perl 高手,他想找出一个最小通用子集,让他的正则表达式在 sed、awk、grep 和 Emacs 里都能跑。他列出了他认为能“到处通用”的特性:比如 \w 表示字母数字、\s 表示空格、反向引用、零宽断言等等。

女:听上去挺全的。结果呢?

男:被评论区花式打脸。首先,macOS 上的 BSD sed 根本不认 \w\s,你必须用 POSIX 字符类 [[:alnum:]][[:space:]]。其次,Go 语言的正则包不支持反向引用。最惨的是,他发现只要不加 -E 选项开启扩展正则,GNU 系列的 grep 和 sed 会默认使用基本正则模式,很多元字符得在前面加上反斜杠才能用。他的“通用清单”基本只适用于他自己配置好的 GNU 环境。

女:哈哈,以为找到了万能公式,结果是方言大聚会。

男:所以有评论说,真正通用的只有 . * ^ $ 和字符类。甚至有人在推动 I-Regexp 这种标准化子集。这也让我想到那种极端追求“通用”和“零依赖”的美学,比如用纯 Bash 写博客。我们刚刚聊到一个叫 bashblog 的小项目,一个 1200 行的 Bash 脚本,就能实现整个博客生成系统。

女:一个脚本搞定博客?这听起来像是回到了互联网的青铜时代。

男:这就是它的魅力。没有 Ruby、Python 或 Node.js 依赖,只需要系统自带的 grepseddate,丢到一个 128MB 内存的小服务器上就能跑。作者的理念就是,你 SSH 进机器,立刻就能写东西。有人拿它类比“在只有一把厨房刀的时候去砍树”——未必是最优解,但能做到就很厉害。

女:但我猜肯定也有人说,用 Bash 写超过 10 行代码就是在自虐。

男:对。批评者说这 1200 行脚本难以维护,到处是引号和空格陷阱。但支持者觉得,在过度复杂的生态系统里,这种“一个文件走天下”的思路让人特别爽。这也让我想到,有时候,最简单的判断逻辑反而能起到很好的分流作用。就像最近有个 Wayfinder Router 项目,它是一个离线的路由器,专门用来判断发送给大模型的提示词是简单还是复杂。

女:等等,路由提示词?它自己不就是个大模型吗?

男:不。它不做任何模型调用,纯粹基于提示词的结构和用词来计算一个复杂度分数。比如你的问题很长、有很多标题和代码块,或者有数学术语,分数就高,它就给你路由到贵的光滑云端模型;简单到只是“帮我格式化这段文字”,它就发给本地免费模型。这个过程是次毫秒级的,完全不消耗 token。

女:这个聪明。就像邮局分拣信件,看一眼信封大小和地址,就决定是寄平邮还是快递。它怎么知道判断得准不准呢?

男:它坦承在“信短但很难”的问题上无能为力,比如“找出 100 以内的所有质数”,句子虽短但计算复杂,它的结构判断就不如随机猜测。它需要用户在自己的数据上去校准阈值。不过评论区里有人提出一个更大的脑洞:这种路由应该做进操作系统层面。就像手机自动切换 Wi-Fi 和移动数据一样,系统提供统一的 LLM 接口,根据任务复杂度和算力,自动在本地模型和云端模型之间无缝切换,应用都不用管 API key 的事儿。

女:这如果真的实现,感觉电脑就有了某种“精力分配”的直觉。这让我突然想起了另一件工程学上的壮举——最近人类把一个巨大的、二十层楼高的物体吊了起来,而且对接精度极高。

男:你是在说奋进号航天飞机?加州科学中心刚完成了它的垂直堆叠,他们叫“Go for Stack”。

女:对!就是把退役的航天飞机轨道器,还有两个固体火箭助推器、一个巨大的橙色外部燃料箱,像搭积木一样垂直拼在一起,形成准备发射的姿态。这还是第一次在 NASA 设施以外的地方干成这件事。我最初看新闻标题,还以为是给航天飞机装了个二十层楼高的显示屏。

男:哈哈,那也太赛博朋克了。奋进号以前是放在地上展览的,大家可以走到机翼底下。现在是发射构型,人可以站在固体助推器的喷管正下方抬头看。有位参观过所有三架退役航天飞机的人说,现在它们展示了三种不同的工作模式:奋进号是准备发射,亚特兰蒂斯号在肯尼迪航天中心是轨道飞行姿态,发现号在史密森尼是着陆姿态。想要感受人类太空飞行的完整周期,得看完这三架。

女:这赋予了那些冰冷的引擎和防热瓦一种叙事感。虽然有人说航天飞机项目是个巨大失误,间接证明了 SpaceX 可重复使用火箭路线的价值。但当你真的站在那个巨物脚下,仰头看着那些经历过太空灼烧的痕迹,那种感受,恐怕不是任何成本分析能替代的。

男:就像我们前面聊到的,AI 可以精确描述穿越大气层的物理过程,但它说不出抬头仰望时后脖颈发凉的那种感觉。这大概就是数据和生活的区别。

女:好了,今天我们从助眠、隐私、AI 与灵魂,一路聊到了反向编译、硬件集群和航天飞机的最后安息。非常感谢阿迪带来这么多有趣的信息。

男:谢谢大家听我们闲聊。

女:如果你喜欢我们的节目,记得在你的泛用型播客客户端里搜索并订阅 Hacker Podcast。无论你是在通勤、工作摸鱼,还是正准备睡觉,我们都准时在这里。我们下期再见。

男:拜拜。

参考链接