


























今天的话题关于选择的智慧:DNS 解析器怎么挑、大模型请求往哪里发、正则表达式该信哪个标准,甚至博客生成工具该不该用 1200 行 Bash 脚本。Agili 的 Hacker Podcast 和你一起看看这些来自技术现场的取舍。
evilbit.de 制作了一份交互式指南,提供三个步骤:按需求筛选(加密传输、DNSSEC 验证、IPv6、日志策略等)、本地速度对比、以及 29 个全球公共解析器的特征表。工具本身用起来像选配一辆车,每项配置背后都对应一个现实权衡。
社区讨论中,自建派和托管派分得很开。不少人说自己跑 Unbound 或 AdGuard Home 已经十多年,所有查询都在自己机器上完成,不留日志、不经第三方过滤。但细看并不完美:直连根服务器的查询仍是明文的,ISP 看得到一切。真要加密,还得在外部托管一个 DoH/DoT 端点。一位用户说他每小时用 cron 预热 Cloudflare 前两万域名再加上自己的高频查询,既加快响应又用“噪音流量”覆盖真实访问行为。
Quad9 的主地址自动拦截恶意域名,但误报让 gist.github.com 和私有 tracker 都躺过枪;Cloudflare 的 1.1.1.2 也曾阻挡 archive.is。多数评论者倾向无过滤地址,或者用 NextDNS、Control D 这类可自定义白名单的服务。另一方面,当过滤没有误伤时,在移动设备上拦截广告 SDK 的效果又相当显著——这个取舍就变得很个人。
Cloudflare 和 Quad9 默认不发送 ECS(客户端子网信息),这让 CDN 无法把用户引向就近缓存节点,看 YouTube、Google 视频时下载变慢。使用 Google Public DNS 或 ISP 提供的解析器反而能拿到正确的本地 IP。这就是隐私和性能的直接对撞,指南里已经为每个解析器标注了 ECS 状态,读者可以按需过滤。
得克萨斯州 Marfa 公共电台在募捐季推出了一档睡眠播客,内容是员工用平缓语调朗读 FCC 合规条款、塔台管理条例、德州行政法典,甚至 2025 年《拨款撤销法案》。一位听众说:“我连简介都没撑过去。”这正是它要达到的效果。
听众把它和“Boring Books for Bedtime”(有时选材太有趣)、“Sleep With Me”(主持人用漫无边际的独白打断叙事逻辑)做了比较。还有人觉得它像 Adult Swim 的“Joe Pera Talks You to Sleep”。小镇本身的魅力也成了话题:几位去过的人说,想起 Marfa 沙漠和艺术氛围就让人感到最惬意的那种困意。
这篇指南把两台 Framework Desktop 主板(AMD Ryzen AI MAX+“Strix Halo”)用 Intel E810 网卡直连,构建 RDMA 集群,让 vLLM 通过张量并行(Tensor Parallelism)推理超出 128GB 统一内存的模型。没有 RDMA 时,节点间走 TCP 延迟约 0.074 毫秒;启用 RoCE v2 后,延迟只有 5.23 微秒,下降了一个数量级。
Framework 主板只提供 x4 PCIe 插槽,需要用转接卡适配 x16 网卡。作者提到一块主板的插槽被超声波刀切开以便直插,但不建议用户模仿。软件上需要 Fedora 43、rdma-core、冰和 irdma 驱动,BIOS 设 iGPU 为 512MB,并在 GRUB 里加入 iommu=pt 等内核参数。自行编译的 librccl.so 提供了 Strix Halo 所需的 gfx1151 支持,启动集群时必须打开 Eager Mode 避免 CUDA Graphs 死锁。
社区一边倒认为硬件太贵:去年 128GB 迷你主机约两千欧元,如今 Framework 主板标价 7899 欧元,部分 Mini PC 也涨到四千美元。有评论说这价格不如二手 A100/V100 基板。但对于本地 AI 研究,两万人民币以内拿到 128GB 统一内存仍比 Mac Studio(512GB 版二手约三万美元)有吸引力。性能受限于内存带宽,Strix Halo 集群的预充速度远慢于同内存量的 Mac,但已经算是接近“云级”本地算力的可行路径。
这个交互式平台教用户把 PowerPC 汇编反编译为与原版完全一致的 C 代码,后端用真实的 Metrowerks 编译器逐字节验证。课程从寄存器、整数运算、控制流,一路覆盖到浮点、ABI、编译器优化和 64 位整数,最后用《星际火狐 大冒险》的真实函数做实战。
有人用 Fable 把九十年代 Windows 软件转成原生 Mac 应用,效果惊人,但匹配型逆向会卡在最后 5%——简单的 if/else 和三元运算符就能难住模型。作者说这正是他决定深度学习的原因。版权方面,评论提醒 AI 生成的代码在美国法律下可能不被视为转化性使用,而纯人工逆向已有大量保护先例。
作者使用 LXC 创建非特权容器,通过 UID/GID 映射让容器内 root 在宿主机上对应一个不存在的用户,以此运行浏览器等高风险 X11 程序。关键步骤包括设置 idmap 声明宿主用户可使用 100000~165535 范围、挂载宿主的 X 套接字和修改过的 .Xauthority 文件、以及通过 PipeWire PulseAudio 兼容层转发音频。
X11 套接字一旦共享,容器内任何应用都能读取其他应用的键盘输入和窗口内容,甚至操控宿主机桌面。Firefox 自身有沙箱(RLBox),但 X11 协议本身没有细粒度权限控制。评论提到 Wayland 将窗口隔离建在协议中,而 XNamespace 是 X11Libre 项目正在做的新扩展。替代方案里,Firejail 提供了更开箱即用的配置,Xephyr 或 Xpra 可以进一步嵌套隔离,但都会增加复杂度。
作者 Jay Acunzo 借《心灵捕手》里肖恩对威尔说的那段话——“你能说出西斯廷教堂的气味吗?”——来区分知识与生活。AI 读遍了互联网,但它没有站过教堂穹顶下,没有握过垂死朋友的手。而当下有太多声音在说服人们停止生活,用工具和捷径取代个人经历。
评论点出剧本是二十岁出头的阿弗莱克和达蒙写的,他们也没经历过战争或丧偶,却能写出打动人心的独白。表演又借用了罗宾·威廉姆斯个人的挣扎与失落。这说明靠同理心和观察也可以接近真实,仅凭“没活过”否定 AI 的创作潜力可能不成立。而如果一篇捍卫人类独特性、对抗 AI slop 的文章本身经过 AI 润色,那又构成了一个奇特的循环。
作者 John D. Cook 希望写出一套在 sed、awk、grep、Emacs 里都能跑的正则表达式。他的清单包括 . ^ $ * ? + | {n,m} \w \s \b 和反向引用,前提是使用 GNU 工具并给 sed/grep 加上 -E。但社区很快指出众多裂痕:Go 的 regexp 库不支持反向引用,macOS/BSD 的 sed 不认 \w\s\b,必须用 POSIX 字符类和 [[:<:]] 代替。真正完全通行的只剩下字符类和最基础的四个符号。
很多软件文档只说支持“正则表达式”,不提具体方言。Google Sheets 和 Excel 会注明 RE2 还是 PCRE,但在配置文件里用户根本猜不到底层是什么语言。RFC 9485(I-Regexp)和 JSON Schema 推荐的子集都是试图标准化的努力,而 SNOBOL 语言里的模式匹配则被看作一条被人遗忘但更优雅的路。
2024 年 1 月,加州科学中心完成奋进号的垂直堆叠,依次安装尾裙、固体火箭助推器、外部燃料箱,最后用起重机将 122 英尺的轨道器与其余部分对接。这是首次在 NASA 设施外精准复原发射构型。今后 Samuel Oschin 中心将拥有世界唯一完整、真实的航天飞机系统垂直展示,且不额外收费。
有人一开始误以为“20 层楼高的垂直展示”是装了一块巨屏。也有参观过全部航天飞机的观众说,现在三架分别代表发射、轨道和着陆三种状态。奋进号 2012 年穿越洛杉矶街道、经过 Wendy's 和 Randy's Donuts 的场景,被形容为城市游行;企业号通过驳船经过海滩也曾给人们带来惊喜。
Bashblog 只需一个 bb.sh 文件,执行 ./bb.sh post 就能用默认编辑器写文章,生成 HTML 页面、RSS 和标签索引。它只依赖 date、grep、sed 等基础工具,适合 128MB 内存的轻量服务器,或是只想在 SSH 进去后立刻写点东西的人。
支持者认为在只有厨房刀的情况下用来砍树就是本事,它不需要 Ruby/Python/Node,刚好填满想要最少工具的人的需求。批评者则指出 1200 行 Bash 在引号、空格和 BSD/GNU 差异上全是坑,不如用静态生成器在本地生成好再 rsync 上去。也有人分享自己用 find 和 pandoc 拼出来的脚本,还有回忆 NanoBlogger 的老用户。bashblog 无意取代 Hugo,它服务的场景非常具体:一个脚本、一个公共文件夹、一台能跑 shell 的机器。
Wayfinder Router 根据提示词的长度、标题、列表、代码等特点计算复杂度分数,把简单请求送到本地或廉价模型,复杂请求转发到云端。整个过程离线、确定性,不消耗 token,延迟不到一毫秒。它不替换客户端,只是在原有 OpenAI 兼容客户端和实际后端之间加一个判断层,改动 base_url 就行。
社区有人提出这种路由思路应该进操作系统:统一的 LLM API,本地不够用就自动转发云端。但多轮对话时频繁切换模型会破坏上下文的连贯性和缓存效果,反而抵消省钱效果。作者回应首几轮用强模型,后续简单任务用弱模型仍能省钱,且两个模型的缓存都会保持温度。另一些评论质疑不同模型在 agent 框架中的行为差异会导致路由失效;作者说 Wayfinder 只做难易二元判断,模型选择可以交给另一个路由器组合使用。
女:Hello 大家好,欢迎收听 Agili 的 Hacker Podcast,我是莓莓。
男:大家好,我是阿迪。
女:今天天气不错,特别适合……睡觉。没错,我们这期节目就从睡觉开始。阿迪,你听过那种专门帮你入睡的播客吗?
男:听过,比如那种读说明书,或者念枯燥文件。不过我一般听雨声就睡着了。怎么了,有新的?
女:德克萨斯有个叫 Marfa 的小镇,那儿有个公共电台在募捐季搞了个创意:让员工用特别平缓的语调,朗读 FCC 的合规条款,塔台管理条例,甚至读了 2025 年的一份《拨款撤销法案》。这档节目就叫“Marfa Public Radio Puts You to Sleep”,目的是让听众无聊到睡着,顺便给电台筹款。
男:哈哈,把无聊变成一种公益。FCC 条款那玩意儿,念出来确实比安眠药管用。我看过他们塔台的管理文件,光是“天线高度必须低于多少米”这种话重复三遍,人就过去了。
女:听众的反应也特别逗。有人说“这个播客真的够无聊,我连简介都听不完”,还有程序员说自己整天写代码,下班就需要这种没有信息增量的背景音放松。有人甚至说,光是想起了西得克萨斯那个沙漠小镇,就已经产生了最棒的那种睡意。
男:这我信。Marfa 那个地方我去过一次,人特别友好,周围都是荒漠和艺术装置,节奏很慢,傍晚在电台后面的小院子里喝杯酒,感觉时间都凝固了。这种环境产出的助眠内容,自带氛围感。
女:不过也有人较真,在网上讨论哪种助眠机制更有效。有人喜欢这种单调人声,有人需要白噪音,还有人聊到一个叫“fastsleep.app”的网页应用,让你想象一个平静的场景,隔几秒提示一下,用来打断胡思乱想。另一个需求也挺实在——希望睡眠播客能记住你听到哪儿,半夜醒了不用亮屏幕就能继续。
男:我个人最大的困扰是耳机。有一次戴着 AirPods 听助眠音频睡着了,半夜翻身按到了播放键,突然切到重金属。现在有些播放器有“入睡时暂停媒体”的功能,这个很必要。
女:说到耳机和半夜的焦虑,你有没有想过,我们的 DNS 解析器在我们睡着的时候都在干什么?
男:你是指公共 DNS?它们确实二十四小时不停地在把你的域名请求翻译成 IP 地址。最近正好看到一份很详细的指南,教大家怎么选公共 DNS 解析器,里面列了 29 家,包括 Cloudflare、Quad9、Google 这些大厂,也有一些社区和个人运营的。
女:29 家?这个数字吓我一跳。普通人真的需要在意 DNS 服务商的区别吗?
男:要是在意隐私,就得在意。比如你输入一个网址,你的 DNS 查询在默认情况下是明文的,你的 ISP 能看到你访问了哪个网站。所以现在很多公共 DNS 支持加密传输,像 DoH 和 DoT,就是把查询过程加密。但这份指南里提到,有 25% 的 DoT 服务提供商给的 TLS 证书甚至是无效的,加密了个寂寞。
女:所以不是所有的“加密”都靠谱。那选择的时候,除了加密,还要看什么?
男:有一个特别有意思的权衡点叫 EDNS Client Subnet,简称 ECS。简单说,就是 DNS 服务商要不要把你的部分 IP 地址告诉网站的 CDN 服务器,好让人家给你分配最近的缓存节点。
女:这个很有用吧?比如看视频,如果被分到离自己近的节点,肯定更快。
男:对,这就是问题。像 Cloudflare 和 Quad9 这些注重隐私的,默认不发送 ECS,你的 IP 不会被泄露给 CDN。但代价就是,你看 YouTube 或者 Google 视频时,可能被指向一个很远的缓存服务器,下载巨慢。有用户说用 ISP 自带的 DNS 或者 Google Public DNS 就能获得本地缓存 IP,速度立刻不一样。这就是一个隐私和速度的取舍。
女:所以就是一个天平:要绝对隐私,可能就得忍受慢视频;要速度,就得牺牲一些位置信息。那如果我既不想被跟踪,又不想看视频卡顿,怎么办?
男:很多人给出的答案是:自己搭递归解析器。在社区讨论里,好多人说自己用 Unbound、AdGuard Home 跑了十多年,完全不依赖第三方的过滤或者日志策略,所有记录都在自己手里。
女:自建听起来一劳永逸。但阿迪,你刚才说默认的 DNS 查询是明文的,自建服务器直接去根服务器查询,ISP 不一样能看见所有请求吗?
男:你问到痛点上了。就是这样。你自建递归器,去根服务器的那一跳,还是明文,ISP 根本不需要破解你啥都能看见。如果你想加密那一跳,就得在外部托管一个 DoH 或 DoT 端点,套一层壳。还有人玩得更绝,他在自己的定时脚本里每小时去抓取 Cloudflare 的前两万热门域名,再加上自己常去的网站,提前解析好。这样既加快了本地响应,也制造了大量垃圾流量掩盖你真实的浏览行为。
女:这个就像点了一桌子菜,但只有一两道是自己吃的,服务员就不知道你到底喜欢吃啥。那关于广告过滤呢?我发现很多 DNS 服务都带这个功能。
男:这是个坑。不要默认启用广告或恶意软件拦截。Quad9 的主地址 9.9.9.9 默认拦截恶意域名,这听起来很好,但也出过事——它曾经误判 gist.github.com 为恶意站,还有私人的 BT tracker 也被封过。Cloudflare 的 1.1.1.2 也曾错误地阻挡了 archive.is。对于需要绝对可靠访问的人来说,最好用无过滤的地址,或者干脆选允许自定义白名单的服务,比如 NextDNS 或 Control D。
女:这就像小区的保安把送快递的和可疑人员全拦了,快递也进不来。你们工程师折腾 DNS 是为了自由和隐私,那普通人在这个信息过载的世界里,会不会反而更想屏蔽一些东西?
男:你指的不只是 DNS 级别的屏蔽,还包括内容?
女:对。我最近看到一篇文章,在反思 AI 生成内容和我们人类独特体验的关系,居然是从《心灵捕手》里罗宾·威廉姆斯的一段独白说起的。
男:哦?就是那个在公园长椅上,他对着马特·达蒙说的那一段?我记得他说,你能引用所有名句,但你没闻过战火,没握过垂死朋友的手。那是我最喜欢的电影台词之一。
女:文章作者 Jay Acunzo 就用这段来回应现在的 AI 噪音。他说 AI 读遍了互联网,但它没“活过”。知识和生活是两回事。AI 依赖大型语言模型,而我们人类依赖一生中那些微小的瞬间。现在有太多声音在说服我们放弃生活,去用工具和捷径,去相信自己的经历不重要。他举的例子是演员——同一个剧本,只有罗宾·威廉姆斯能演成那样,因为他把自己和毒瘾搏斗、失去朋友的经历揉进去了。
男:但评论区有一个特别犀利的反击。有人说,这段台词本身就是本·阿弗莱克和马特·达蒙二十几岁时写的,他们也没经历过战争和癌症陪护,不还是写出来了?表演或许需要借用个人经历,但创作本身,同样可以依靠同理心和观察来讲述未曾亲历的事。这逻辑反推回去,仅凭“没活过”来否定 AI 的创作潜力,有点站不住脚。
女:这个反击太狠了。不过,还有人说,最能引起不适的,是 AI 经常用“我通常觉得”“我个人更喜欢”这种说法。因为它根本不具备任何主观体验,这种拟人化的表述会让人觉得心里发毛。但如果人能从电影和书本里获取认知,这不也是另一种“影子学习”吗?和柏拉图的洞穴比喻一样,AI 看的是文字的影子,我们大多数人也没闻过真正的战火和硝烟。
男:所以焦点变成了:当输出质量已经难以区分时,人如何保留下那些依靠“灵魂”的部分。或者说,大伙儿其实是在争论“谁才是真正的 slop”。那篇文章里作者甚至被怀疑,这篇捍卫人类独特性的文章,是不是也用 AI 润色过,因为它带有明显的 ChatGPT 痕迹。要是真的,那可就成了一个完美的循环论证。
女:这让人有点不寒而栗。我想到你们搞技术的人经常干的一件事——反编译。就是把已经写好的程序变回人能看懂的代码。AI 在逆向工程这种需要创造力和经验的工作上,能做到像罗宾·威廉姆斯那样注入灵魂吗?
男:说到这个,最近有个叫 Decomp Academy 的网站挺火。它是一个交互式学习平台,专门教你反编译 GameCube 游戏的汇编代码。比如,把你的 C 代码写出来,然后用当年 GameCube 的编译器(叫 MWCC)去编译,必须生成和其他开发者一模一样的机器码,一个字节都不能差。
女:这个要求有点变态。写 C 代码去匹配汇编,就像要求你写一篇作文,字数、标点、甚至行间距都必须和原文完全一致。这平台怎么训练人?
男:它先教你看 PowerPC 汇编,然后从整数算术、控制流,一路讲到指针、结构体、浮点运算和编译器优化。最后的大作业是拿《星际火狐大冒险》里的真实函数让你练手。几百个练习,有 XP 和进度条,感觉像在打游戏。
女:那 AI 能完成这个任务吗?毕竟 AI 写代码的能力也不差。
男:作者自己的回答很有意思。他说 AI 在做这种“逐字节匹配”的逆向时,能搞定 95%,但总是卡在最后那 5%。特别是简单的 if/else 和三元运算符,编译出来的汇编可能完全不一样,AI 束手无策。所以他才选择自己深度学习。而且评论区还有人提醒,AI 生成的代码在美国法律框架下可能不被认为是“转化性使用”,有版权风险,而纯人工逆向已经有大量法律先例保护。
女:所以在这个细分领域,人脑那种对细微差别的敏感度,目前还是护城河。这让我想起咱们接下来要聊的另一个话题:自从 AMD 出了那个内存巨大的 Strix Halo 处理器,你们这帮人在本地跑大模型好像又折腾出了新玩法。
男:Strix Halo 的 128GB 统一内存确实是个梦想,能本地加载很多大模型。但一个人的钱包和板子是有限的,一块跑不动 300B 参数的模型,那就需要把模型拆开,放到好几台机器上一起跑。最近有位大神发了一篇详细的指南,教大家怎么把两块 Framework Desktop 主板,用 100GbE 网卡直连起来,组成一个小集群。
女:两块主板绑在一起当一台用?这听着就像把两辆小轿车焊在一起当大巴开。能跑起来吗?
男:关键是一种叫 RDMA(远程直接内存访问)的技术。不用 RDMA,两块板子通信大概要 70 到 100 微秒的延迟,用了 RDMA,直接降到 5 微秒。这个数量级的下降,让它们真的感觉像是一台机器。作者实测,以太网延迟 0.074 毫秒,RDMA 是 0.00523 毫秒。
女:这个数字差距确实很大。但折腾这个集群,除了延迟,还有什么难题?
男:价格。评论区里一片哀嚎。去年 Strix Halo 的 128GB 迷你主机大概 1600 到 2500 欧元,现在光是一块 Framework 的主板就标价 7899 欧元。有人吐槽说,这个价格都能买二手的 A100 企业卡了。不过也有人很乐观,认为对本地 AI 研究来说,两万块人民币拿到 128GB 统一内存,还是比苹果的 Mac Studio 划算——苹果 128GB 版已经停产了,512GB 的二手要 3 万美元。
女:听起来还是适合愿意动手的极客。这种东西,不仅要懂硬件,还得自己编译内核、打补丁。你们是不是看到这种要自己 DIY 的东西,就发自内心的兴奋?
男:这是一种“可控感”带来的快感。你想想,哪怕是用 Linux 容器(LXC)把浏览器这种高风险应用隔离起来,虽然麻烦,但我们能把握住每一个权限映射的细节。最近也有篇文章讲怎么用 LXC 隔离 X11 应用,就是让浏览器在一个无特权容器里跑,就算被攻击了,逃逸出来也没法控制宿主机。
女:这个隔离听起来像是给家里的危险分子建了个软垫病房。但 X11 的老毛病,是不是让这个房间的墙有点薄?
男:你猜对了。X11 套接字转发进去,就等于在墙上开了个洞。容器里的任何程序都能读到其他程序的键盘输入,甚至控制桌面窗口。文章自己也承认这并非绝对隔离。有评论指出,真正的解决之道应该是 Wayland,它把窗口隔离做进了协议本身。但 Wayland 在混合 DPI 和一些老旧 X11 应用的兼容性上,步子还没完全跟上。
女:在系统层面上追求可移植和“到处都能跑”的,不只你们搞硬件的。我发现连用正则表达式的工程师都梦想写出一段代码,能在所有工具里通用。但好像是个奢望?
男:没错。前两天有篇文章,作者是个 Perl 高手,他想找出一个最小通用子集,让他的正则表达式在 sed、awk、grep 和 Emacs 里都能跑。他列出了他认为能“到处通用”的特性:比如 \w 表示字母数字、\s 表示空格、反向引用、零宽断言等等。
女:听上去挺全的。结果呢?
男:被评论区花式打脸。首先,macOS 上的 BSD sed 根本不认 \w 和 \s,你必须用 POSIX 字符类 [[:alnum:]] 和 [[:space:]]。其次,Go 语言的正则包不支持反向引用。最惨的是,他发现只要不加 -E 选项开启扩展正则,GNU 系列的 grep 和 sed 会默认使用基本正则模式,很多元字符得在前面加上反斜杠才能用。他的“通用清单”基本只适用于他自己配置好的 GNU 环境。
女:哈哈,以为找到了万能公式,结果是方言大聚会。
男:所以有评论说,真正通用的只有 . * ^ $ 和字符类。甚至有人在推动 I-Regexp 这种标准化子集。这也让我想到那种极端追求“通用”和“零依赖”的美学,比如用纯 Bash 写博客。我们刚刚聊到一个叫 bashblog 的小项目,一个 1200 行的 Bash 脚本,就能实现整个博客生成系统。
女:一个脚本搞定博客?这听起来像是回到了互联网的青铜时代。
男:这就是它的魅力。没有 Ruby、Python 或 Node.js 依赖,只需要系统自带的 grep、sed 和 date,丢到一个 128MB 内存的小服务器上就能跑。作者的理念就是,你 SSH 进机器,立刻就能写东西。有人拿它类比“在只有一把厨房刀的时候去砍树”——未必是最优解,但能做到就很厉害。
女:但我猜肯定也有人说,用 Bash 写超过 10 行代码就是在自虐。
男:对。批评者说这 1200 行脚本难以维护,到处是引号和空格陷阱。但支持者觉得,在过度复杂的生态系统里,这种“一个文件走天下”的思路让人特别爽。这也让我想到,有时候,最简单的判断逻辑反而能起到很好的分流作用。就像最近有个 Wayfinder Router 项目,它是一个离线的路由器,专门用来判断发送给大模型的提示词是简单还是复杂。
女:等等,路由提示词?它自己不就是个大模型吗?
男:不。它不做任何模型调用,纯粹基于提示词的结构和用词来计算一个复杂度分数。比如你的问题很长、有很多标题和代码块,或者有数学术语,分数就高,它就给你路由到贵的光滑云端模型;简单到只是“帮我格式化这段文字”,它就发给本地免费模型。这个过程是次毫秒级的,完全不消耗 token。
女:这个聪明。就像邮局分拣信件,看一眼信封大小和地址,就决定是寄平邮还是快递。它怎么知道判断得准不准呢?
男:它坦承在“信短但很难”的问题上无能为力,比如“找出 100 以内的所有质数”,句子虽短但计算复杂,它的结构判断就不如随机猜测。它需要用户在自己的数据上去校准阈值。不过评论区里有人提出一个更大的脑洞:这种路由应该做进操作系统层面。就像手机自动切换 Wi-Fi 和移动数据一样,系统提供统一的 LLM 接口,根据任务复杂度和算力,自动在本地模型和云端模型之间无缝切换,应用都不用管 API key 的事儿。
女:这如果真的实现,感觉电脑就有了某种“精力分配”的直觉。这让我突然想起了另一件工程学上的壮举——最近人类把一个巨大的、二十层楼高的物体吊了起来,而且对接精度极高。
男:你是在说奋进号航天飞机?加州科学中心刚完成了它的垂直堆叠,他们叫“Go for Stack”。
女:对!就是把退役的航天飞机轨道器,还有两个固体火箭助推器、一个巨大的橙色外部燃料箱,像搭积木一样垂直拼在一起,形成准备发射的姿态。这还是第一次在 NASA 设施以外的地方干成这件事。我最初看新闻标题,还以为是给航天飞机装了个二十层楼高的显示屏。
男:哈哈,那也太赛博朋克了。奋进号以前是放在地上展览的,大家可以走到机翼底下。现在是发射构型,人可以站在固体助推器的喷管正下方抬头看。有位参观过所有三架退役航天飞机的人说,现在它们展示了三种不同的工作模式:奋进号是准备发射,亚特兰蒂斯号在肯尼迪航天中心是轨道飞行姿态,发现号在史密森尼是着陆姿态。想要感受人类太空飞行的完整周期,得看完这三架。
女:这赋予了那些冰冷的引擎和防热瓦一种叙事感。虽然有人说航天飞机项目是个巨大失误,间接证明了 SpaceX 可重复使用火箭路线的价值。但当你真的站在那个巨物脚下,仰头看着那些经历过太空灼烧的痕迹,那种感受,恐怕不是任何成本分析能替代的。
男:就像我们前面聊到的,AI 可以精确描述穿越大气层的物理过程,但它说不出抬头仰望时后脖颈发凉的那种感觉。这大概就是数据和生活的区别。
女:好了,今天我们从助眠、隐私、AI 与灵魂,一路聊到了反向编译、硬件集群和航天飞机的最后安息。非常感谢阿迪带来这么多有趣的信息。
男:谢谢大家听我们闲聊。
女:如果你喜欢我们的节目,记得在你的泛用型播客客户端里搜索并订阅 Hacker Podcast。无论你是在通勤、工作摸鱼,还是正准备睡觉,我们都准时在这里。我们下期再见。
男:拜拜。
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。