惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

博客园 - 三生石上(FineUI控件)
T
Threat Research - Cisco Blogs
月光博客
月光博客
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
爱范儿
爱范儿
Hugging Face - Blog
Hugging Face - Blog
腾讯CDC
云风的 BLOG
云风的 BLOG
D
Docker
罗磊的独立博客
U
Unit 42
博客园 - 聂微东
人人都是产品经理
人人都是产品经理
P
Proofpoint News Feed
博客园 - Franky
Apple Machine Learning Research
Apple Machine Learning Research
MyScale Blog
MyScale Blog
B
Blog RSS Feed
美团技术团队
J
Java Code Geeks
S
Securelist
Cyberwarzone
Cyberwarzone
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
NISL@THU
NISL@THU
Security Latest
Security Latest
Recent Commits to openclaw:main
Recent Commits to openclaw:main
Recorded Future
Recorded Future
Hacker News - Newest:
Hacker News - Newest: "LLM"
L
LINUX DO - 热门话题
Recent Announcements
Recent Announcements
Last Week in AI
Last Week in AI
A
About on SuperTechFans
MongoDB | Blog
MongoDB | Blog
Spread Privacy
Spread Privacy
T
Tenable Blog
I
Intezer
N
News | PayPal Newsroom
大猫的无限游戏
大猫的无限游戏
A
Arctic Wolf
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
V
V2EX - 技术
S
Schneier on Security
S
SegmentFault 最新的问题
Latest news
Latest news
宝玉的分享
宝玉的分享
V
Visual Studio Blog
V
V2EX
T
Tor Project blog
C
Comments on: Blog

News Hacker | 极客洞察

基于格密码入门:ML-KEM、NTT 与 PQC 部署 United 767因蓝牙名“bomb”返航:安保乌龙与政治口号争议 Coding agents“背压”争议:hooks、自动测试与人审成本 度假时胰岛素泵故障:闭环失灵、客服失能引争议 Roto:Rust 编译型脚本语言的用途、性能与设计争议 macOS 终端里的共振呼吸 CLI:零依赖纯 Python,兼谈 SVT 与 HRV 训练 AV2 解码器:5倍复杂度、专利池与 C/ASM 之争 伦敦免费屋顶露台:公共开放却层层设限 网站规范清单引争议:.well-known、security.txt 与 AI/Agent 标准 埃及伊蚊联想学习后把 DEET 当诱饵 Racket 9.2 发布:可定制语言、教学传统与生态取舍 别用 AI 把 rsync 改烂 AV2 v1.0 定稿:1fps 参考编码,硬件普及或到2030,支持多流与透明视频 Dusklight:GC《黄昏公主》反编译后原生移植,支持 Android Cheese Paper:面向 fiction 写作的编辑器,类 Scrivener/Manuskript Shantell Sans:可调正式度的手写字体,超越 Comic Sans AI时代平台易造难获客:分发与营销才是难关 wolfSSL 发布面向嵌入式的 wolfCOSE:零动态分配 C 实现引发栈内存争议 微软削弱永久离线授权产品功能 朝鲜王朝500年宫廷征兆做成 observability dashboard ACME/CT防不住的TLS合法监听重建 领域知识才是软件护城河?LLM 能否替代专家引争论 Jef Raskin:Mac 奠基者、Canon Cat 之父与被误解的鼠标 沙漠里的海贝壳:玩梗、AI 鉴定争议与 GitHub 博客 WWI/WWII混凝土船试验:pykrete、ferro-cement与Habakkuk Intel 8087 微码:寄存器交换、80-bit 浮点与 RISC/VLIW 对比 EY网络安全报告被指充满AI幻觉,评论区批审稿失守、四大降质 欧盟主权云争议:VPS化、US司法与投资缺口 Zig ELF 链接器进展:增量链接提速、LLVM 去依赖、Bun 争议 霍尔木兹危机推高集装箱运费,评论聚焦空箱回流与二阶效应 OpenRouter 融资1.13亿美元:LLM路由、费用上限与代理层争议 两神经元骑车:PID争议、逻辑门与自驾脑洞 Werner Herzog访谈:倾听术与洛杉矶 vs 纽约之争 Ookla 的 Speedtest/Downdetector 以 12 亿美元卖给 Accenture CPU/GPU 的 floor/ceil、denormals 与 IEEE 754 争议 AI道德批判者真成局外人?评论区称多数人其实不爱AI AI替代引发工作哀伤:AIRD、身份危机与怒火反弹 Voxel Space:Comanche 式 height map 地形渲染与 overdraw 优化 Godot 里的 Navier-Stokes 流体模拟教程:易懂但被追问 timestep 与守恒 Helios:英国任意地址的插电式太阳能发电估算 IXI自动对焦眼镜接近替代多焦点镜片 Vibe Coding 只出代码,不算工程 Anthropic估值反超OpenAI,Claude/Codex开发者争论升温 Openrsync:OpenBSD版rsync的安全依赖、GPL争议与AI焦虑 Pandoc 模板:Markdown 一稿多出论文、Word、多格式输出 教宗首份通谕批技术救世主义,HN争论AI治理权与Thiel末世论 蝗虫去哪了:繁殖河谷被开垦后消失 美国科研经费可随时取消:政治化与人才外流 德皇威廉二世与“平庸者”历史观:伟人、结构与20世纪 Zig 重做构建系统:编译速度与‘手搓’定位争论 丹麦养老金因治理和估值风险剔除 SpaceX rsync 3.4.3 疑因 130 个 Claude 协作提交引发回归 软盘保存:清洁、镜像与旧数据抢救 algebraic effects 争议:Bluefin、OCaml 5、Effect-ts 与 function coloring Perry 用 SWC+LLVM 直编 TypeScript,评论质疑 runtime、GC 和 AI 代码 日本石脑油短缺冲击化工供应链,Calbee 黑白包装引争议 白宫拟让政治任命官员终审科研拨款,引发科学政治化争议 Tiny-vLLM:C++/CUDA LLM 推理引擎,README 讲得像教材 PrusaSlicer开源ColorMix:多色打印对标Bambu,社区早有OrcaSlicer方案 Dickover:烦人覆盖弹窗的新叫法 Snowboard Kids 2 已100%反编译,利于移植和 Mod AI时代:人类价值不该按产出来算 MCP未死:企业控制平面与CLI/skills之争 伪托惠灵顿公爵书信:年代、署名与史实都对不上 EV 反人类设计清单:触屏化、玻璃顶、电子门把手争议 按当前天气切换的 Rothko 风格天气图 TV Explorer:免费在线 TV/IPTV 浏览器,带字幕、分享和死源扫描 Shift 免费清洁换家庭数据训练家用机器人 加州通过《Protect Our Games Act》,豁免条款引发停服争议 CodeView:浏览器里渲染超大 diff,语义 diff 才是下一步 Liquid AI 发布 8B-A1B MoE:小模型、本地部署与 Ollama 争议 SQLite + Litestream 做耐久工作流遭质疑,Temporal/DBOS 成替代方案 Mistral巴黎峰会:小模型落后,欧盟本地部署成主线 Robinhood开放AI agent炒股:散户收割、LLM不擅长生成alpha CAPTCHA仍能识别AI代理,但更依赖指纹与遥测 开源项目被滥用成钓鱼邮件入口 AI“死经济”争论:裁员吞噬消费、工作意义与政府接管 丹麦养老金因“灾难性治理”拉黑 SpaceX:Musk 控制权、指数纳入与估值争议 Bijou64:首字节可知长度的 canonical varint GTA 6 开发者组工会,游戏薪资为何低于 big tech Framework 12对比MacBook Neo:为可升级性多付60%值不值 Headway 心理治疗强制刷脸续诊:控药核验与隐私争议 古罗马高密度公寓:insulae、火灾风险与高层贫居 AI时代的专家价值:验证、经验与大学角色 退休离开 Tech:AI、生产力压力与离线生活 本地 Git remote:共享、隔离与 GitHub 误解 AI只该做琐事,别替代人情与创作 AISlop:检测 AI 生成代码坏味道的多语言 CLI 英国低价值采购系统逼企业月报“无交易” 郁金香狂热:泡沫神话与理性争议 用 LLM 写代码,也要让人比模型更累 AI会重演前端“失去的十年”吗? AI 编程提产却压缩思考,工程质量与协作承压 Cloudflare大规模AI代码审查:本地Hook、CI争议与长推理卡顿 500K AI电影“戛纳首映”被质疑只是公关噱头 8×H200实时LLM推理3k tok/s:‘标准GPU’争议与大模型扩展性 防水夹克演化:材料回潮、帽兜变迁与AI争议 意大利人与荷兰人教学时共享手势本能 Claude Code 隐藏配置:文档难找、版本快变、技巧易碎 大众汽车用 client assertion 阻断 Home Assistant 接入
£200 将 Tesla V100 SXM2 数据中心 GPU 装进游戏 PC:prefill、改装与二手算力争论
2026-05-31 · via News Hacker | 极客洞察

🎯 讨论背景

这篇帖子讲的是把一块 Tesla V100 SXM2(Nvidia 的数据中心 GPU 模块)通过适配器装进家用游戏主机,整套只花了约 £200。原文卖点不是游戏性能,而是用低价换来大容量 HBM2e 显存和很高的内存带宽,拿来跑本地 LLM(大语言模型)更划算。评论把讨论延伸到 agentic coding、prefill、tok/s 这些推理指标,指出真正耗时的往往是长上下文预处理而不是后续生成。大家还顺带比较了 HGX/DGX(Nvidia 的服务器 GPU 平台)、AMD MI250X(AMD 的数据中心加速卡)以及这些旧数据中心卡在二手市场的命运。

📌 讨论焦点

性价比与二手算力复用

很多评论把这次改装看成“二手算力套利”。一块曾经价值数千到上万美元的 Tesla V100 数据中心卡,现在只要 £200 左右,若目标是本地 LLM 推理,按 token 成本看确实很夸张。有人因此直接被说服去买二手 DC 卡,也有人担心这些硬件最终会因为厂商淘汰、企业报废而进入垃圾场。另有观点认为,真正的障碍不是卡本身便宜,而是把它接入普通 PC 之后还要处理驱动、供电、风道和兼容性。

[来源1] [来源2] [来源3] [来源4] [来源5]

prefill 才是隐藏瓶颈

讨论很快从“每秒能出多少 token”转向 prefill。有人指出,30 tok/s 对 chat 和 agentic coding 未必差,但长上下文一次性塞进去时,prefill 才是最拖时间的部分。用 100K tokens、150 tok/s 的估算,单是预处理就要十多分钟,交互式工作流会被这一段等待感拖垮。也有人把这个问题类比到 Mac 本地 LLM:高带宽内存很有用,但算力不足会让生成前的等待变得很明显。

[来源1] [来源2]

服务器平台与规格纠错

有人纠正原文把 V100 SXM2 说成 DGX class 的说法,指出它更接近 HGX class,而且 SXM2 和 SXM4 这两代模块、以及 HGX riser 和 NVSwitch fabric 的关系很关键。评论还顺带解释了 A100 80GB 这类更晚期卡如何在 8 卡平台上形成 640GB 共享 HBM2e 和更高带宽。另一条线则提到 AMD MI250X 的 128GB HBM2E 和 3TB/s 带宽很诱人,但 OAM socket 使它很难像普通 PCIe 卡那样直接塞进桌面主板。整体上,大家在强调:服务器卡的“便宜”往往建立在特定平台前提之上。

[来源1] [来源2] [来源3]

改装门槛与散热

不少人承认这很酷,但也提醒这不是普通玩家能轻松复刻的项目。想把数据中心卡装进家用机,往往要碰 driver、kernel、ACPI、转接板和 fan header,任何一项不匹配都可能让整套系统变成调试工程。散热也是大问题,有人提到可以上 waterblock、泵和 radiator 来压住噪音,但这又把原本的“£200 捡便宜”变成一整套定制水冷。评论里的共识是:能力/价格比惊人,但工程复杂度也同样惊人。

[来源1] [来源2]

AI 写作风格争议

一部分评论几乎不谈硬件,而是先对文章措辞下手,认为整篇写法很像 LLM 生成,尤其是那种“X is Y. Z is Y.”的重复句式。有人觉得这会让原本很棒的技术文章变得不真诚,也有人反过来认为,抱怨写作风格比文章本身更烦。随后讨论又扩展到“这种腔调到底是不是 LLM 学来的”,有人说更像后期 instruction tuning 和营销文案的产物,而不是纯粹的网页预训练文本。也有人替作者辩护,认为个人博客本来就不该被统一成同一种“人类必须写得很朴素”的标准。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10] [来源11]

折旧、报废与 AI 泡沫

还有一条更宏观的线索,是对数据中心 GPU 折旧速度和 AI 泡沫的猜测。评论回顾了 V100 当年接近 $10,000 的价格,又对比现在的 RTX 6000 Pro(面向专业工作站的高端显卡)和 5090 级别卡,认为 Nvidia 通过 VRAM 分层做市场细分非常成功。有人甚至预测,今天为 AI 花出去的巨额数据中心投入,几年后可能会像旧服务器一样被当废铁处理。与此同时,也有人担心厂商会主动销毁 GPU 以防 model weights 泄漏,这会进一步影响二手流通。

[来源1] [来源2] [来源3] [来源4] [来源5]

📚 术语解释

prefill: 模型在生成回答前先处理全部输入上下文的阶段,长上下文时最耗时。

tok/s: tokens per second,衡量模型生成速度的吞吐指标。

HBM2e: 高带宽显存,常见于数据中心 GPU,特点是容量大、带宽高。

SXM2: Nvidia 的服务器 GPU 模块形态,不是普通 PCIe 插卡。

MI250X: AMD 的数据中心加速卡,特点是大容量 HBM2E 和很高带宽。

NVSwitch: Nvidia 的多 GPU 互联交换 fabric,用于把多卡带宽和显存池化。