惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

F
Fox-IT International blog
Recent Announcements
Recent Announcements
D
Docker
IT之家
IT之家
B
Blog
Jina AI
Jina AI
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
博客园 - 【当耐特】
Google DeepMind News
Google DeepMind News
F
Fortinet All Blogs
量子位
C
Check Point Blog
Microsoft Azure Blog
Microsoft Azure Blog
罗磊的独立博客
博客园 - 司徒正美
李成银的技术随笔
美团技术团队
Blog — PlanetScale
Blog — PlanetScale
雷峰网
雷峰网
The GitHub Blog
The GitHub Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
J
Java Code Geeks
T
The Blog of Author Tim Ferriss
酷 壳 – CoolShell
酷 壳 – CoolShell
MongoDB | Blog
MongoDB | Blog
P
Proofpoint News Feed
L
LangChain Blog
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
Y
Y Combinator Blog
大猫的无限游戏
大猫的无限游戏
有赞技术团队
有赞技术团队
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
V
Visual Studio Blog
T
Tailwind CSS Blog
H
Help Net Security
Engineering at Meta
Engineering at Meta
小众软件
小众软件
B
Blog RSS Feed
Stack Overflow Blog
Stack Overflow Blog
月光博客
月光博客
M
Microsoft Research Blog - Microsoft Research
宝玉的分享
宝玉的分享
人人都是产品经理
人人都是产品经理
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
GbyAI
GbyAI
H
Hackread – Cybersecurity News, Data Breaches, AI and More
Last Week in AI
Last Week in AI
Martin Fowler
Martin Fowler
Stack Overflow Blog
Stack Overflow Blog

爱范儿

豆包的人格化设计已经成功到了渗透进流行文化的程度,它不再是一个工具,而是一种「关系」的想象。 还可以破解家用电器,释放C盘空间 面向世界,面向未来 早报|华为公布韬定律,Mate 90有望搭载更强芯片/宇树科技上会估值420亿/DeepSeek登顶全球调用榜 为什么必须做中国版「Claude Code」? 国产闭环,框架国产,芯片国产,模型国产,方法论自主 多给一点冗余,说不定真能让通勤路变得有些不一样。 早报|国产手机618前集体降价/微信解释「2 分钟内可撤回」/买智能手表以后不能再刷医保 它还说「何以览胜,唯有泰山」。 2026 年的旗舰耳机,不能只是耳机 要成为 OpenAI 最赚钱的产品 卖到莱茵河流域去。 一台「平平无奇」的好手机 早报|雷军:手机越来越贵,建议现在就换/特斯拉监督版FSD将入华/努比亚总裁:豆包手机真可以订餐厅 跑车级 SUV,首先得是一台好用的 SUV。 「另一个我」,可能比你想象的更早上线 人生如歌,无须耳朵,且用心听。 全功能GPU,全场景AI算力 早报|448元,iPhone绝版配件回归/Meta用员工键鼠数据训练AI,扎克伯格:外包不够聪明/GoPro考虑出售或合并 用规模为未来铺路。 硬件扎实,系统优化。 这次 iQOO 给玩家的,是 iQOO15T 和 iQOO Pad6 Pro 共同构成的一套兼顾方案——竞技和沉浸,可以在同一个生态里完成。 给 Gemini 完整的一生 vivo S60 系列:今天,把星星海握在手里 早报|Google发布一大波AI更新/华为五一假期领跑中国手机市场/小米YU7 GT刷新纽北纪录 新的 Gemini 3.5、Agent 产品、视频模型都来了 在极氪 009 上,你也能面对面聊天了。 让 PC 真正开始「理解」人 6 月 9 日,不见不散 复古家族又添一员。 一代经典落幕。 早报|苹果开启WWDC邀请,将公布苹果AI新进展/问界M9设计师点赞理想L9内饰/国家反诈中心App上线「AI内容鉴定」 把旗舰制程下放到入门产品上,英特尔这是想开了? 用自己的信誉为车辆品质托底,是魏建军决战高端新能源的决心。 明面上算力是最关键要素?暗地里,其实是数据…… 你今天🔥Token 了吗 昊铂需要让产品被更多人知道。 但 AI 真的有「摄影眼」吗? 早报|马耳他为全民买单ChatGPT会员/卢伟冰预判年底国产直板旗舰破万元/曝苹果新Siri聊天记录可自动删除 早报|华为Mate X7官方降价1000元/Anthropic估值超越OpenAI/国行Switch正式停服 好就是大。 把家装进车里,把纯电融进增程。 鸿蒙智行的首款 MPV,献给预算充足的老板们。 持币观望,是目前的最佳选择 一场针对 AI 的大型猎巫 腾讯的 AI 王牌是微信 早报|OpenAI或将起诉苹果/iPhone 17 Pro官降1000元/影石CEO回应Luna定价贵:5299是美国价格 AI 人机交互,迎来十字路口 锐意向前。 液压底盘,让方程豹告别千斤顶。 AI 时代的价值坐标正在被重建。 让人愿意戴,并且愿意长时间戴,这就是智能穿戴产品最重要的优势。 早报|元宝推出一键总结微信聊天/曝苹果探索将AI Agent引入App Store/小米 17 Max官宣本月发布 管 agent 要像管人一样,懂得「驭臣之术」…… 高刷、高刷,还是高刷 Y600 Pro 可能是 vivo 今年最重要的一款产品。它不一定最贵、不一定最亮眼,但它代表了 vivo 这家公司对入门级市场的一次重新理解 —— 这个档位的用户要的是什么,不再由旗舰来定义。 让 Android Auto 和 Google Built-in 更适应不同车型和不同屏幕,同时继续与苹果 CarPlay 竞争。 大疆 Pocket 4P 上手体验:欲穷千里目,更多摄像头 拳打 iPhone,脚踢 Galaxy 比 1000 马力更敏感的,是重量。 设备一直在变,但芯片作为中枢的地位不变。 给 Gemini 不止一个身体 一个行业的终结 早报|Android 17转型智能系统,深度整合AI/腾讯:微信已读和访客功能「已焊死」,不会开发/李想:理想自研芯片不是跟风 用算力对抗经验。 我将以高达形态出击! Google 的大招是图像、文本、视频轮着来 汽车早已不仅仅是一种交通工具。 想要什么格式就什么格式 YU7 GT 秀肌肉、提品牌、战全球;YU7「青春版」 降门槛、保销量、拼刺刀。 早报|曝苹果新Vision Pro研发已暂停,团队分拆/黄仁勋:AI让所有人站上同一条起跑线/微信状态将推出「访客记录」 失去车顶,不失下压力。 重点是:人无我有。 最好的 AI 载体,需要一个 AIOS 全球 AI 顶会,快成中国卷王的专场了。 去读书,更去读那些真正有作者的书。 你拿 AI 写代码,AI 给你种木马 AI 时代最反焦虑的演讲 AI 时代,编程能力更珍贵了 早报|微信灰测「组合支付」功能/苹果或重新设计macOS27「液态玻璃」/哈啰回应员工脚踩青桔美团 早报|中汽协辟谣8家车企锁电被约谈/曝苹果正在研发全息iPhone/李想回应理想L9四年换代:汽车不是手机 车市又将血雨腥风。 快不是新闻,一直快才是。 理想内饰的新阶段,由 L9 Livis 开始。 让普通家庭跨入高品质出行的门槛。 当匠心遇上算力。 淘汰赛的进程正在加速。有些品牌注定会在这个周期里倒下。 一个不懂死亡的小男孩,攒了 15 块钱,想给去世的奶奶烧一部手机 三排六座,定位高于雷克萨斯 RZ。 早报|小米增程SUV 曝光,但不叫YU9/苹果与英特尔达成初步芯片代工协议/Cloudflare用AI裁掉20%员工 苹果的第一款 AI 穿戴产品,将是 AirPods。 AI 硬件必须先沿着「手机」的路走出来,然后才有资格谈「革手机的命」 一款车盘活整个广汽新能源。 你还发现了 AI 的哪些口癖 苹果 AI 硬件最激进的赌注,撞上了全球最严的隐私墙。 如果连品牌自身都要留一条退路,消费者又凭什么要坚定地选择你? 早报|曝苹果考虑取消入门款MacBook Neo/理想高管谈MEGA设计争议:不是失败/千问PC端上线AI语音输入 「请稍等片刻」 聊着天,就把视频做了 AI 时代的新「键盘」长这样
一行链接,交付世界
2026-04-15 · via 爱范儿

拍一圈照片,就能生成一个可交互的 3D 世界,已经不是什么新鲜话题了。但问题是如何把一个大世界塞进普通人的手机浏览器里。

就在刚刚,李飞飞旗下 AI 世界模型公司 World Labs 发布并开源了一个最新成果:Spark 2.0。

这个专为网页端设计的动态 3D 高斯点云(3DGS)渲染引擎,让在任何设备的浏览器里流畅运行上亿粒子的超大 3D 场景,开始逐渐成为现实。

为什么把亿级粒子的 3D 世界塞进手机这么难?

你可能听说过「3D Gaussian Splatting」,简称 3DGS。用一句话解释,它是一种把真实场景变成 3D 可交互内容的技术,不用建模,拍一圈照片就能生成。

和传统 3D 建模用三角形面片不同,3DGS 用的是数百万个半透明的彩色椭球体,每一个叫做一个「splat」(泼溅体/斑点)。

▲左侧使用纹理映射三角网格,右侧使用高斯斑点,对同一对象进行渲染。

每一个 splat 并不是一个简单的点,而是一个有完整「人格」的椭球体。它记录着自己在空间中的位置、三条轴的半径长短、朝向角度、RGB 颜色值,以及透明度。

最关键的是透明度这个属性。它决定了这个 splat 在叠加时对周围的影响权重。如果把单个 splat 的空间密度画出来,你会得到一条高斯曲线:中心最实,向外逐渐虚化,边缘自然消融进背景里。

正是这种「软边界」的叠加方式,让数百万个 splat 堆在一起之后,能呈现出砖墙的颗粒感、树叶的透光感、玻璃的反射,而不是一堆硬边三角形拼出来的塑料质感。

效果好,信息量也大。一个高质量的 3DGS 扫描场景,动辄几千万个 splat,文件体积轻松突破 1 GB。

这就带来了一个棘手的问题:普通手机能流畅渲染的上限大概是 100 万到 500 万个 splat,比动辄 4000 万的高质量扫描差了整整一个数量级。

现有渲染器也没法把多个扫描对象放在同一个场景里正确渲染,要么只能单独渲染一个,要么排序乱掉、对象「贴在」彼此表面上,看起来一团糟。

于是乎,Spark 应运而生。根据官方博客介绍,Spark 最开始是 World Labs 自己用的内部工具。World Labs 需要在网页上展示 3DGS 生成的世界,但市面上的渲染器都有硬伤,有的只能渲染单个对象,有的依赖 WebGPU(很多设备还不支持),有的不支持动态动画。

几番对比下来,他们决定干脆自己造一个。

他们选择的技术底座是 THREE.js,Web 上最流行的 3D 框架,运行在 WebGL2 之上,几乎覆盖所有现代设备。核心渲染逻辑分三步走,先在 GPU 上生成跨对象的全局 splat 列表,再统一按从远到近排序,最后一次性渲染完毕。

「全局排序」听起来平平无奇,实则是让多个 3DGS 对象共存于同一场景、不互相穿模的关键所在。Spark 还在此基础上开放了一套 GPU 处理流水线,用户可以对每个 splat 做重新上色、透明度调整、动态动画等自定义操作,用 GLSL 编写,或者像 Blender 那样连节点图来实现。

1.0 版本解决了多对象渲染的问题,但 4000 万 splat 的场景依然是一道跨不过去的坎。这才有了 Spark 2.0。

让设备永远只渲染「够用」的信息量

Spark 2.0 的核心是三项技术的组合,LoD 细节层级、渐进式流式加载和虚拟内存管理。单独拿出来看,每一项都有先例可循,但三者合力,才撑起了在手机浏览器里流畅渲染亿级 splat 世界的能力。

1. 连续 LoD 树:把好钢用在刀刃上

LoD(Level of Detail)在游戏圈早已是成熟概念。近处的树用几千个三角形,远处的树只留几十个,按需分配,省算力。Unreal Engine 的 Nanite 系统也是这个思路,把三角形细节和视距挂钩,自动缩放。

Spark 2.0 把同样的逻辑搬到了 splat 上,做得更彻底。

离散切换几个版本容易产生画面「跳变」,Spark 的做法是构建一棵完整的「连续 LoD 树」,每个内部节点都是其子节点 splat 融合后的近似版本,层层向上汇聚,最终到达根节点,也就是整个场景最粗粒度的单一 splat。

渲染时,系统根据当前视角在这棵树上动态划一刀,靠近视角的区域取底层细节,远处取高层粗粒度。

整个过程受一个固定的 splat 预算约束,移动端约 50 万,桌面端约 250 万。场景里总共有多少 splat 都无所谓,实际送上 GPU 的数量始终稳定在预算范围内,帧率自然稳了。

在此之上,Spark 还引入了「注视点渲染」(Foveated Rendering),把更多预算集中分配给你正在看的方向,边缘和背后的区域细节自动收窄。这个效果放在 VR 设备上尤其直观,通常需要眼动追踪才能实现,Spark 用固定锥形区域近似模拟,同样奏效。

2. 全新 .RAD 格式:像刷短视频一样「流式」加载

渲染效率的问题解决了,传输效率的问题同样棘手。现有的 3DGS 文件格式有两个:.PLY 和 .SPZ。前者未压缩,10M splat 高达 2.3 GB,虽然可以边下边显示,但体积实在吃不消。

后者用列式存储加 Gzip 压缩,同等数据量压缩到 200-250 MB,代价是必须等整个文件下载完才能显示,因为每个 splat 的属性分散在文件各处,缺了哪一段都拼不出完整内容。

为了鱼和熊掌兼得,Spark 2.0 设计了新格式 .RAD(RADiance fields)。它把 splat 数据切成每块 64K 个 splat 的独立小块,分别压缩,并在文件头中记录所有块的字节偏移位置,支持随机访问任意一块。

第一块永远是整个场景最粗粒度的 64K 个 splat,下载完毕后场景轮廓立刻可见。此后系统根据视角判断哪些区域最需要细化,优先拉取对应的数据块,画面从模糊逐渐推演出细节。3 个并行的 Web Worker 线程在后台同步拉取和解码,你走到哪,细节就跟到哪。

3. GPU 虚拟内存:在有限显存里装下无限空间

流式加载解决了带宽的问题,但 GPU 内存的硬上限依旧是个难啃的骨头。移动端浏览器对显存有严格约束,塞不下整个 4000 万 splat 的场景。

Spark 2.0 借鉴了操作系统的虚拟内存机制来应对这个问题。

系统会在 GPU 上分配一个固定内存池,上限 1600 万个 splat,用一张页表记录哪些 .RAD 数据块当前驻留在 GPU 上。需要渲染某个区

域时调入对应的块,内存满了就按最久未使用的顺序换出旧块。

得益于这一机制,不同来源的 3DGS 场景可以共享同一个内存池。理论上,只要网速跟得上,无数个独立的扫描场景可以无缝拼接成一个无限大的世界。

一行链接,交付世界

Spark 2.0 发布之后,李飞飞也第一时间公开表态,「Spark 2.0 现在可以在任何设备上流畅播放超过 1 亿个 splat 对象,非常荣幸能为基于 Web 的 3DGS 渲染开源生态系统做出贡献。」

她没有着重强调「做到了什么」,而是把重点放在「为开源社区贡献了什么」。这个表述耐人寻味。3DGS 渲染是一个仍在快速演进的领域,单靠一家公司推不动整个生态,开源才是加速这件事的正确姿势。

从已有的落地案例来看,开发者确实在用 Spark 做各种方向的尝试。Webby 奖得主 James C. Kane 独立开发了一款名为 Starspeed 的多人宇宙飞船射击游戏。

整个游戏场景由超过 1 亿个 splat 构建,附带 10 首合成波风格原声音乐,全部通过浏览器以 .RAD 格式流式加载,惊艳的科幻环境可以直接在网页里跑起来。

▲附体验地址🔗:https://starspeed.game/

艺术方向则有 Hugues Bruyère 的《Dormant Memories》。他是互动体验工作室 Dpt. 的联合创始人,这个系列把真实地点的 3D 扫描和想象中的空间并置在一起,做成可探索的交互环境。现实与虚构之间的边界在 splat 颗粒感里变得模糊,倒是意外地切题。

▲ 附体验地址🔗:https://smallfly.com/dormant_memories/

来自 Hololive 空间信息技术部门的藤原龍则用 Spark 渲染了多个大型真实捕获场景,单场景最高达到 4000 万 splat,在智能手机、Quest 和 Vision Pro 上均能流畅运行。

▲附体验地址🔗:https://works.lilea.net/spark/

这些来自开发者的多元化尝试,充分证明了 Spark 2.0 在不同设备和应用场景下的强悍实力。但这仅仅是故事的一半。

对于一家致力于打造「AI 世界模型」的公司而言,李飞飞团队的野心绝不止于提供一个开源的渲染工具。如果说 Spark 2.0 解决了「如何流畅观看」的最后一步交付难题,那么如何低门槛地创造这些 3D 内容,才是他们真正的杀手锏。

Spark 和 World Labs 的创作平台 Marble 深度绑定,用一行文字或一张图片在 Marble 里生成 3D 世界,用 Marble Studio 把多个世界拼合成更大的场景,再用 Spark 渲染成可分享的网页体验,这条链路目前已经跑通。

技术进步往往以「强无止境」为最高原则,但有时「够用」或许才是最合适。Spark 2.0 讲的正是这么一个故事。

而让设备在任何时候只渲染「刚好够用」的 splat,这个想法本身并不新鲜,但把它落地到网页端的渲染上,还要同时兼容手机浏览器和 Quest,每一步都是实打实的工程问题。

当 AI 能生成无限大的 3D 世界时,我们用什么载体把它交付给每一个普通人?现在,World Labs 给出的最新答案是一个网页链接。

附上博客地址:

https://www.worldlabs.ai/blog/spark-2.0