

























💡 站外导读:传统3D内容创作流程繁琐,需要专业美术团队耗费大量时间建模、贴图、优化,成本高昂且周期漫长。随着AIGC浪潮席卷,文本生成图像、代码乃至视频的技术快速迭代,但直接生成可交互的3D世界仍是行业空白。Meta最新发布的WorldGen系统,首次实现从一句文本描述到完整可导航3D场景的端到端生成,为游戏开发、虚拟现实和数字孪生等领域带来颠覆性突破,标志着3D内容生产正式进入AI驱动的新纪元。
WorldGen 是 Meta 最新推出的先进端到端系统,能通过一段文本提示生成可交互、可导航的 3D 世界。用户只需输入简单的描述,如“中世纪村庄”或“火星基地”,系统能在几分钟内生成一个风格一致、结构合理的虚拟世界,覆盖 50×50 米的区域。WorldGen基于程序化推理、扩散模型和面向对象的场景分解,生成的 3D 世界可以直接兼容主流游戏引擎(如 Unity 和 Unreal),无需额外转换。WorldGen 的出现有望改变传统 3D 内容创作的复杂流程,推动内容创作走向大众化。
程序化布局生成:使用大型语言模型(LLM)将文本提示转换为程序化生成的参数,生成场景的粗略布局(blockout),包括地形、空间分区和主要结构。
图像到 3D 重建:基于生成的布局,通过深度条件生成参考图像,用图像到 3D 的扩散模型重建整个场景的几何结构。
场景分解:将生成的单一 3D 网格分解为多个独立的对象(如建筑、树木等),便于后续的细化和编辑。
对象增强:对每个对象进行单独的图像增强、几何细化和纹理生成,提升细节和视觉效果。
导航网格约束:在生成过程中,导航网格(navmesh)确保场景的可通行性,使角色能在场景中自由移动。
多阶段优化:整个流程分为规划、重建、分解和增强四个阶段,逐步提升生成世界的质量和功能性。
WorldGen的发布绝非简单的技术迭代,而是AIGC向三维空间深度渗透的关键里程碑。它将程序化生成、扩散模型与场景理解融为一体,解决了此前3D生成“可看不可玩”的核心痛点。从产业视角看,这直接冲击了游戏和影视行业依赖昂贵手工建模的传统流水线,未来独立开发者用自然语言描述就能快速原型化游戏关卡,教育机构能低成本构建历史模拟场景。更深远的是,它为元宇宙和数字孪生提供了低成本内容供给方案,与苹果Vision Pro等空间计算设备形成技术呼应。但需注意,当前50×50米的生成规模仍属试验阶段,物体精细度和物理模拟的真实性有待验证。Meta此举既是向开发者生态抛出的橄榄枝,也是在AIGC军备竞赛中确立3D生成标准话语权的战略布局,值得所有数字内容从业者高度关注。
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。