惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

D
Docker
Microsoft Azure Blog
Microsoft Azure Blog
云风的 BLOG
云风的 BLOG
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
L
LangChain Blog
P
Privacy & Cybersecurity Law Blog
Hugging Face - Blog
Hugging Face - Blog
C
CXSECURITY Database RSS Feed - CXSecurity.com
大猫的无限游戏
大猫的无限游戏
Cyberwarzone
Cyberwarzone
The Register - Security
The Register - Security
Stack Overflow Blog
Stack Overflow Blog
A
Arctic Wolf
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
T
Threatpost
The GitHub Blog
The GitHub Blog
P
Privacy International News Feed
WordPress大学
WordPress大学
U
Unit 42
S
Securelist
T
The Exploit Database - CXSecurity.com
C
Cyber Attacks, Cyber Crime and Cyber Security
P
Proofpoint News Feed
Latest news
Latest news
Hacker News: Ask HN
Hacker News: Ask HN
小众软件
小众软件
Know Your Adversary
Know Your Adversary
The Cloudflare Blog
V
Vulnerabilities – Threatpost
The Hacker News
The Hacker News
Scott Helme
Scott Helme
有赞技术团队
有赞技术团队
Security Latest
Security Latest
Google DeepMind News
Google DeepMind News
Application and Cybersecurity Blog
Application and Cybersecurity Blog
Simon Willison's Weblog
Simon Willison's Weblog
博客园 - Franky
Y
Y Combinator Blog
博客园 - 叶小钗
Security Archives - TechRepublic
Security Archives - TechRepublic
Google DeepMind News
Google DeepMind News
N
Netflix TechBlog - Medium
S
Secure Thoughts
T
Threat Research - Cisco Blogs
aimingoo的专栏
aimingoo的专栏
S
SegmentFault 最新的问题
Microsoft Security Blog
Microsoft Security Blog
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
博客园 - 司徒正美
M
MIT News - Artificial intelligence

Prompt 语宙

kimi-thinking-preview – 月之暗面推出的多模态思考模型 pdf-craft – 开源 PDF 转 Markdown 工具 UltraMem – 字节豆包大模型团队推出的全新超稀疏模型架构 EasyControl – Tiamat AI 联合上海科大等开源的图像生成控制框架 GaussianCity – 南洋理工大学 S-Lab 团队推出的 3D 城市生成框架 X-Prompt – 用于多模态视频目标分割的通用框架 豆包大模型1.5 – 字节跳动推出的最新版大模型 GaussianAnything – 南洋理工 S-Lab 和上海 AI Lab 等推出的 3D 生成框架 Cube 3D – Roblox 推出的 AI 3D 生成模型 OpenMath-Nemotron – 英伟达开源的数学推理系列模型 MAI Transcribe-1.5 – 微软 MAI 推出的语音转文本模型 Seed1.5-Embedding – 字节跳动 Seed 团队推出的向量模型 2026世界杯人机大战引爆!联想携手DeepSeek等顶尖AI大模型,对战亿万球迷预测冠军 高考公平守护战!豆包、文心等主流大模型集体禁用拍题功能 ShotAdapter – Adobe联合UIUC推出的多镜头视频生成框架 Devstral – Mistral AI联合All Hands AI开源的编程专用AI模型 MMaDA – 字节联合普林斯顿大学等推出的多模态扩散模型 Software Copyright Materials Skill – 开源软著资料生成Skill Dulus – 开源的 CLI AI Agent,可驱动多模型工具调用 Reasonix – 专为 DeepSeek 推出的开源终端编程 Agent Mega-ASR – NTU、NUS、上海AI Lab开源的语音识别模型 CodeGraph – 开源代码知识图谱工具,加速代码理解和分析 MiniCPM5-1B – 面壁智能联合清华开源的端侧文本基座模型 Horizon – 开源 AI 信息聚合系统,构建专属新闻雷达 BitCPM-CANN – 面壁智能联合清华开源的端侧大模型 Xiaomi Auto World Model – 小米推出的辅助驾驶世界模型 opera-browser-cli – Opera Neon 开源的命令行工具 omp – 开源的 AI 终端编程智能体,能与 IDE 深度联动 Claude Opus 4.8 – Anthropic 推出的旗舰级大语言模型 Hy-Memory – 腾讯混元推出的 Agent 记忆插件 Fara1.5 – 微软推出的浏览器端 AI 智能体模型系列 美团GEO营销门户 – 美团推出的生成式引擎优化平台 Keye-VL-2.0-30B-A3B – 快手开源的自研多模态大模型 Guizang Social Card Skill – 歸藏开源的小红书图文优化Skill ForgeTrain – 面壁智能联合清华等开源的大模型预训练框架 MAI-Image-2.5 – 微软推出的旗舰级文生图模型 Step 3.7 Flash – 阶跃星辰开源的新一代 Flash 模型 中国将首发公有云大模型 Token 性能榜,日均调用量已突破 140 万亿次 腾讯会议多项AI功能升级,元宝纪要月使用时长增长近5倍 Cloudflare CEO:机器人流量超越人类,网络未来或全面走向“付费抓取” 拍照识别野生蘑菇遭“误判”?豆包紧急回应:AI识别仅供参考,切勿盲目食用 华尔街规则为马斯克破例,SpaceX 史诗级 IPO 助力其冲刺首位万亿富豪 AI巨头罕见“踩刹车”:Anthropic警告“AI造AI”时代逼近,呼吁全球放缓研发 NBA中国携手阿里巴巴上线首个官方大模型“NBA Chat” 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计 OpenAI表态支持特朗普AI行政令:愿在模型发布前接受政府安全评估 马斯克旗下xAI要求深伪色情案原告“实名起诉”,受害者怒斥:这是恐吓式施压 12岁孩童用眉笔画胡子破解AI年龄验证:轻量级模型的技术漏洞引发行业警示 MiniMax M3大模型重磅发布:首创MSA架构,1M上下文全面开源,性能对标GPT-5.5 谷歌 DeepMind CEO:AGI 将至,关键三年窗口期人类准备好了吗? 机器人告别逐帧学动作!全球首个事件级具身智能世界模型WALL-WM重磅发布 15个月营收暴涨三倍!企业级AI搜索独角兽Glean凭’上下文图谱’破局巨头围剿 Oculus创始人AI新作Sesame上线:重新定义‘边想边说’的流畅对话体验 三菱日联金融携手OpenAI:3.5万员工全面部署ChatGPT Enterprise,开启AI原生银行新时代 阿里云百炼CLI全面开源:一行命令编排AI Agent全栈能力,引爆开发者生态 360亿美元史上最大芯片租赁!阿波罗黑石联手,为Anthropic豪购谷歌TPU Grok Build 0.2.7 重磅发布:子代理共享终端效率翻倍,图像理解飞跃,开发者必看更新 重磅!小米MiMo V2系列2026年6月全面下线,开发者速迁至V2.5高性能版 美国Opus 4.8被曝’蒸馏’中国开源大模型:Anthropic的AI双标之路 NBA官宣引入AI鹰眼2.0系统:彻底终结出界判罚争议,裁判将聚焦主观判罚 Mistral AI 首席执行官宣布自研芯片计划:成本、算力、生态三大战略解析 科技格局重塑:MiniMax企业客户破百万领跑AI商业化,创想三维港股上市引爆消费级3D打印市场 Liquid AI开源LFM2.5-8B-A1B:8B参数仅激活1.5B,端侧大模型性能飞跃,手机秒级推理 微软Build大会重磅出击:自研代码AI平价替代Claude,多场景模型矩阵挑战OpenAI Step 3.7 Flash 重磅开源发布:198B MoE架构实现400TPS推理,Agent效率与可靠性新时代已至 大模型概念股港股狂飙!智谱单日暴涨超17%,MINIMAX跟涨,AI商业化拐点真的来了? 日本Datasection携手OpenAI:TAIZA云平台深度整合API,赋能亚太企业智能工作流 470亿美元!Anthropic年化收入狂飙,Claude企业级应用引爆AI商业化新纪元 AI攻破6大数学猜想!25岁华人少女退学创业,OpenAI都未曾实现,她凭什么拿下14亿融资? 万亿估值前夜!Anthropic IPO前最后一轮融资650亿美元,直逼OpenAI资本巅峰 SentinelOne裁员8%聚焦AI安全:年营收增长21%仍亏损,科技巨头集体押注生成式AI 谷歌Coral Board开发板发布:本地运行Gemma3,RISC-V架构赋能边缘AI革命 拼多多重拳出击!AI押题、数据投毒等灰产被全面封禁,上半年已出台40余项治理措施 黄仁勋内部讲话引爆科技圈:AI时代,宁可浪费钱也别浪费时间 腾讯电脑管家Mac版重磅发布!首创AI安全沙箱,一文看懂如何守护AI智能体 科大讯飞发布AI眼镜:40克超轻机身+星火大模型,掀起百镜大战新浪潮 2026高考AI防作弊硬核举措:主流大模型限时上锁,精准掐断秒级解题通道 小红书PC端重磅上线AI搜索助手’点点’:多轮对话+笔记导入,重新定义社区搜索体验 YouTube播客AI升级:自动调速专治说话慢,Premium用户收听体验大革新 Anthropic完成史诗级H轮融资650亿美元,Claude Opus 4.8模型同步发布,AI巨头估值飙升逼近万亿美元里程碑 2026世界杯AI预测大赛开启:联想联合DeepSeek等大模型,挑战亿万球迷智慧 重磅!iOS 27联手谷歌Gemini训练本地AI,Siri部分请求转向谷歌云,隐私与算力如何平衡? 苹果iOS 27深度合作谷歌Gemini:Siri转向云端处理,英伟达机密计算护航隐私 iOS 27 将整合谷歌 Gemini 模型:苹果本地AI Siri大升级,隐私与性能如何兼得? Anthropic王者归来:曾因‘过于危险’被封印的Mythos级AI模型重磅解禁,几周内全量上线 Anthropic重磅解禁’过于危险’的王炸模型Mythos!更强安全防护下几周内全量上线 破解AI记忆三周魔咒!腾讯混元Hy-Memory发布:记忆密度提升45%、Token消耗降低35%,定义Agent长期协作新范式 腾讯混元Hy-Memory发布:AI Agent长期记忆难题终结者,记忆密度飙升45%、Token消耗锐减35% Claude Opus 4.8 核弹级发布:编程能力碾压GPT-5.5,成本直降67%,AI开发者生产力革命来了 Claude Opus 4.8正式发布:性能全面超越GPT-5.5,成本暴降66%重塑AI编程格局 Mistral AI联手空客宝马:押注‘实体AI’,制造业将迎来效率革命? 谷歌AI翻车!竟把’Google’拼错,大模型‘不识字’的硬伤藏不住了 科大讯飞AI眼镜重磅发布:4299元内置龙虾助手GlassClaw,122种语言实时翻译重塑生产力 Gemini 3.5 生产环境严重失控:越权删光两万行代码并编造修复报告,AI 开发信任危机再升级 AI复活传奇!斯坦·李获合法授权数字重生, ElevenLabs 用生成式AI重塑其标志性声音 英伟达Polar框架开源:零门槛强化学习,AI编码智能体进化提速500%+ 开发者炸锅!Codex强制退役GPT-5.2/5.3,GPT-5.5降智风波未平引发行业焦虑 OpenRouter B轮融资1.13亿美元:CapitalG、NVIDIA联手,打造多模型AI时代的流量枢纽 阿里云Qoder Cloud Agents全托管平台发布:企业AI Agent上线周期从1个月缩短至1天 谷歌珊瑚AI开发板引爆边缘计算革命:2026年夏季上市,离线运行Gemma3大模型实现实时语音翻译
网易清华联手!LatticeWorld:AI文本一键生成UE5级3D世界,效率飙升90倍
站外新闻 · 2026-06-21 · via Prompt 语宙

💡 站外导读:在游戏开发、影视制作等领域,高质量3D场景的创作一直面临耗时耗力、成本高昂的痛点。传统手工建模与渲染流程难以应对快速迭代的市场需求。随着生成式AI的爆发,业界期待更智能、自动化的解决方案。LatticeWorld应运而生,它代表了大模型与工业级引擎深度结合的新方向,旨在彻底革新数字内容创作流程,将复杂的3D世界构建变为高效的“文本到世界”生成过程。

LatticeWorld 是网易、香港城市大学、北京航空航天大学和清华大学等机构推出的将大语言模型与工业级 3D 渲染引擎虚幻引擎 5 (Unreal Engine 5,UE5)结合的多模态 3D 世界生成框架,支持通过文本描述和视觉指令快速生成具备高动态环境、真实物理仿真和实时渲染的大规模交互式 3D 世界。LatticeWorld 由场景布局生成、环境配置生成、程序化渲染管线三个核心模块构成,相比传统手工创作,创作效率提升超 90 倍,且生成质量高,有望在游戏、影视等领域广泛应用。

  • LatticeWorld是什么
  • LatticeWorld的主要功能
  • LatticeWorld的技术原理
  • LatticeWorld的项目地址
  • LatticeWorld的应用场景
      • 📝 站长洞察 (Editor’s Insight)

LatticeWorld

LatticeWorld的主要功能

  • 快速生成3D世界:根据文本描述和视觉指令,快速生成具备高动态环境、真实物理仿真和实时渲染的大规模交互式3D世界,相比传统手工创作,效率大幅提升。

  • 支持多种场景生成:支持生成多种不同类型的3D场景,如郊区、荒野等,满足不同用户的需求。

  • 生成动态交互式环境:能生成动态智能体配置信息,包括智能体类别、数量、行为状态和空间位置等,使生成的3D世界更具交互性和动态性。

  • 支持多模态输入:支持文本描述和视觉条件等多种输入方式,用户根据自己的需求选择合适的输入方式,使生成的3D世界更加符合用户的需求。

LatticeWorld的技术原理

  • 多模态输入处理:通过文本描述和视觉条件等多种输入方式,将输入信息转换为符号化场景布局和环境配置参数,为后续的3D世界生成提供基础。

  • 符号序列场景布局表示:将复杂的空间场景布局转换为符号矩阵,每个符号代表特定的资产类型,如F表示森林区域,W表示水体等。符号化矩阵被序列化为大语言模型可直接处理的字符串格式,有效保持空间关系的完整性。

  • 多模态视觉融合机制:用预训练的CLIP视觉编码器提取高维视觉特征表示,通过专门设计的多层CNN投影网络将特征映射到词嵌入空间。采用精心设计的三阶段训练范式,包括CLIP微调阶段、持续预训练阶段和端到端微调阶段,联合优化视觉指令集成模块和布局生成模型。

  • 层次化场景属性框架:建立双层场景属性的层次化结构,粗粒度属性层控制全局环境特征,如地形类型、季节变化、天气状况等;细粒度属性层涵盖多种细节参数,如资产的材质、密度、位置、朝向等,确保场景的语义一致性并减少参数冲突。

  • 程序化渲染管线:通过场景布局解码器和环境配置转译系统,将符号化场景布局和JSON格式的环境配置转换为3D渲染引擎的输入。场景布局解码器实现对符号化场景布局的精确处理,包括转换为二值掩码图片、调整掩码图像大小和形成自然过渡区域等;环境配置转译系统负责将环境配置参数转译为特定渲染引擎的原生属性格式,精确控制物体和智能体的类型、状态、空间分布等详细参数。

LatticeWorld的项目地址

  • arXiv技术论文:https://arxiv.org/pdf/2509.05263

LatticeWorld的应用场景

  • 游戏开发:快速生成游戏世界原型,包括地形、建筑、植被等元素,加快开发进度。

  • 影视制作:快速搭建复杂虚拟场景,如外星世界、古代城市等,降低实体场景搭建成本。

  • 虚拟现实(VR)与增强现实(AR):创建沉浸式虚拟环境,如虚拟旅游、虚拟教育等,提供身临其境的体验。

  • 城市规划:快速生成城市虚拟模型,包括街道、建筑、公园等元素,用于前期研究。

  • 教育与培训:生成虚拟实验室、历史场景等,提供沉浸式学习体验。

📝 站长洞察 (Editor’s Insight)

LatticeWorld的出现,标志着AIGC正式从2D图像、文本创作,强势进军高复杂度的3D交互世界生成。它并非简单的场景拼接,而是将LLM的理解与规划能力,与UE5引擎的工业化渲染、物理仿真管线深度耦合。其核心价值在于“程序化”与“多模态”——通过符号化表示解决了LLM对空间关系的“理解”难题,并利用CLIP等视觉模型融合多源输入。这预示着未来内容生产(游戏、影视、虚拟世界)的核心范式将转向“意图驱动”,人类创作者的角色将从执行者更多地转变为指导者和审核者。该框架的开源(论文已发)将极大推动相关领域的研究与应用落地,是通往大规模、可交互、高保真虚拟环境(如元宇宙基础建设)的关键技术突破。