惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Vercel News
Vercel News
SecWiki News
SecWiki News
WordPress大学
WordPress大学
小众软件
小众软件
博客园 - 司徒正美
酷 壳 – CoolShell
酷 壳 – CoolShell
V
Visual Studio Blog
Y
Y Combinator Blog
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
云风的 BLOG
云风的 BLOG
MyScale Blog
MyScale Blog
K
Kaspersky official blog
T
The Exploit Database - CXSecurity.com
腾讯CDC
Scott Helme
Scott Helme
I
InfoQ
Cyberwarzone
Cyberwarzone
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
Security Latest
Security Latest
The Register - Security
The Register - Security
Project Zero
Project Zero
F
Fortinet All Blogs
C
CERT Recently Published Vulnerability Notes
A
Arctic Wolf
C
Cisco Blogs
L
LINUX DO - 热门话题
P
Privacy International News Feed
IT之家
IT之家
U
Unit 42
P
Privacy & Cybersecurity Law Blog
H
Help Net Security
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
C
Cyber Attacks, Cyber Crime and Cyber Security
P
Palo Alto Networks Blog
F
Full Disclosure
宝玉的分享
宝玉的分享
Simon Willison's Weblog
Simon Willison's Weblog
L
Lohrmann on Cybersecurity
Google DeepMind News
Google DeepMind News
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
H
Hacker News: Front Page
Know Your Adversary
Know Your Adversary
PCI Perspectives
PCI Perspectives
Hugging Face - Blog
Hugging Face - Blog
AWS News Blog
AWS News Blog
MongoDB | Blog
MongoDB | Blog
S
Schneier on Security
Recent Announcements
Recent Announcements
Forbes - Security
Forbes - Security
Cisco Talos Blog
Cisco Talos Blog

InfoQ - 促进软件开发领域知识与创新的传播

Meta 收购 Manus 这事儿泡汤了 5.5万 Star 开源项目 Ghostty 被迫出走,GitHub 正在终结一代技术人的乌托邦 Slack 长时运行多智能体系统的上下文管理方案 从 T+1 到分钟级:金城银行基于 Apache Doris 构建高可靠、强一致的实时数据平台 谷歌云推出 Agents CLI,简化 AI 智能体开发全流程 Claude官方击穿高薪、高学历的安全防线!Anthropic点名10大高危职业,但有群人暂时稳了 亚马逊云科技终止 WorkMail 服务,并将 App Runner 转入维护模式 OPPO小布记忆:全模态碎片化内容的理解与智能整理实践|AICon上海 模力工场038周AI应用周榜:工具在消失,工作流在出现 Akamai CEO Tom Leighton:Agent 时代来临,云基础设施正从“中心化”转向“分布式边缘” 日均数百亿入库背后:从“人肉调度”到K8s弹性架构,度小满金融基于OceanBase重构入库架构实践 百度文库网盘发布GenFlow 4.0:月活用户超1亿,要把网盘变成全端AI工作台 Altman 投的 Agent 终端 Warp 开源了!斩获3.5万star 哪些客户需要拒, 敢让龙虾决定吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从开发到生产:为什么越来越多的机器学习团队纷纷迁移到 Snowflake | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 探索多智能体工作流:LangGraph Snowflake Cortex AI | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 腾讯云分布式缓存数据库:AI Agent - 从提示词工程到 Harness 工程 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 基于 Streamlit 为 CSV 数据构建分析智能体 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 AI 智能体:告别文档缺漏 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 构建 AI 驱动的数据管道:深度探讨 Snowflake Openflow 与非结构化数据 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 云端太贵、本地不够聪明,英特尔押注“端云混合AI”:智能体PC会替人完成工作 不到10%的存储投入,可能拖垮90%的GPU投资!IBM把AI Agent塞进存储系统,算清企业最容易忽略的一笔账 Snowpark 上手实战 | BUILD 2025_大数据_王玮_InfoQ精选视频 ClickHouse + Langfuse,构建 Agent 可观测基石 腾讯云分布式缓存数据库:Cluster Proxy 共享连接架构深度解析 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 AI 写代码太烧钱了:Copilot、Claude 一起涨价,不如把程序员请回来? 英特尔发布至强600系列工作站处理器与锐炫Pro B70 GPU,全新AI工作站来了 腾讯云分布式缓存数据库:从 Redis 到 Valkey - 开源社区如何快速创新 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 印奇这次要“从0重做”智驾模型!首谈阶跃和千里双公司布局:中国AI商业闭环要靠车跑出来 从Cursor返聘归来,90后华裔女高管带Claude开启日更模式:token成本比工程师工资低多了! 从 Coding 到 Agent:QCon 北京 2026 全景复盘,优秀出品人 & 明星讲师名单揭晓 全链路支撑大模型国产化“Day 0适配”,商汤大装置构建全栈能力底座 凌晨,OpenAI 与亚马逊云科技史上最大联合发布来了 HashiCorp Vault 2.0 发布:引入新身份联邦机制,迈入 IBM 生命周期体系 Yelp 实现超 1,000 个 Cassandra 节点零停机升级 写了 17 年开源代码,我为什么认为 Coding Agents 堆功能是在瞎折腾? 基于 Apache Camel 编排智能体与多模态 AI 管道 面向智能体与人类用户的AI记忆系统:架构设计与核心场景实践|AICon上海 Anthropic 推出 Managed Agents,简化 AI 代理部署流程 阿里HappyHorse开启灰测,720P视频生成低至0.44元/秒 讯飞联合清华团队押注量子AI:不看营收、不设KPI,一群“无人区”科学家,抢夺下代AI算力入口 小米万亿模型全面开源:MIT 协议、1M 上下文,但还是打不过 DeepSeek Cortex Code 入门指南:面向数据工程师的实践路径 | 技术实践 openJiuwen社区首发Team Skills,定义Coordination Engineering新范式 用 Snowflake Cortex Agents 释放结构化数据的最大价值 | 技术实践 Grafana 利用 Kafka 对 Loki 进行了架构重构,并发布了一款命令行工具,旨在将可观测性引入编码代理 ClickHouse重构全文索引:对象存储上跑出高性能 Full-Text Search 可观测性和遥测技术如何提升软件工程实践 Dropbox 与 GitHub 合作,将单体库大小从 87GB 缩减至 20GB Agent 的下一站:基于长期记忆系统 EverOS 的自我演进|AICon上海 同一赛道,四种收费:Agent 控制层(Harness)开始分裂 Cloudflare Sandboxes 正式发布,为 AI 代理提供持久化隔离环境 Agent 的“记忆断片”困局,该怎么破?_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选视频 数据分析师如何快速建立在 AI 时代最值钱的能力:一份可落地的行动路线图 摩尔线程最新财报:研发占比超86%,万卡级大规模智算集群落地 当云区域失效:地缘动荡环境下的高可用重构 Slack 重构通知系统,设置参与度提升 5 倍 智能体工程的隐性技术债务 “我把所有模型都换成了DeepSeek V4”:月账单将降 90%,效果还更好 阿里云智能集团高级技术专家刘少伟已确认出席AICon上海站,并分享如何构建企业 Agent 的自动化行动架构 构建生产就绪的 tRPC API:Apollo Federation 的 TypeScript 替代方案 Anthropic推出面向Claude Code的基于智能体的代码审查功能 北京车展直击:斑马智能甩出车载Agent短剧,比亚迪率先落地,AI让智能座舱又热起来了 Snowflake 作为智能体运行时:从静态管道迈向自主数据系统 | 技术实践 Snowflake 上的本体体系:基于 Cortex Code 能力实现从架构到部署 | 技术实践 Cloudflare 公布 MCP 架构方案,应对企业面临的安全与治理风险 复杂的项目管理怎么做到「AI 友好」?飞书项目用「开放」给出答案 Snowflake Cortex Code 的规范驱动开发:将 SDLC 方法论引入 AI 辅助工作流 | 技术实践 Copilot 不让注册了:从“随便用”到“全面限”,agent 把原有订价模型顶穿了 当互联网用AI卷效率时,这家公司先问了一连串“能不能” Meta 开始记录员工每一次点击:AI 要接管工作,先监控会工作的人 Meta“Token榜”逼疯打工人,一夜烧掉公司几万刀!AI时代Token焦虑越来越离谱 智源FlagOS完成DeepSeek-V4-Flash在八款芯片Day0适配,实现三重技术突破 DeepSeek V4 重磅开源!首次打通华为Ascend,也没丢掉英伟达,百万上下文夺回国产模型话语权 李志飞的“新实验”:当超级个体撞上真实组织 GPT-5.5 登顶时刻,Anthropic 亲口承认 Claude 变笨了!网友群嘲:太敷衍 那些没空写的小需求,龙虾真能做吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从 Pandas 到生产:使用任意 IDE 进行可扩展的 ML 数据管道与分布式处理 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 pnpm 11 候选版本发布,带来 ESM 分发、供应链默认设置以及新的存储格式 银行业PDF表格提取方案重构:基于Java的分层方案 GPT-5.5 赢了 Opus 4.7 和 Mythos?奥特曼晒黄仁勋内部信:英伟达全员用上 Codex! Cloudflare 推出 Think:一款面向 AI 代理的持久化运行时 1850亿美元天价支出、75%代码由AI生成!谷歌正式宣告:全面转向智能体工作流 xAI落后太多,马斯克“开大”重金求购Cursor,100亿美金“分手费”都敢签! Pulumi 新增对 Bun 运行时的全面支持 姚顺雨腾讯模型首秀!不卷参数只做 “听话打工人”,Hy3 preview登场 | 附实测 老板让你“忽悠”投资人,你敢发给龙虾吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 Gemini CLI 引入子代理机制,实现任务委派与并行代理工作流 清华系团队星工聚将完成数千万天使轮融资,轮式机器人拿下头部制造企业亿级大单 Pretext.js 绕过 DOM 布局重排,实现 120 FPS 的高级交互体验 靠“AI 云”爆红的 Vercel,栽在一个第三方AI工具手里!IPO前夕遭黑,200万美元赎金谈崩? 高能研讨会|端侧 AI 正在重写实时感知效率上限_AI&大模型_王玮_InfoQ精选视频 2050大会看这篇就够了|报名、交通食宿指引大全 Java 近期资讯:OpenJDK JEP、Jakarta EE 12、Spring Framework、Micrometer、Camel、JBang 金融智能的架构编排:基于 Snowflake Cortex Agents 实现结构化与非结构化数据统一分析 | 技术实践 在AK大神爆火的任务里,摸清国产AI真实水平 百灵Ling-2.6-flash 正式发布:高 Token 效率,以 1/10 消耗实现 SOTA 级 Agent 能力 当 PM 懂AI,当技术懂产品:AI 时代产品力的双向进化|PM x AI产品力领航者大会即将开幕 为 AI 智能体设计记忆机制:揭秘 LinkedIn 的认知记忆智能体 获奖名单公布|2026主题征文第一期|分享你最有价值的龙虾场景与核心 Skill_热门活动_InfoQ写作社区官方_InfoQ写作社区
英伟达甩出物理AI王炸!Cosmos 3全模态模型开源,Agent Tookit补齐工具短板
李冬梅 · 2026-06-03 · via InfoQ - 促进软件开发领域知识与创新的传播

大模型的竞争,正从纯文本、多模态内容生成,彻底转向物理世界的智能落地

昨天,在 2026 中国台北 GTC 大会上,英伟达正式官宣重磅产品——NVIDIA Cosmos 3,这款面向物理 AI 的开放世界基础模型,凭借全新混合 Transformer 架构,打通视觉推理、世界生成、动作预测三大核心能力,成为全球首款完全开放的全模态物理 AI 模型。与此同时,英伟达牵头成立全球开发者协作联盟,正式拉起物理 AI 生态阵营,宣告物理 AI 规模化落地时代加速到来。

不同于当下主流聚焦内容创作的多模态大模型,Cosmos 3 的核心定位精准锚定真实物理世界,原生支持文本、图像、视频、环境音、动作五大模态的理解与生成,且具备顶尖的物理规律精准度。

最关键的是,它彻底重构了物理 AI 的开发效率,将行业传统数月的训练、评估周期,直接压缩至数天,为机器人、智能汽车、工业视觉 AI 等领域带来代际升级可能。

架构革新:破解物理 AI 落地核心痛点

长期以来,物理 AI 落地始终受制于两大行业难题:一是真实场景训练数据稀缺,二是仿真系统碎片化,导致模型难以在复杂现实环境中泛化适配,无法稳定落地。而 Cosmos 3 的核心价值,正是通过架构创新破解这一行业瓶颈。

此次全新搭载的混合 Transformer(Mixture-of-Transformers)架构,是英伟达的突破性技术沉淀。该架构创新性融合推理 Transformer 与专家生成 Transformer 双模块,先通过推理模块精准解析现实场景中物体交互、时空运动、环境关联等核心物理逻辑,再依托生成模块输出贴合物理规律的视频画面与动作轨迹,彻底改变了传统模型“生成优先、逻辑缺失”的弊端。

训练层面,Cosmos 3 依托海量高质量数据集完成迭代,囊括数十亿条文本、图像、视频、环境音及机器人动作轨迹样本,构建起完备的物理世界知识体系。对开发者而言,这意味着无需海量定制化数据、无需高额训练算力成本,就能基于预训练模型快速搭建稳定、可泛化的物理 AI 系统,大幅降低行业落地门槛。

凭借硬核技术实力,Cosmos 3 已拿下多项权威基准测试榜首。

在开放模型赛道中,其包揽 Artificial Analysis、Physics-IQ 等榜单的世界生成精度第一,RoboLab、RoboArena 动作策略测评第一,以及 VANTAGE-Bench、TAR 视觉理解排行榜首位,全方位领跑物理 AI 核心能力。

为适配不同开发者、不同落地场景的差异化需求,英伟达推出分层版 Cosmos 3 产品矩阵,覆盖高精度研发、快速迭代、边缘实时推理全流程:

Cosmos 3 Super:定位高端高精度场景,主打极致物理仿真精度与生成质量,适配机器人、智能汽车等对安全性、精准度要求严苛的模型后训练研发场景;

Cosmos 3 Nano:主打轻量化高效迭代,可在极短时间内完成高质量视频生成与动作推理,适合开发者快速验证算法、迭代原型方案;

Cosmos 3 Edge(即将上线):聚焦终端落地,专为实时边缘推理优化,将打通物理 AI 从云端训练到终端部署的最后一环。

功能层面,Cosmos 3 可一站式充当三大核心工具:具备全模态跨维度推理的视觉语言模型、可模拟物理环境、预测世界状态的仿真训练模型、支撑机器人定制任务训练的动作骨干网络,全方位覆盖物理 AI 开发全流程。

技术突破之外,英伟达同步祭出生态大招,正式成立 NVIDIA Cosmos Coalition 全球协作联盟,集结全球顶尖世界模型研发团队与 AI 开发者,共同推动下一代开放世界模型的技术迭代与落地普及。

首批创始成员阵容堪称行业顶配,涵盖 Agile Robots、Black Forest Labs、Runway、Skild AI 等全球知名 AI 与机器人企业。联盟将搭建开放共享的技术生态,成员可双向输出模型、算法与测评技术,同时共享 Cosmos 3 核心技术、专属训练工具与 NVIDIA DGX Cloud 云端算力基础设施,开展大规模模型训练与迭代。

这种开放协作模式,将有效解决当前物理 AI 行业技术分散、兼容性差、迭代缓慢的痛点,通过生态合力加速技术创新,统一行业技术标准,推动物理 AI 从单点技术突破走向规模化落地。

目前,英伟达 Cosmos 平台已形成成熟的产业落地能力,平台内置机器人动力学、人体运动、辅助驾驶、空间推理等多领域专项数据集,同时搭载神经场景重建、缺陷图像生成、视频增强等全新 AI 智能体技能,全面赋能工业、出行、机器人等场景。

产业端已有大量头部企业率先入局落地:机器人领域集结三星、LG 电子、Doosan Robotics、Agile Robots 等知名厂商;智能汽车领域,理想汽车已依托该平台开展相关技术研发;视觉 AI 领域,Centific、Milestone Systems 等企业已基于其搭建工业 AI 与智能空间应用方案,物理 AI 的商业化图景愈发清晰。

补齐工具短板,推出开源 Agent Toolkit

基础模型之外,英伟达进一步补齐开发工具短板,正式推出 NVIDIA 物理 AI 智能体技能(归入 NVIDIA Agent Toolkit 体系),完成“基础模型+自动化开发工具”的双层布局。随着 AI 智能体从单纯编写代码,升级为统筹全流程开发任务的核心载体,这套工具链让智能体可直接调用英伟达全系技术资产,实现物理 AI 开发全链路自动化。

NVIDIA 创始人兼 CEO 黄仁勋对此表示:“AI 智能体正在彻底改变软件开发,而这一转变正迈向物理 AI,并进一步扩展到那些将改变交通、制造、医疗和机器人技术的系统中。当智能体可以直接使用 NVIDIA 库、模型和框架时,物理 AI 开发速度将大幅提升,使开发者能够以惊人的速度构建未来的机器人、智能汽车和工业系统。”

英伟达已完成全栈物理 AI 技术的“智能体适配改造”,构建起一套可被 AI 智能体调用的完整技术矩阵:以 Cosmos 世界基础模型承载物理推理与场景生成,以 Omniverse 支撑仿真与数字孪生,以 Isaac 赋能机器人仿真与学习,以 Metropolis 赋能视觉 AI、Alpamayo 适配辅助驾驶场景,再结合 Jetson 平台打通边缘 AI 部署,形成端到端技术闭环。

此次全新上线的物理 AI 智能体技能,核心价值是标准化、自动化工作流。它将复杂的物理 AI 开发流程,拆解为 AI 智能体可重复执行的标准化指令,明确工具调用规则、输出标准与验证逻辑,无需人工反复调试。同时,开发者可依托 NVIDIA NemoClaw 蓝图与 OpenShell 运行时,安全搭建、部署自主智能体,依托本地与云端的策略管控机制,保障开发过程的安全与隐私合规。

英伟达锁定物理 AI 时代话语权

从底层 Cosmos 3 世界基础模型,到 Agent Toolkit 智能体自动化工具链,再到 Omniverse、Isaac、Jetson 等全栈技术底座,叠加全球开发者联盟生态与各行业头部企业的落地实践,英伟达已构建起完整的物理 AI 产业闭环。

当行业还在聚焦多模态内容生成、虚拟 AI 迭代时,英伟达已经完成物理 AI 从技术理论、模型创新、工具赋能到产业落地的全链条布局。这套开放、高效、可规模化的解决方案,将推动 AI 彻底走出虚拟场景,深度融入制造、交通、医疗、机器人等实体产业,开启具身智能赋能实体经济的全新周期。