惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
The Hacker News
The Hacker News
P
Palo Alto Networks Blog
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
T
Tor Project blog
T
Troy Hunt's Blog
Microsoft Azure Blog
Microsoft Azure Blog
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
Last Week in AI
Last Week in AI
Hacker News - Newest:
Hacker News - Newest: "LLM"
D
Docker
博客园 - 三生石上(FineUI控件)
量子位
腾讯CDC
www.infosecurity-magazine.com
www.infosecurity-magazine.com
Cyberwarzone
Cyberwarzone
博客园 - 【当耐特】
Recent Announcements
Recent Announcements
M
MIT News - Artificial intelligence
Recorded Future
Recorded Future
G
GRAHAM CLULEY
P
Privacy & Cybersecurity Law Blog
T
Threat Research - Cisco Blogs
GbyAI
GbyAI
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
Google DeepMind News
Google DeepMind News
Simon Willison's Weblog
Simon Willison's Weblog
Cloudbric
Cloudbric
Project Zero
Project Zero
SecWiki News
SecWiki News
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
W
WeLiveSecurity
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
Latest news
Latest news
Schneier on Security
Schneier on Security
小众软件
小众软件
U
Unit 42
Y
Y Combinator Blog
Help Net Security
Help Net Security
Vercel News
Vercel News
月光博客
月光博客
WordPress大学
WordPress大学
C
CERT Recently Published Vulnerability Notes
Google Online Security Blog
Google Online Security Blog
T
Tenable Blog
C
Check Point Blog
MongoDB | Blog
MongoDB | Blog
N
Netflix TechBlog - Medium
Blog — PlanetScale
Blog — PlanetScale

InfoQ - 促进软件开发领域知识与创新的传播

Meta 收购 Manus 这事儿泡汤了 5.5万 Star 开源项目 Ghostty 被迫出走,GitHub 正在终结一代技术人的乌托邦 Slack 长时运行多智能体系统的上下文管理方案 从 T+1 到分钟级:金城银行基于 Apache Doris 构建高可靠、强一致的实时数据平台 谷歌云推出 Agents CLI,简化 AI 智能体开发全流程 Claude官方击穿高薪、高学历的安全防线!Anthropic点名10大高危职业,但有群人暂时稳了 亚马逊云科技终止 WorkMail 服务,并将 App Runner 转入维护模式 OPPO小布记忆:全模态碎片化内容的理解与智能整理实践|AICon上海 模力工场038周AI应用周榜:工具在消失,工作流在出现 Akamai CEO Tom Leighton:Agent 时代来临,云基础设施正从“中心化”转向“分布式边缘” 日均数百亿入库背后:从“人肉调度”到K8s弹性架构,度小满金融基于OceanBase重构入库架构实践 百度文库网盘发布GenFlow 4.0:月活用户超1亿,要把网盘变成全端AI工作台 Altman 投的 Agent 终端 Warp 开源了!斩获3.5万star 哪些客户需要拒, 敢让龙虾决定吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从开发到生产:为什么越来越多的机器学习团队纷纷迁移到 Snowflake | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 探索多智能体工作流:LangGraph Snowflake Cortex AI | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 腾讯云分布式缓存数据库:AI Agent - 从提示词工程到 Harness 工程 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 基于 Streamlit 为 CSV 数据构建分析智能体 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 AI 智能体:告别文档缺漏 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 构建 AI 驱动的数据管道:深度探讨 Snowflake Openflow 与非结构化数据 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 云端太贵、本地不够聪明,英特尔押注“端云混合AI”:智能体PC会替人完成工作 不到10%的存储投入,可能拖垮90%的GPU投资!IBM把AI Agent塞进存储系统,算清企业最容易忽略的一笔账 Snowpark 上手实战 | BUILD 2025_大数据_王玮_InfoQ精选视频 ClickHouse + Langfuse,构建 Agent 可观测基石 腾讯云分布式缓存数据库:Cluster Proxy 共享连接架构深度解析 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 AI 写代码太烧钱了:Copilot、Claude 一起涨价,不如把程序员请回来? 英特尔发布至强600系列工作站处理器与锐炫Pro B70 GPU,全新AI工作站来了 腾讯云分布式缓存数据库:从 Redis 到 Valkey - 开源社区如何快速创新 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 印奇这次要“从0重做”智驾模型!首谈阶跃和千里双公司布局:中国AI商业闭环要靠车跑出来 从Cursor返聘归来,90后华裔女高管带Claude开启日更模式:token成本比工程师工资低多了! 从 Coding 到 Agent:QCon 北京 2026 全景复盘,优秀出品人 & 明星讲师名单揭晓 全链路支撑大模型国产化“Day 0适配”,商汤大装置构建全栈能力底座 凌晨,OpenAI 与亚马逊云科技史上最大联合发布来了 HashiCorp Vault 2.0 发布:引入新身份联邦机制,迈入 IBM 生命周期体系 Yelp 实现超 1,000 个 Cassandra 节点零停机升级 写了 17 年开源代码,我为什么认为 Coding Agents 堆功能是在瞎折腾? 基于 Apache Camel 编排智能体与多模态 AI 管道 面向智能体与人类用户的AI记忆系统:架构设计与核心场景实践|AICon上海 Anthropic 推出 Managed Agents,简化 AI 代理部署流程 阿里HappyHorse开启灰测,720P视频生成低至0.44元/秒 讯飞联合清华团队押注量子AI:不看营收、不设KPI,一群“无人区”科学家,抢夺下代AI算力入口 小米万亿模型全面开源:MIT 协议、1M 上下文,但还是打不过 DeepSeek Cortex Code 入门指南:面向数据工程师的实践路径 | 技术实践 openJiuwen社区首发Team Skills,定义Coordination Engineering新范式 用 Snowflake Cortex Agents 释放结构化数据的最大价值 | 技术实践 Grafana 利用 Kafka 对 Loki 进行了架构重构,并发布了一款命令行工具,旨在将可观测性引入编码代理 ClickHouse重构全文索引:对象存储上跑出高性能 Full-Text Search 可观测性和遥测技术如何提升软件工程实践 Dropbox 与 GitHub 合作,将单体库大小从 87GB 缩减至 20GB Agent 的下一站:基于长期记忆系统 EverOS 的自我演进|AICon上海 同一赛道,四种收费:Agent 控制层(Harness)开始分裂 Cloudflare Sandboxes 正式发布,为 AI 代理提供持久化隔离环境 Agent 的“记忆断片”困局,该怎么破?_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选视频 数据分析师如何快速建立在 AI 时代最值钱的能力:一份可落地的行动路线图 摩尔线程最新财报:研发占比超86%,万卡级大规模智算集群落地 当云区域失效:地缘动荡环境下的高可用重构 Slack 重构通知系统,设置参与度提升 5 倍 智能体工程的隐性技术债务 “我把所有模型都换成了DeepSeek V4”:月账单将降 90%,效果还更好 阿里云智能集团高级技术专家刘少伟已确认出席AICon上海站,并分享如何构建企业 Agent 的自动化行动架构 构建生产就绪的 tRPC API:Apollo Federation 的 TypeScript 替代方案 Anthropic推出面向Claude Code的基于智能体的代码审查功能 北京车展直击:斑马智能甩出车载Agent短剧,比亚迪率先落地,AI让智能座舱又热起来了 Snowflake 作为智能体运行时:从静态管道迈向自主数据系统 | 技术实践 Snowflake 上的本体体系:基于 Cortex Code 能力实现从架构到部署 | 技术实践 Cloudflare 公布 MCP 架构方案,应对企业面临的安全与治理风险 复杂的项目管理怎么做到「AI 友好」?飞书项目用「开放」给出答案 Snowflake Cortex Code 的规范驱动开发:将 SDLC 方法论引入 AI 辅助工作流 | 技术实践 Copilot 不让注册了:从“随便用”到“全面限”,agent 把原有订价模型顶穿了 当互联网用AI卷效率时,这家公司先问了一连串“能不能” Meta 开始记录员工每一次点击:AI 要接管工作,先监控会工作的人 Meta“Token榜”逼疯打工人,一夜烧掉公司几万刀!AI时代Token焦虑越来越离谱 智源FlagOS完成DeepSeek-V4-Flash在八款芯片Day0适配,实现三重技术突破 DeepSeek V4 重磅开源!首次打通华为Ascend,也没丢掉英伟达,百万上下文夺回国产模型话语权 李志飞的“新实验”:当超级个体撞上真实组织 GPT-5.5 登顶时刻,Anthropic 亲口承认 Claude 变笨了!网友群嘲:太敷衍 那些没空写的小需求,龙虾真能做吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从 Pandas 到生产:使用任意 IDE 进行可扩展的 ML 数据管道与分布式处理 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 pnpm 11 候选版本发布,带来 ESM 分发、供应链默认设置以及新的存储格式 银行业PDF表格提取方案重构:基于Java的分层方案 GPT-5.5 赢了 Opus 4.7 和 Mythos?奥特曼晒黄仁勋内部信:英伟达全员用上 Codex! Cloudflare 推出 Think:一款面向 AI 代理的持久化运行时 1850亿美元天价支出、75%代码由AI生成!谷歌正式宣告:全面转向智能体工作流 xAI落后太多,马斯克“开大”重金求购Cursor,100亿美金“分手费”都敢签! Pulumi 新增对 Bun 运行时的全面支持 姚顺雨腾讯模型首秀!不卷参数只做 “听话打工人”,Hy3 preview登场 | 附实测 老板让你“忽悠”投资人,你敢发给龙虾吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 Gemini CLI 引入子代理机制,实现任务委派与并行代理工作流 清华系团队星工聚将完成数千万天使轮融资,轮式机器人拿下头部制造企业亿级大单 Pretext.js 绕过 DOM 布局重排,实现 120 FPS 的高级交互体验 靠“AI 云”爆红的 Vercel,栽在一个第三方AI工具手里!IPO前夕遭黑,200万美元赎金谈崩? 高能研讨会|端侧 AI 正在重写实时感知效率上限_AI&大模型_王玮_InfoQ精选视频 2050大会看这篇就够了|报名、交通食宿指引大全 Java 近期资讯:OpenJDK JEP、Jakarta EE 12、Spring Framework、Micrometer、Camel、JBang 金融智能的架构编排:基于 Snowflake Cortex Agents 实现结构化与非结构化数据统一分析 | 技术实践 在AK大神爆火的任务里,摸清国产AI真实水平 百灵Ling-2.6-flash 正式发布:高 Token 效率,以 1/10 消耗实现 SOTA 级 Agent 能力 当 PM 懂AI,当技术懂产品:AI 时代产品力的双向进化|PM x AI产品力领航者大会即将开幕 为 AI 智能体设计记忆机制:揭秘 LinkedIn 的认知记忆智能体 获奖名单公布|2026主题征文第一期|分享你最有价值的龙虾场景与核心 Skill_热门活动_InfoQ写作社区官方_InfoQ写作社区
英伟达甩出物理AI王炸!Cosmos 3全模态模型开源,Agent Tookit补齐工具短板
李冬梅 · 2026-06-03 · via InfoQ - 促进软件开发领域知识与创新的传播

大模型的竞争,正从纯文本、多模态内容生成,彻底转向物理世界的智能落地

昨天,在 2026 中国台北 GTC 大会上,英伟达正式官宣重磅产品——NVIDIA Cosmos 3,这款面向物理 AI 的开放世界基础模型,凭借全新混合 Transformer 架构,打通视觉推理、世界生成、动作预测三大核心能力,成为全球首款完全开放的全模态物理 AI 模型。与此同时,英伟达牵头成立全球开发者协作联盟,正式拉起物理 AI 生态阵营,宣告物理 AI 规模化落地时代加速到来。

不同于当下主流聚焦内容创作的多模态大模型,Cosmos 3 的核心定位精准锚定真实物理世界,原生支持文本、图像、视频、环境音、动作五大模态的理解与生成,且具备顶尖的物理规律精准度。

最关键的是,它彻底重构了物理 AI 的开发效率,将行业传统数月的训练、评估周期,直接压缩至数天,为机器人、智能汽车、工业视觉 AI 等领域带来代际升级可能。

架构革新:破解物理 AI 落地核心痛点

长期以来,物理 AI 落地始终受制于两大行业难题:一是真实场景训练数据稀缺,二是仿真系统碎片化,导致模型难以在复杂现实环境中泛化适配,无法稳定落地。而 Cosmos 3 的核心价值,正是通过架构创新破解这一行业瓶颈。

此次全新搭载的混合 Transformer(Mixture-of-Transformers)架构,是英伟达的突破性技术沉淀。该架构创新性融合推理 Transformer 与专家生成 Transformer 双模块,先通过推理模块精准解析现实场景中物体交互、时空运动、环境关联等核心物理逻辑,再依托生成模块输出贴合物理规律的视频画面与动作轨迹,彻底改变了传统模型“生成优先、逻辑缺失”的弊端。

训练层面,Cosmos 3 依托海量高质量数据集完成迭代,囊括数十亿条文本、图像、视频、环境音及机器人动作轨迹样本,构建起完备的物理世界知识体系。对开发者而言,这意味着无需海量定制化数据、无需高额训练算力成本,就能基于预训练模型快速搭建稳定、可泛化的物理 AI 系统,大幅降低行业落地门槛。

凭借硬核技术实力,Cosmos 3 已拿下多项权威基准测试榜首。

在开放模型赛道中,其包揽 Artificial Analysis、Physics-IQ 等榜单的世界生成精度第一,RoboLab、RoboArena 动作策略测评第一,以及 VANTAGE-Bench、TAR 视觉理解排行榜首位,全方位领跑物理 AI 核心能力。

为适配不同开发者、不同落地场景的差异化需求,英伟达推出分层版 Cosmos 3 产品矩阵,覆盖高精度研发、快速迭代、边缘实时推理全流程:

Cosmos 3 Super:定位高端高精度场景,主打极致物理仿真精度与生成质量,适配机器人、智能汽车等对安全性、精准度要求严苛的模型后训练研发场景;

Cosmos 3 Nano:主打轻量化高效迭代,可在极短时间内完成高质量视频生成与动作推理,适合开发者快速验证算法、迭代原型方案;

Cosmos 3 Edge(即将上线):聚焦终端落地,专为实时边缘推理优化,将打通物理 AI 从云端训练到终端部署的最后一环。

功能层面,Cosmos 3 可一站式充当三大核心工具:具备全模态跨维度推理的视觉语言模型、可模拟物理环境、预测世界状态的仿真训练模型、支撑机器人定制任务训练的动作骨干网络,全方位覆盖物理 AI 开发全流程。

技术突破之外,英伟达同步祭出生态大招,正式成立 NVIDIA Cosmos Coalition 全球协作联盟,集结全球顶尖世界模型研发团队与 AI 开发者,共同推动下一代开放世界模型的技术迭代与落地普及。

首批创始成员阵容堪称行业顶配,涵盖 Agile Robots、Black Forest Labs、Runway、Skild AI 等全球知名 AI 与机器人企业。联盟将搭建开放共享的技术生态,成员可双向输出模型、算法与测评技术,同时共享 Cosmos 3 核心技术、专属训练工具与 NVIDIA DGX Cloud 云端算力基础设施,开展大规模模型训练与迭代。

这种开放协作模式,将有效解决当前物理 AI 行业技术分散、兼容性差、迭代缓慢的痛点,通过生态合力加速技术创新,统一行业技术标准,推动物理 AI 从单点技术突破走向规模化落地。

目前,英伟达 Cosmos 平台已形成成熟的产业落地能力,平台内置机器人动力学、人体运动、辅助驾驶、空间推理等多领域专项数据集,同时搭载神经场景重建、缺陷图像生成、视频增强等全新 AI 智能体技能,全面赋能工业、出行、机器人等场景。

产业端已有大量头部企业率先入局落地:机器人领域集结三星、LG 电子、Doosan Robotics、Agile Robots 等知名厂商;智能汽车领域,理想汽车已依托该平台开展相关技术研发;视觉 AI 领域,Centific、Milestone Systems 等企业已基于其搭建工业 AI 与智能空间应用方案,物理 AI 的商业化图景愈发清晰。

补齐工具短板,推出开源 Agent Toolkit

基础模型之外,英伟达进一步补齐开发工具短板,正式推出 NVIDIA 物理 AI 智能体技能(归入 NVIDIA Agent Toolkit 体系),完成“基础模型+自动化开发工具”的双层布局。随着 AI 智能体从单纯编写代码,升级为统筹全流程开发任务的核心载体,这套工具链让智能体可直接调用英伟达全系技术资产,实现物理 AI 开发全链路自动化。

NVIDIA 创始人兼 CEO 黄仁勋对此表示:“AI 智能体正在彻底改变软件开发,而这一转变正迈向物理 AI,并进一步扩展到那些将改变交通、制造、医疗和机器人技术的系统中。当智能体可以直接使用 NVIDIA 库、模型和框架时,物理 AI 开发速度将大幅提升,使开发者能够以惊人的速度构建未来的机器人、智能汽车和工业系统。”

英伟达已完成全栈物理 AI 技术的“智能体适配改造”,构建起一套可被 AI 智能体调用的完整技术矩阵:以 Cosmos 世界基础模型承载物理推理与场景生成,以 Omniverse 支撑仿真与数字孪生,以 Isaac 赋能机器人仿真与学习,以 Metropolis 赋能视觉 AI、Alpamayo 适配辅助驾驶场景,再结合 Jetson 平台打通边缘 AI 部署,形成端到端技术闭环。

此次全新上线的物理 AI 智能体技能,核心价值是标准化、自动化工作流。它将复杂的物理 AI 开发流程,拆解为 AI 智能体可重复执行的标准化指令,明确工具调用规则、输出标准与验证逻辑,无需人工反复调试。同时,开发者可依托 NVIDIA NemoClaw 蓝图与 OpenShell 运行时,安全搭建、部署自主智能体,依托本地与云端的策略管控机制,保障开发过程的安全与隐私合规。

英伟达锁定物理 AI 时代话语权

从底层 Cosmos 3 世界基础模型,到 Agent Toolkit 智能体自动化工具链,再到 Omniverse、Isaac、Jetson 等全栈技术底座,叠加全球开发者联盟生态与各行业头部企业的落地实践,英伟达已构建起完整的物理 AI 产业闭环。

当行业还在聚焦多模态内容生成、虚拟 AI 迭代时,英伟达已经完成物理 AI 从技术理论、模型创新、工具赋能到产业落地的全链条布局。这套开放、高效、可规模化的解决方案,将推动 AI 彻底走出虚拟场景,深度融入制造、交通、医疗、机器人等实体产业,开启具身智能赋能实体经济的全新周期。