惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

T
Tor Project blog
B
Blog RSS Feed
M
MIT News - Artificial intelligence
WordPress大学
WordPress大学
H
Hackread – Cybersecurity News, Data Breaches, AI and More
罗磊的独立博客
GbyAI
GbyAI
N
Netflix TechBlog - Medium
博客园 - 司徒正美
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
宝玉的分享
宝玉的分享
W
WeLiveSecurity
Stack Overflow Blog
Stack Overflow Blog
Y
Y Combinator Blog
SecWiki News
SecWiki News
V
Vulnerabilities – Threatpost
Google DeepMind News
Google DeepMind News
C
CERT Recently Published Vulnerability Notes
T
Tailwind CSS Blog
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
The Register - Security
The Register - Security
Cisco Talos Blog
Cisco Talos Blog
Martin Fowler
Martin Fowler
A
About on SuperTechFans
S
Security @ Cisco Blogs
T
Tenable Blog
C
Check Point Blog
N
News and Events Feed by Topic
S
SegmentFault 最新的问题
The GitHub Blog
The GitHub Blog
C
Cyber Attacks, Cyber Crime and Cyber Security
Attack and Defense Labs
Attack and Defense Labs
美团技术团队
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
C
Cisco Blogs
P
Palo Alto Networks Blog
V
V2EX
博客园 - 聂微东
Project Zero
Project Zero
酷 壳 – CoolShell
酷 壳 – CoolShell
D
Docker
N
News | PayPal Newsroom
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
小众软件
小众软件
Application and Cybersecurity Blog
Application and Cybersecurity Blog
人人都是产品经理
人人都是产品经理
V2EX - 技术
V2EX - 技术
I
Intezer
L
LINUX DO - 最新话题

InfoQ - 促进软件开发领域知识与创新的传播

Meta 收购 Manus 这事儿泡汤了 5.5万 Star 开源项目 Ghostty 被迫出走,GitHub 正在终结一代技术人的乌托邦 Slack 长时运行多智能体系统的上下文管理方案 从 T+1 到分钟级:金城银行基于 Apache Doris 构建高可靠、强一致的实时数据平台 谷歌云推出 Agents CLI,简化 AI 智能体开发全流程 Claude官方击穿高薪、高学历的安全防线!Anthropic点名10大高危职业,但有群人暂时稳了 亚马逊云科技终止 WorkMail 服务,并将 App Runner 转入维护模式 OPPO小布记忆:全模态碎片化内容的理解与智能整理实践|AICon上海 模力工场038周AI应用周榜:工具在消失,工作流在出现 Akamai CEO Tom Leighton:Agent 时代来临,云基础设施正从“中心化”转向“分布式边缘” 日均数百亿入库背后:从“人肉调度”到K8s弹性架构,度小满金融基于OceanBase重构入库架构实践 百度文库网盘发布GenFlow 4.0:月活用户超1亿,要把网盘变成全端AI工作台 Altman 投的 Agent 终端 Warp 开源了!斩获3.5万star 哪些客户需要拒, 敢让龙虾决定吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从开发到生产:为什么越来越多的机器学习团队纷纷迁移到 Snowflake | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 探索多智能体工作流:LangGraph Snowflake Cortex AI | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 腾讯云分布式缓存数据库:AI Agent - 从提示词工程到 Harness 工程 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 基于 Streamlit 为 CSV 数据构建分析智能体 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 AI 智能体:告别文档缺漏 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 构建 AI 驱动的数据管道:深度探讨 Snowflake Openflow 与非结构化数据 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 云端太贵、本地不够聪明,英特尔押注“端云混合AI”:智能体PC会替人完成工作 不到10%的存储投入,可能拖垮90%的GPU投资!IBM把AI Agent塞进存储系统,算清企业最容易忽略的一笔账 Snowpark 上手实战 | BUILD 2025_大数据_王玮_InfoQ精选视频 ClickHouse + Langfuse,构建 Agent 可观测基石 腾讯云分布式缓存数据库:Cluster Proxy 共享连接架构深度解析 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 AI 写代码太烧钱了:Copilot、Claude 一起涨价,不如把程序员请回来? 英特尔发布至强600系列工作站处理器与锐炫Pro B70 GPU,全新AI工作站来了 腾讯云分布式缓存数据库:从 Redis 到 Valkey - 开源社区如何快速创新 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 印奇这次要“从0重做”智驾模型!首谈阶跃和千里双公司布局:中国AI商业闭环要靠车跑出来 从Cursor返聘归来,90后华裔女高管带Claude开启日更模式:token成本比工程师工资低多了! 从 Coding 到 Agent:QCon 北京 2026 全景复盘,优秀出品人 & 明星讲师名单揭晓 全链路支撑大模型国产化“Day 0适配”,商汤大装置构建全栈能力底座 凌晨,OpenAI 与亚马逊云科技史上最大联合发布来了 HashiCorp Vault 2.0 发布:引入新身份联邦机制,迈入 IBM 生命周期体系 Yelp 实现超 1,000 个 Cassandra 节点零停机升级 写了 17 年开源代码,我为什么认为 Coding Agents 堆功能是在瞎折腾? 基于 Apache Camel 编排智能体与多模态 AI 管道 面向智能体与人类用户的AI记忆系统:架构设计与核心场景实践|AICon上海 Anthropic 推出 Managed Agents,简化 AI 代理部署流程 阿里HappyHorse开启灰测,720P视频生成低至0.44元/秒 讯飞联合清华团队押注量子AI:不看营收、不设KPI,一群“无人区”科学家,抢夺下代AI算力入口 小米万亿模型全面开源:MIT 协议、1M 上下文,但还是打不过 DeepSeek Cortex Code 入门指南:面向数据工程师的实践路径 | 技术实践 openJiuwen社区首发Team Skills,定义Coordination Engineering新范式 用 Snowflake Cortex Agents 释放结构化数据的最大价值 | 技术实践 Grafana 利用 Kafka 对 Loki 进行了架构重构,并发布了一款命令行工具,旨在将可观测性引入编码代理 ClickHouse重构全文索引:对象存储上跑出高性能 Full-Text Search 可观测性和遥测技术如何提升软件工程实践 Dropbox 与 GitHub 合作,将单体库大小从 87GB 缩减至 20GB Agent 的下一站:基于长期记忆系统 EverOS 的自我演进|AICon上海 同一赛道,四种收费:Agent 控制层(Harness)开始分裂 Cloudflare Sandboxes 正式发布,为 AI 代理提供持久化隔离环境 Agent 的“记忆断片”困局,该怎么破?_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选视频 数据分析师如何快速建立在 AI 时代最值钱的能力:一份可落地的行动路线图 摩尔线程最新财报:研发占比超86%,万卡级大规模智算集群落地 当云区域失效:地缘动荡环境下的高可用重构 Slack 重构通知系统,设置参与度提升 5 倍 智能体工程的隐性技术债务 “我把所有模型都换成了DeepSeek V4”:月账单将降 90%,效果还更好 阿里云智能集团高级技术专家刘少伟已确认出席AICon上海站,并分享如何构建企业 Agent 的自动化行动架构 构建生产就绪的 tRPC API:Apollo Federation 的 TypeScript 替代方案 Anthropic推出面向Claude Code的基于智能体的代码审查功能 北京车展直击:斑马智能甩出车载Agent短剧,比亚迪率先落地,AI让智能座舱又热起来了 Snowflake 作为智能体运行时:从静态管道迈向自主数据系统 | 技术实践 Snowflake 上的本体体系:基于 Cortex Code 能力实现从架构到部署 | 技术实践 Cloudflare 公布 MCP 架构方案,应对企业面临的安全与治理风险 复杂的项目管理怎么做到「AI 友好」?飞书项目用「开放」给出答案 Snowflake Cortex Code 的规范驱动开发:将 SDLC 方法论引入 AI 辅助工作流 | 技术实践 Copilot 不让注册了:从“随便用”到“全面限”,agent 把原有订价模型顶穿了 当互联网用AI卷效率时,这家公司先问了一连串“能不能” Meta 开始记录员工每一次点击:AI 要接管工作,先监控会工作的人 Meta“Token榜”逼疯打工人,一夜烧掉公司几万刀!AI时代Token焦虑越来越离谱 智源FlagOS完成DeepSeek-V4-Flash在八款芯片Day0适配,实现三重技术突破 DeepSeek V4 重磅开源!首次打通华为Ascend,也没丢掉英伟达,百万上下文夺回国产模型话语权 李志飞的“新实验”:当超级个体撞上真实组织 GPT-5.5 登顶时刻,Anthropic 亲口承认 Claude 变笨了!网友群嘲:太敷衍 那些没空写的小需求,龙虾真能做吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从 Pandas 到生产:使用任意 IDE 进行可扩展的 ML 数据管道与分布式处理 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 pnpm 11 候选版本发布,带来 ESM 分发、供应链默认设置以及新的存储格式 银行业PDF表格提取方案重构:基于Java的分层方案 GPT-5.5 赢了 Opus 4.7 和 Mythos?奥特曼晒黄仁勋内部信:英伟达全员用上 Codex! Cloudflare 推出 Think:一款面向 AI 代理的持久化运行时 1850亿美元天价支出、75%代码由AI生成!谷歌正式宣告:全面转向智能体工作流 xAI落后太多,马斯克“开大”重金求购Cursor,100亿美金“分手费”都敢签! Pulumi 新增对 Bun 运行时的全面支持 姚顺雨腾讯模型首秀!不卷参数只做 “听话打工人”,Hy3 preview登场 | 附实测 老板让你“忽悠”投资人,你敢发给龙虾吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 Gemini CLI 引入子代理机制,实现任务委派与并行代理工作流 清华系团队星工聚将完成数千万天使轮融资,轮式机器人拿下头部制造企业亿级大单 Pretext.js 绕过 DOM 布局重排,实现 120 FPS 的高级交互体验 靠“AI 云”爆红的 Vercel,栽在一个第三方AI工具手里!IPO前夕遭黑,200万美元赎金谈崩? 高能研讨会|端侧 AI 正在重写实时感知效率上限_AI&大模型_王玮_InfoQ精选视频 2050大会看这篇就够了|报名、交通食宿指引大全 Java 近期资讯:OpenJDK JEP、Jakarta EE 12、Spring Framework、Micrometer、Camel、JBang 金融智能的架构编排:基于 Snowflake Cortex Agents 实现结构化与非结构化数据统一分析 | 技术实践 在AK大神爆火的任务里,摸清国产AI真实水平 百灵Ling-2.6-flash 正式发布:高 Token 效率,以 1/10 消耗实现 SOTA 级 Agent 能力 当 PM 懂AI,当技术懂产品:AI 时代产品力的双向进化|PM x AI产品力领航者大会即将开幕 为 AI 智能体设计记忆机制:揭秘 LinkedIn 的认知记忆智能体 获奖名单公布|2026主题征文第一期|分享你最有价值的龙虾场景与核心 Skill_热门活动_InfoQ写作社区官方_InfoQ写作社区
全新世界模型悟界·Physis将开源,22岁北大本科生担任负责人|智源大会
华卫 · 2026-06-17 · via InfoQ - 促进软件开发领域知识与创新的传播

作者|华卫

“世界模型是下一代人工智能基座模型。”智源研究院院长王仲远在前不久对我们表示,这一基座模型意味着有望和大语言模型相提并论的下一代重大人工智能范式变革和重大突破的机会。

今年,智源大会发布的一系列创新成果主要涵盖三个部分:基座大模型、智能体和基础软硬件生态。其中一大亮点就是,一款正在研发中的新世界模型悟界·Physis。

王仲远透露,该模型在训练完成以后将会开源开放。并且,现在 22 岁的陈博远是智源研究院行为世界模型创新中心的负责人,该中心聚焦下一代通用世界基座模型的学术研究与前沿探索,旨在构建面向真实物理世界的通用基座模型。

据了解,陈博远在 2004 年出生,来自山东,是北京大学元培学院人工智能方向本科生,也是逆矩阵科技 Physis 的创始人之一。

同时,智源构建了面向具身领域、以世界模型理念为核心构建的具身大脑悟界·RoboBrain Orca,其相对通用基座模型集成更多面向具身领域的 Data,可以进行下一个物理状态的预测。

此外,大会开幕式上,图灵奖得主、美国国家工程院院士、IEEE 会士 Whitfield Diffie 和图灵奖得主、马萨诸塞大学阿默斯特分校荣誉退休教授 Andrew Barto 都分别做了主题报告。Diffie 强调,当前编程实践中,对智能体的限制(Confinement)即保证智能体只能访问授权资源,在现有编程中仍做得不足。

Barto 则提出,“强化学习与神经网络的计算研究从一开始便紧密交织”,二者“均发端于大脑如何运作与学习的假说”,而“深度强化学习的计算能力与大脑奖励系统的最新成果相结合,指明了下一轮进展的方向”。最后,他以“小心你许的愿,你可能真的会得到它”发出警示,提醒人们警惕奖励信号设计中的“反常实例化”风险。

悟界系列大模型:面向物理世界构建的 AI 基座模型

如今,随着多模态模型的研究深入,人工智能正经历一场重大的范式变革,正在从“预测下一个词元”演进到“预测下一个物理状态”,这是世界模型的核心本质。

智源研究院是国内最早提出并开展世界模型研究的科研机构。2023 年智源大会上,杨立昆(Yann LeCun)就阐述了新一代世界模型的概念;2024 年智源大会上,智源研究院提出的人工智能大模型技术路线预判,明确指出世界模型是下一代大模型技术;2024 年发布的悟界·Emu3 和 2025 年发布的悟界·Emu3.5,更是全球首个原生多模态世界模型。

基于在大模型领域持续的技术积累与前瞻布局,2026 年智源推出了悟界·Physis-v0.1。悟界·Physis 的诞生正是基于智源对人工智能发展路径的判断以及从“悟道”到“悟界”的技术传承与延续。随着大语言与多模态技术日趋成熟,未来人工智能的发展重心将进入世界模型时代。

据介绍,悟界·Physis-v0.1 是全球首款通用世界基座模型,构筑真实物理世界人工智能底层核心引擎,重塑 AI 物理感知与推演的底层技术体系。悟界·Physis-v0.1 彻底打破传统 AI 垂类场景专用的技术瓶颈,针对性解决行业共性难题,能有效弥补主流人工智能模型不懂真实物理规则、物理推演结果可信度低、长程时序记忆缺失的核心短板,以通用基座能力实现全场景物理交互、感知与决策的统一,从根源提升 AI 物理推理的真实性与可靠性。

依托独创技术架构,悟界·Physis-v0.1 以物理隐空间表征替代传统像素、帧级预测方案,实现跨场景通用物理规律强化学习。搭载专属物理状态编码器,可完成视频、深度 RGB、3D 点云、力触反馈等全模态信息压缩,统一转化为标准化隐空间物理状态 Latent State。模型支持 50+复杂物理场景长程推理,具备物理一致性、动作因果性、长程可推演性、通用泛化性四大核心能力,凭借高效的推理效率与极强的泛化能力,达到行业领先水平,可广泛应用于严肃工业、具身智能、物理仿真、科学研究等真实物理场景。

智源认为,现有世界模型相关的技术路线可分为四类:第一类是以语言为中心的世界模型,包括 VLM、VLA,模型在文本空间中预测下一个词,学到的是语言描述的世界,并不能理解背后的物理后果;第二类是以像素为中心的世界模型,像 Sora 和 Seedance 等视频生成类模型,在视觉空间中学习视频或图像,学到的是像素描述的世界;

第三类是以三维结构为中心的世界模型,包括 3D 重建以及李飞飞团队的 World Labs Marble 模型,不过模型重建 3D 空间不等于理解世界,几何结构也不代表物理状态;第四类是以视觉表征为中心的世界模型,比如杨立昆的 JEPA 系列模型,预测的是视觉表征的压缩,但视觉嵌入演化不等于物理规律演化。

在智源看来,世界模型作为面向真实物理世界的下一代基座模型,以“预测下一物理状态”为核心,代表着人工智能的下一个重要范式跃迁。世界模型不仅能感知、理解、推理真实物理世界的时间、空间、物理规律和物理常识,同时能涵盖文本、视频、深度、力觉、感知等全模态数据,还具备主动交互能力,能够支撑各种物理世界的下游应用。

以预测下一物理状态为核心,构建新具身大脑

针对具身智能面临的硬件不成熟、数据短缺、模型能力弱、落地应用难的四大挑战,智源构建了自底向上的全栈具身智能技术体系,并先后发布了悟界·RoboBrain 和悟界·RoboOS。

据介绍,智源正在研发中的悟界·RoboBrain Orca,以预测下一个物理状态为核心来构建具身大脑,融合了大量 Ego-centric 交互数据,强化世界模型的具身表征,提升下游少样本和跨场景泛化的能力。

据介绍,悟界·RoboBrain Orca 构建了 “统一表征 — 建模 — 预测 — 交互” 完整闭环,实现从 Next Token / Frame / Action Prediction 升级为 Next Physical State Prediction,彻底打破传统 AI 仅能理解文本的局限,推动 AI 从理解文本走向感知、预测与交互物理世界,并融合大量 Ego-centric 交互数据,强化了世界模型的具身表征,有效提升下游少样本与跨场景的泛化能力。

具体来说,悟界·RoboBrain Orca 具备统一表征、因果推演、模态解码三大核心能力,可同时生成语言思考、视觉预测与动作决策,实现“想、看、动”三位一体,赋予具身智能机器人打通“认知—预测—行动”完整链路的能力,支撑具身智能机器人在物流场景、酒店服务场景等真实环境中的长期自主作业。

多领域布局,发布四款自研智能体

这次,智源还推出了四款自主研发的智能体,它们分别面向心脏辅助诊断、科学发现、个人专属助理以及生物安全防护等领域。

其中,BAAI Cardiac Agent 是全球首个面向心脏磁共振的辅助诊断智能体,依托安贞医院两千余例心血管患者超 3 万条影像-文本配对多模态数据,构建一站式“结构分割-功能评估-疾病诊断-智能化报告”智能体,推动优质心血管医疗能力普惠可及。BAAI Cardiac Agent 不仅能显著提升 CMR 影像的解读效率,同时融合安贞医院心脏专科医师的临床诊疗经验,其 Agent-Expert 系统复刻专家团队协作式诊疗流程,最终实现心脏疾病诊断精确度达到安贞医院顶尖心血管医生的诊断水平,AUC 超 0.93。

AREX 是面向科学发现的自主研究智能体,致力于推动人工智能从模仿学习向自主学习跨越,让 AI 学会自我提升。它面向科研过程中创新思路稀缺、设计实现缓慢、实验论证繁琐等痛点,全面降低科研全流程对人类参与的依赖,辅助人类研究,实现自主科学发现。未来,AREX 可服务于文献调研、思路拓展、实验设计、结果论证与论文撰写等科研全流程,也可用于人工智能服务的全流程快速构建、自主优化与迭代,并进一步推动人工智能技术赋能基础学科前沿问题的自主探索与科学发现。

SoulAgent 是面向个人用户的专属智能体,采用全新自研架构,实现 Token 成本节省 30%,资源占用降低 80%。SoulAgent 基于用户画像和 skill 的自进化,可持续成长为用户的专属数字专家,满足用户个性化服务、长期记忆留存、高私密安全的智能助手核心需求,有效解决传统通用 AI 助手不懂用户习惯、响应适配慢、用户数据无保障、无法实现长期深度协作的行业痛点,打造专属化和个性化的智能服务体验。在智源大会上,SoulAgent 帮助参会者实时听会、捕捉大会重点、提炼前沿观点与专家洞察,在并行会议中打造随时“在场”的智能分身。

智源还推出面向有害蛋白获取的风险发现智能体,首次打通“计算机模拟推演”与“真实实验验证”的完整链条(干湿实验闭环),验证了先进 AI 智能体能够辅助绕过生物安全筛查机制,将目标有害蛋白序列拆分为多个 DNA 片段并组装,最终成功获取有害蛋白基因序列。针对传统 AI 生物安全评估多为事后被动响应,且攻击路径难以完整复现的问题,该系统通过主动模拟攻击者行为,提前识别智能体在生物知识获取、有害蛋白序列设计等环节的脆弱性,将风险防控从“事后补救”转为“事前演练”。

全面升级至 FlagOS 2.1,打造普适、高效、智能智算基座

众智 FlagOS 是智源研究院牵头打造的统一智算系统软件栈,致力于彻底破解“多模型×多芯片”的适配难题。作为当前全球支持芯片种类最多的智算系统软件栈,FlagOS 统一适配 18 家芯片品牌的 32 款芯片型号,覆盖 NVIDIA、NPU、GPGPU、DSA、RISC-V AI、ARM 等多种架构,支持“多种模态”“多种场景”大模型在多种 AI 芯片迁移部署。通过 FlagOS 的通用算子库、统一 AI 编译器、自动算子生成工具、vLLM 多芯片统一插件等关键组件,支持 90%以上主流开源大模型的多芯片部署,包括 DeepSeek、Qwen、面壁 MiniCPM、智谱 GLM、MiniMaX、混元、阶跃 Step 等。发布即多芯适配,DAY 0 即实现 DeepSeek V4、Qwen3.6、MiniMaX M2.7、MiniCPM-o4.5、 MiniCPM5-1B 混元 Hy-MT2 等大模型的多款芯片适配。

同时,FlagOS 作为全球覆盖芯片数量最多的智算系统软件栈,构建了从底层算子到上层框架接入的完整技术体系。在端到端性能极致优化方面,FlagOS 拓展 Triton-TLE 语言能力,已支持华为昇腾、海光、摩尔线程、清微智能、英伟达等多款芯片,极致优化大模型关键算子性能;八大算子库总数超 600 个,实现从“大模型专用”到“科学计算”的能力延伸,核心组件已进入 PyTorch 基金会生态项目;FlagCX 通信库,统一连通 10 款芯片,并实现全球 AI 芯片通信的 ITU 国际标准与国家标准“双立项”。

FlagRelease 发布 Express“高速”镜像版本,可一键安装使用,实现端到端的高速推理。FlagCICD,首个 AI 多芯片开源集成测试发版平台。在前沿探索层面,FlagQuantum,高性能量子电路模拟框架,在多种 AI 芯片、及量子电路的机器学习,迈出“量智融合”的第一步。

目前,FlagOS 的生态成员已经超过 80 余家,全球下载量超过 37.5 万次,触及开发者 5.6 万人。