惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

N
News and Events Feed by Topic
Malwarebytes
Malwarebytes
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
C
Cybersecurity and Infrastructure Security Agency CISA
F
Future of Privacy Forum
C
Cisco Blogs
T
The Exploit Database - CXSecurity.com
A
Arctic Wolf
S
Securelist
K
Kaspersky official blog
S
Schneier on Security
T
ThreatConnect
T
Tenable Blog
Spread Privacy
Spread Privacy
T
True Tiger Recordings
AWS News Blog
AWS News Blog
F
Fox-IT International blog
量子位
T
Threatpost
V
Vulnerabilities – Threatpost
C
CERT Recently Published Vulnerability Notes
Cisco Talos Blog
Cisco Talos Blog
GbyAI
GbyAI
宝玉的分享
宝玉的分享
腾讯CDC
G
Google Developers Blog
aimingoo的专栏
aimingoo的专栏
Cyberwarzone
Cyberwarzone
有赞技术团队
有赞技术团队
S
SegmentFault 最新的问题
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
V
Visual Studio Blog
U
Unit 42
雷峰网
雷峰网
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Simon Willison's Weblog
Simon Willison's Weblog
O
OpenAI News
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
The GitHub Blog
The GitHub Blog
The Register - Security
The Register - Security
MyScale Blog
MyScale Blog
小众软件
小众软件
A
About on SuperTechFans
Last Week in AI
Last Week in AI
Y
Y Combinator Blog
博客园 - 三生石上(FineUI控件)
美团技术团队
Google Online Security Blog
Google Online Security Blog
P
Proofpoint News Feed
MongoDB | Blog
MongoDB | Blog

量子位

DeepSeek V4还能更省!新工具缓存命中率高达99.82%,2折稳定到手 图灵奖得主领衔,中国大模型第一梯队集结!2026智源大会,看懂AI下一程 Claude 通过率不到4%,SaaS-Bench撕碎了Computer-Use的「全自动办公」幻想 华为具身大脑一号位创业,用认知科学造世界模型,获亿元级融资 未来推理将吃掉70%算力,30%留给训练丨硅谷投资人张璐@AIGC2026 卷到今天,Agent的含金量还在提升丨AIGC2026圆桌论坛 谷歌CEO承认Coding落后了 未来推理将吃掉70%算力,30%留给训练丨硅谷投资人张璐@AIGC2026 什么!你说胡彦斌也在苦修Vibe Coding “五类人AI替代不了,企业做第二名最稳妥” | 昆仑万维方汉@AIGC2026 OpenAI大神教你如何榨干Codex DeepSeek V4价格打骨折,宁王京东网易抢着入场,梁文锋:目标是AGI 美团外卖前负责人入局餐饮具身模型,元节智能获千万级种子轮融资 美团外卖前负责人入局餐饮具身模型,元节智能获千万级种子轮融资 龙虾养不动了?周鸿祎给虾搭了个云端办公室,专业私教在线炼虾 李飞飞再出手,空间智能的ImageNet来了 融资700亿!DeepSeek Code真要来了,ACM金牌大神崔添翼挂帅 狂揽F轮融资+拿下4100万用户!深圳玩家出手,把企业旧系统变成AI能力库 顶流里最快!智谱,你是在「喷」代码吧 80集短剧,3天拍完:当电影人下场做Agent,影视生产迎来了“最懂行”的解法 39万!雷军发布小米最贵SUV 联想集团Q4营收利润双创新高,兑现历史最佳财年 腾讯混元开源全新翻译模型Hy-MT2 ,上线小程序「腾讯Hy翻译」 菲尔兹奖得主都看懵了:OpenAI非数学模型首次自主突破80年未解数学难题 风行在线CEO易正朝:先全员Coding,再All in众创丨AIGC2026 Artificial Analysis放榜:千问3.7问鼎国产模型冠军,全球前五 AI首次实现中国风光发电普查,北大、阿里达摩院研究登上《自然》 上海交大AI教授亲授:半天带你拆解Agent底层逻辑 得场景者得AI天下,出行赛道跑出了一家值得关注的数据玩家 520当天400万AI人,都在量子位听这近20场演讲&对谈|第四届中国AIGC产业峰会 顺丰邮政仓库干活的机器人,顺手拿了个具身高考第一 刚刚,马斯克公开SpaceX招股书! 智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布,融资持续提速 太初元碁洪源:异构计算能力将成为未来AI算力基础设施的重要方向|AIGC2026 VC、品牌顾问、编剧,正在批量把自己做成AI AIDC建设正从“通用标准”走向“适用高效” 破壁行动!把大厂级“研发外挂”发给每一个创新者,智会心研PLUS版免费公测 海信激光电视探索X1 Pro发布:中国家庭,正式进入客厅影院时代 2026中国AIGC最值得关注的企业&产品图鉴来了!谁在造浪,谁在落地? 趋境科技完成数亿元Pre-A轮融资,高品质AI Token生产基础设施 苏姿丰上海开讲:AI正在重新定义计算的每一层 完成“由铁到钢”的生态蜕变 刘军携联想全场景AI终端点亮智能未来 抢先李飞飞!世界模型能多人联机玩FPS游戏了 国产GPU开始造世界!国内首个全栈具身智能仿真平台来了 Cursor新模型,你怎么还在套Kimi?马斯克你怎么还吆喝上了?? L2++「五冠王」文远知行:自动驾驶版的张雪机车,专治各种不服 5.20 明天见!拿好这份参会指南|AIGC2026峰会 Qwen最新3.7 Max预览版空降!两代超大杯并行迭代,林俊旸走了但还在加速 百度无人车新纪录:周订单破35万!李彦宏:开始单城盈利了 重塑主流PC,第三代英特尔酷睿开启全民AI轻薄本时代 AI水论文封一年,署名连坐!arXiv最严新规来了,陶哲轩附议 openJiuwen社区开源新招:重磅发布JiuwenSwarm,拉开群体智能“养蜂”序幕 华为“养”出半个具身智能创业圈 上交x创智x瑞金联合发布CX-Mind:胸片诊断进入“可验证推理”时代 8B模型做生物实验:实验步骤顺序不乱、剂量无幻觉|ICLR 2026 信通院&清华提出FedRE:用「纠缠」搞定联邦学习三难困境 | CVPR 26 黄仁勋北京必吃榜我们都尝了!后海酒吧老板:他答应以后每年来一次 LeCun炮轰Hinton:他认可LLM就是想摆烂退休了! 30万奖金池,这道汉语方言对话题等你来解丨第十一届信也科技杯全球AI算法大赛 一只机器狗,把英伟达的算力王座拱翻了 世界大学生超级计算机竞赛首设“英才对接”环节,搭建“赛场—职场”人才供需桥梁 Agent、多模态、应用、算力一天看尽,峰会亮点在此|5.20日,来现场一起AI 龙虾之父月烧940万元的token!要不是入职OpenAI还真用不起 SFT别急着接RL!你的多模态大模型可能一直在“带伤训练” 6.4k Stars!用Claude Code写论文的全套流水线,有人打包开源了 不用再找了,AI落地最全的实战打法,都在亦庄这场大会里 奥特曼投的芯片涨疯了,今年最大科技IPO 虾马之后又火一个!OpenHuman用20分钟了解你的一切,存成卡帕西式知识库 别让模型烧Token了!GitHub 20k星神作:把全网变成命令行 中国500万医生的新AI:顶刊独家联手,卷的就是证据源 15.68万乐道L80开卖,厨房搬进前备厢,李斌:纯电大五座SUV的“拐点” 华为云创想者大会主题论坛议程公布:释放Agentic AI新布局 Need is all you need:AI接手Coding后,程序员最值钱的能力只剩这一项? 容联云发布“数字员工”级 Al Agent 平台,重塑大模型联络中心 手机的智能体AI,正在因为天玑全面跃升 阿里发布Qoder 1.0,可全面接管代码生成、验证和交付流程 坐到马斯克和库克中间的湖南女人 蚂蚁百灵 Ring-2.6-1T 开源 Agent 执行能力全面增强 智能无处不在:OpenClaw预示的AI未来 英伟达给黄仁勋儿女涨薪了!年薪百万美元,“凭能力而不是身份” 数亿元融资落地!国内最早布局“人类学习”路线的具身公司,用人类视角重做具身智能 人手一个数据库,Kimi背后这套AI基建到底有多能扛? 重生之我在AI时代当老板:让一群Agent互相PUA 淘天金码奖落幕:20 名超级工程师诞生,推动 AI Native 实践 国产GPU组了个开源局,把SGLang等核心开发者都摇来了! Robotaxi第一股又涨疯了 腾讯开源 Agent 记忆技术方案,Token 消耗最高降低 61% 阿里 AI 应用新进展:悟空开始逐步规模化放量 田渊栋AI创业估值315亿,老黄苏妈都投了,姚班施天麟也是合伙人 亚历山大王回应一切:LeCun、Manus,“我的父母都是中国人” Waymo CEO回应L2升维L4:有可能,但只靠端到端还不够 倒计时一周,AIGC峰会嘉宾又上新了!一起来看第三波嘉宾 8岁小学生idea直接变应用,秒哒3.0刚刚把AI应用门槛打没了 挑战扩散自回归统治!字节提出视觉生成第三种路线,让模型像人类一样边画边改 林俊旸果然创业了!一个“Qwen负责人”头衔值135亿 苹果画的饼谷歌率先搞定!Gemini全面进驻全家桶,连鼠标都AI上了 高德与千问C端应用团队开源AGenUI:首个覆盖iOS、安卓、鸿蒙三端的原生A2UI框架 AI拿婚外情写勒索邮件,查一年告诉我科幻小说教坏的 AI步入“自我进化”时代,李彦宏首提AI时代度量衡“DAA”|Create2026百度AI开发者⼤会速览 Auto Research时代,47个没有标准答案的任务成了Agent能力必测榜
蚂蚁灵波LingBot-VA论文被机器人顶会RSS 2026接收,让机器人边推演、边行动
量子位的朋友们 · 2026-05-25 · via 量子位

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

2026-05-25 14:26:38 来源:量子位

获得了国际机器人研究共同体的高度认可

蚂蚁灵波科技与香港科技大学等高校合作完成的研究论文 《Causal World Modeling for Robot Control》被国际机器人顶级学术会议 Robotics: Science and Systems(RSS)2026 接收。

RSS 是全球机器人领域公认的顶级学术会议之一,长期关注机器人学习、控制、感知、规划与系统等前沿方向,录用标准严格。论文被 RSS 接收,意味着相关研究不仅具有学术创新性,也获得了国际机器人研究共同体的高度认可。

这项研究的核心,是让机器人不只是完成动作,还能够在行动前预测世界会如何变化。论文提出了面向机器人控制的因果世界建模框架,并将其落地为全球首个开源的自回归视频-动作世界模型 LingBot-VA。该模型能够在机器人执行任务的过程中,持续预测环境变化,并根据预测结果生成下一步动作指令,使机器人具备类似人类“边观察、边判断、边行动”的能力。

对蚂蚁灵波而言,此次论文入选 RSS 2026,标志着其在“世界模型驱动机器人控制”方向上的探索获得国际顶级学术平台认可,也进一步验证了 LingBot-VA 作为具身智能基础模型的技术价值。未来,这一路线有望推动机器人从依赖指令执行,走向更强的环境理解、任务泛化和自主决策。

对机器人来说,真正困难的并不只是完成动作,还需要理解这个动作会带来什么变化。例如,拿起杯子后桌面会怎样变化,推动抽屉后物体位置会怎样改变。LingBot-VA 的核心突破,正是把这种对未来变化的预测能力引入机器人控制,让机器人先预测世界接下来会变成什么样,再根据预测结果决定应该如何行动。

这也是论文强调“因果世界建模”的原因。真实物理世界沿时间向前,因此机器人在预测未来时,也必须按照真实时间顺序一步步向前推演。LingBot-VA 将这一因果关系写入模型结构,每一步预测都只依据此前的观察和动作,按时间顺序展开。这样一来,模型生成的就不仅仅是一段展示未来的视频,而是一条可用于机器人控制决策的因果轨迹。这也让模型具备了更强的长期记忆能力,对于完成长时序、多步骤的真实任务尤其重要。

在技术实现上,LingBot-VA 采用 Mixture-of-Transformers(MoT)架构,将视频预测和动作生成统一到同一个自回归扩散框架中。模型还设计了闭环推演机制,在任务执行过程中持续接收真实环境反馈,减少长时间预测中的误差累积。

论文在仿真基准和真实机器人任务上系统验证了 LingBot-VA 的性能。在 RoboTwin 2.0 的 50 个双臂操作任务中,LingBot-VA 在 Easy 和 Hard 设置下分别取得 92.0% 和 91.1% 的平均成功率;在 LIBERO 基准上达到 98.5%。

在真实世界评测中,面对长时序、高精度以及柔性与关节物体操控这三大类 6 项高难度挑战,LingBot-VA 仅需 50 条真实示范数据即可完成适配,整体成功率较业界基线 π0.5 提升超过 20 个百分点,展现出良好的数据效率和泛化能力。

LingBot-VA 已在今年早些时候开放模型权重、训练与推理代码。研究人员和开发者可在 Model Scope、Hugging Face 和 GitHub 访问下载。

论文链接:https://arxiv.org/abs/2601.21998

项目主页:https://technology.robbyant.com/lingbot-va

版权所有,未经授权不得以任何形式转载及使用,违者必究。