惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

T
Tailwind CSS Blog
H
Heimdal Security Blog
The Register - Security
The Register - Security
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
博客园 - 聂微东
Apple Machine Learning Research
Apple Machine Learning Research
Engineering at Meta
Engineering at Meta
Hugging Face - Blog
Hugging Face - Blog
大猫的无限游戏
大猫的无限游戏
Recent Announcements
Recent Announcements
博客园 - Franky
G
Google Developers Blog
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
Google DeepMind News
Google DeepMind News
B
Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
美团技术团队
酷 壳 – CoolShell
酷 壳 – CoolShell
博客园 - 司徒正美
IT之家
IT之家
博客园 - 【当耐特】
Hacker News: Ask HN
Hacker News: Ask HN
SecWiki News
SecWiki News
有赞技术团队
有赞技术团队
H
Hacker News: Front Page
Application and Cybersecurity Blog
Application and Cybersecurity Blog
S
Security Affairs
S
Securelist
Last Week in AI
Last Week in AI
L
Lohrmann on Cybersecurity
博客园_首页
T
Troy Hunt's Blog
N
News and Events Feed by Topic
www.infosecurity-magazine.com
www.infosecurity-magazine.com
C
Cyber Attacks, Cyber Crime and Cyber Security
J
Java Code Geeks
V
Visual Studio Blog
量子位
AWS News Blog
AWS News Blog
罗磊的独立博客
S
SegmentFault 最新的问题
V
V2EX
腾讯CDC
Spread Privacy
Spread Privacy
Help Net Security
Help Net Security
S
Security Archives - TechRepublic
Attack and Defense Labs
Attack and Defense Labs
Cyberwarzone
Cyberwarzone
Project Zero
Project Zero
P
Privacy & Cybersecurity Law Blog

雷峰网

1.8亿人在小红书读书:图书业在小红书电商营收规模年增超30% | 雷峰网 减重300kg,首搭5nm智驾芯片:2026款乐道L90正式亮相 | 雷峰网 阶跃和千⾥科技官宣战略合作:打造原⽣智驾基座模型,提升物理AI能⼒上限 | 雷峰网 “还债骑手”被强制下线240次:“开始我很反感过劳提醒,影响赚钱” | 雷峰网 石头科技:2025年营收高增56.51%,2026Q1营收增23.31% | 雷峰网 Mythos引爆攻击工业化时代,奇安信:构建三位一体内生安全体系是破解之道 | 雷峰网 曝两家科技大厂争投DeepSeek,估值飙至200亿美元;小米深夜放大招!最强大模型MiMo-V2.5系列发布;微软 Xbox 部门将裁员15% | 雷峰网 RGB-Mini LED电视普及风暴,海信正式发布小墨E5S Pro | 雷峰网 标配8255芯片与CDC,奇瑞试图终结“燃油车无智驾”时代 | 雷峰网 德赛西威也不相信,智驾能让Tier1躺着赚钱 | 雷峰网 找来刘翔做代言人,可能是智己LS8最好的一步棋 | 雷峰网 「中国版Grok上车」分水岭:阶跃交出首份量产答卷 | 雷峰网 百度Create大会双主论坛议程揭晓,多项重磅升级发布将集中亮相 | 雷峰网 泄露用户隐私!曝某AI助手将B用户简历发给A用户;苹果更换CEO原因曝光;微信宣布5国可用微信支付;航旅纵横「崩」了一天,借钱功能却正常 | 雷峰网 一季度交付1200件精益工具,希音深入技术创新提升按需时尚竞争力 | 雷峰网 从“替代”到“重构”:联想开天“1+2+N”如何重写信创AI PC逻辑? | 雷峰网 中山大学郭裕兰团队:数据充足却训练失败,多智能体到底卡在哪丨CVPR 2026 | 雷峰网 上交大 x vivo 团队:一个简单改动,让 diffusion 全面提升丨CVPR 2026 死亡率「99%」的芯片创业淘汰赛,为旌科技为何能活下来? | 雷峰网 清华段岳圻团队论文:从调参数到做控制,文生图迎来一次方法论升级丨CVPR 2026 | 雷峰网 东南大学耿新团队:模型不是不会做,而是被「挤掉了能力」丨CVPR 2026 | 雷峰网 西湖大学张驰团队:不重训,也能让视频生成更长更稳丨CVPR 2026 | 雷峰网 西湖大学张驰团队:从视觉合成到空间理解,视频 AI 正在「转向」丨CVPR 2026 | 雷峰网 21.0975 公里,是人形机器人的里程碑,也是 RISC-V 的新起点 | 雷峰网 独家 | 华为19级天才少年赵立晨离职创业,瞄准具身 Agentic OS 独家 | CMU系⼜诞⽣⼀家具⾝智能公司「Zeno AI」 | 雷峰网 Token消耗量翻10倍才算企业转型及格线?三位产业一线大佬教你用出性价比 | 雷峰网 阿里发布Qwen3.6-Max预览版,登顶最佳国产模型 | 雷峰网 郭达雅加入巨头背后:顶尖AI人才为何向大厂「回流」? | 雷峰网 解决机器人散热困境,华科冷芯高速悬浮泵液冷方案助力荣耀人形机器人“闪电”夺冠 | 雷峰网 智元邓泰华宣布:具身智能行业进入「部署态」 | 雷峰网 独家丨前安克研发总监丁准离职创业,获头部美元基金押注 | 雷峰网 曝DeepSeek V4将于本周发布,梁文锋对外融资20亿;雷军在服务区被堵车里维权?小米徐洁云回应;宇树H1半马被担架抬离赛道丨雷峰早报 | 雷峰网 广州一斗虾赛现场各路选手比拼蒸馏,现场诞生近50个“技能包” | 雷峰网 智元 ×Hitch Open|深耕具身智能,共建全球物理智能学术生态 | 雷峰网 2026广汽科技日重磅发布五大核心技术,以“科技向心”引领智能出行时代 | 雷峰网 一汽大众与卓驭科技的七年协同,交出一份燃油车智能化的成绩单 | 雷峰网 腾讯的长青游戏,今天又进化了一次 | 雷峰网 智己LS8上市:24.98万起售,刘翔站台的这台「最强8系」能打吗? | 雷峰网 全球1100万台出货,追觅打造最聪明的扫地机 | 雷峰网 阶跃率先跑通“中国版 Grok 上车”量产交付!超级 Eva 搭载极氪8X 今起上市 物理AI时代,为什么需要一颗“舱驾融合”芯片? | 雷峰网 逸安启欢迎问界加入,与宝马、梅赛德斯-奔驰携手, 共同推进中国豪华超充网络的发展 | 雷峰网 逐际动力开源 FluxVLA Engine:专为具身智能打造的标准化VLA工程底座 | 雷峰网 独家丨AWS大中华区多位L8高管迎来变动,SA部门负责人代闻离职 | 雷峰网 头部品牌 “加码”东南亚 泡泡玛特新品在Lazada发售 | 雷峰网 D19起售价21.98万元,零跑能成为9系SUV的“破局者”吗? | 雷峰网 全球首款!进迭时空 RISC-V AI CPU K3 成功适配 OpenHarmony 6.1 4小时闭门会,15位运动科技创业者聊透了哪些「不能公开说」的真相 | 雷峰网 在女性黑客松上,看见AI硬件的另一种可能 | 雷峰网 Plaud 爆火后,YoooClaw 要改写 AI 硬件的剧本 黄仁勋:DeepSeek在华为芯片上发布「很可怕」;抖音集团副总裁辟谣郭达雅亿元年薪入职字节;五角大楼与通用、福特等汽车制造商讨论造军火 | 雷峰网 正式官宣!佑驾创新与荣耀(HONOR)达成合作,以“无人车+机器人”打通全链路无人化闭环 | 雷峰网 解耦性能与厚重,英特尔AI高静Plus正在重写游戏本定义 | 雷峰网 独家丨Somnia Lab 完成千万美元天使轮融资,瞄准人机关系入口与万亿级具身情感生态 | 雷峰网 腾讯发布并开源混元世界模型 2.0,一句话造出3D世界,兼容游戏引擎! | 雷峰网 阿里发布世界模型HappyOyster,与谷歌Genie3竞争 | 雷峰网 从「集体暴跌」到「双轨分化」:一篇论文误读如何撕开DDR真实行情? | 雷峰网 格力高管炮轰友商被狂怼:又当又立!「真铜实料」这四字不姓格;美国将退还超1万亿元关税;品牌GMV高速增长,速卖通将成品牌出海全新主场 | 雷峰网 全球线上首发!辉瑞新一代减重药先维盈®开启预售服务,美团买药又下一城 | 雷峰网 傲基「生死局」:绝地反杀与盈利迷途 | 雷峰网 阿里ATH发布AI开发工具Meoo,已打通阿里云核心产品 | 雷峰网 美团闪购升级闪电仓供应链服务平台:向全行业商家开放即时零售供应链基建 | 雷峰网 阿里云连续5年稳居游戏云市场份额第一! | 雷峰网 与阿里成立合资公司后,新世界旗下Gmarket商品交易额(GMV)实现双位数增长 | 雷峰网 度小满发布DXMClawPay 面向Skill开发者提供一站式支付接入方案 | 雷峰网 滴滴自动驾驶全球化布局加快,年内在阿联酋开展试点 | 雷峰网 金立创始人刘立荣消失8年后最新动向:疑在印尼卖家具;月薪3万,DeepSeek聘人去内蒙草原守机房;比亚迪坪山园区大火,公司回应火势已扑灭 | 雷峰网 水下绞杀:清洁机器人渠道里的生意与生死 | 雷峰网 墨腾报告:东南亚电商平台成交额五年翻三倍 三大平台瓜分万亿市场 | 雷峰网 火山引擎:Seedance 2.0 API 服务全面开放 | 雷峰网 中远海运特运X火山引擎:“数字员工”驶向智慧航运新蓝海 | 雷峰网 重新认识具身行业,从自变量的这封邀请函开始 | 雷峰网 做了5年3D打印机,我发现了世界模型的Scaling Law | 雷峰网 别克×火山引擎:至境E7行业首发搭载豆包大模型最新版 | 雷峰网 强强联手,追觅牵手阿里速卖通,将在海外加大投入 | 雷峰网 推理卡毛利率下滑超7%,天数智芯「降价换量」的买卖值不值? | 雷峰网 明日新程完成连续两轮融资,领跑Harness群体多智能体赛道 | 雷峰网 「作弊」内幕曝光!3DMark回应将某知名国产手机除名;李想朋友圈炮轰东风日产恶意拉踩,后者高管回应;美的空调又发行业首创产品 | 雷峰网 50万起步的蔚来ES9,能否站稳高端? | 雷峰网 汽车行业已在阿里云上使用超10万卡“真武”PPU研发智驾 | 雷峰网 百度智能云联合多家头部具身智能企业,打造具身智能数据超市 | 雷峰网 从汽车到物理 AI:何小鹏眼中的智能汽车下半场 | 雷峰网 首个跑通端到端闭环的全模态安全脱敏的龙虾盒子,无问芯穹InfiniClaw Box让本地龙虾也能放心用! | 雷峰网 当参数不再决定胜负,AI时代的企业级SSD靠什么「赢」?|MemoryS 2026 | 雷峰网 独家丨继大疆押注后,智能派再获数亿元融资,或与拓竹正面硬刚 | 雷峰网 阿里视频生成大模型Wan2.7登顶DesignArena榜单 | 雷峰网 KV Cache需求暴涨32倍,AI如何重写存储产业链的「旧分工」?| MemoryS 2026观察 | 雷峰网 微软小冰,生不逢时 | 雷峰网 豆包APP实时语音通话升级全双工模型 抗干扰与低时延能力提升 | 雷峰网 中国充电联盟与万勋科技联合发布《中国新能源汽车自动充电用户行为洞察报告》加速自动充电规模商用 | 雷峰网 继“同事.skill”走红,周鸿祎回应“把自己炼成AI分身”:这才是数字分身的正确未来 | 雷峰网 章鱼动力获得新加坡顶级风投 K3领投的数亿元投资 | 雷峰网 港中文薛天帆团队:实现 4K 全景视频生成,普通视频也能「长出空间」丨CVPR 2026 | 雷峰网 独家丨前大疆T4悍将谢博文:从具身机器人转战桌面CNC,深圳再启「无限工坊」 | 雷峰网 2026淘宝直播三大主线:提效新品,造优质主播差异化,增优质内容曝光 | 雷峰网 阿里云百炼上线Agent记忆库,让「龙虾」应用更懂用户 | 雷峰网 百度官宣!Create2026百度AI开发者大会定档5月13至14日 | 雷峰网 印度禁止中国大陆产摄像头监控:花高价大批替换,国产厂商回应;传宇树科技与阿里达成出海战略合作;DeepSeek上线专家模式 | 雷峰网 20分钟破1000万!首日破3000万!创想三维2026全球3D打印类目众筹王者!AI+生态双向助推,3D打印布道者重新定义3D打印生态! | 雷峰网
国内首个!具身数采「黑箱」正式开源,具身数据昂贵的时代结束了 | 雷峰网
2026-06-16 · via 雷峰网
国内首个!具身数采「黑箱」正式开源,具身数据昂贵的时代结束了
自变量开源XRZero-G0,数采成本直降到1/20。

    作者丨齐铖湧

    编辑丨马晓宁

最近具身行业被一个开源项目刷屏了。

最早只是小圈子里传“有人在社区开源了一整套具身数据集”。我抱着“看看热闹”的心态去看了看,越看越不对劲,这不是简单的数据集,这是一整个无本体数采系统啊。

换句话说,别人开源的是"一段代码",而这个开源的是一套全身无本体数采+质检+训练+真机评测的完整链路,还有2000多小时、覆盖3000个任务的多模态无本体数据集,都完整打包放出来了。

国内首个!具身数采「黑箱」正式开源,具身数据昂贵的时代结束了
国内首个!具身数采「黑箱」正式开源,具身数据昂贵的时代结束了

论文地址:https://arxiv.org/abs/2604.13001

这在国内还是头一遭,于是我深扒了扒对应的论文:

简单来说,XRZero-G0 这篇论文做了两件事,第一是撬开了机器人数采的"黑箱",手把手演示了如何超低成本采集一套高质量数据。第二,手把手教你怎么数据训练。

先说第一点,数据采集。之前大家可能听说过“具身行业采数据又难又贵”,甚至有人抛出暴论,说具身发展慢,都是被数采拖累了。

你看大模型,吃的是文本,互联网上到处都是。机器人吃的是物理数据,每一条都得真金白银去采。 而且过去采数据,行业里有三个大坑,贵、脏、不可复用,这也构成了具身数据层的"不可能三角"。

国内首个!具身数采「黑箱」正式开源,具身数据昂贵的时代结束了

XRZero-G0论文里,给了一个巧妙的解法,核心就一句话:人戴着设备去干活,现场不需要机器人。

这条路其实有人走过(比如UMI范式),但以前这种方式有个致命的毛病,采回来的数据像个"黑箱",你不知道真机到底能不能跑通。而XRZero-G0这次通过三道"安检",把黑箱变成了透明的白盒。

第一道安检:三个摄像头。

过去数采手持设备只有单视角或双视角,这种有个缺点,双手一交叉,或者物体被手臂挡住,数据当场报废。XRZero-G0 的做法很直接:给操作员戴上PICO  VR 头显,头顶一个全局相机,左右手腕各挂一个相机。

国内首个!具身数采「黑箱」正式开源,具身数据昂贵的时代结束了

这三路视角加上六自由度位姿信息,加上背包边缘计算做时空对齐,精度直接≤4 毫米,不管你怎么转身、俯身、走动,遮挡和漂移问题都不会发生。

国内首个!具身数采「黑箱」正式开源,具身数据昂贵的时代结束了

第二道安检:装一个虚拟限位器。

大家知道人的关节灵活,能做瑜伽,但机器人不行。之前遥操作的时候,我做了一个机器人做不出的动作,结果电机烧了。XRZero-G0 很聪明,引入自动逆运动学(IK)验证,过滤掉超出关节极限的动作。

第三道安检:真机回放。

前两道筛完,系统还会随机抽一部分数据,直接丢给真实的双臂机器人做"开环回放"。只有机器人顺利把任务做完,这批数据才算入库。

三层漏斗筛下来,入库数据的有效率被拉升到了 85% 以上,可用性跟真机数据一样,采集速度还更快。

看论文里数据,简单任务从 35 秒压缩到 15 秒,提速 2.33 倍;复杂任务也能快 1.71 倍。峰值采集速度达到 93.2 条轨迹每小时。这不比真机香?

国内首个!具身数采「黑箱」正式开源,具身数据昂贵的时代结束了

但以上只是教会了"怎么更好的采集数据",XRZero-G0 论文里更关键的是教大家"怎么训"数据。

具身训练里,大家都知道要把"便宜无本体数据"和"昂贵真机数据"混在一起用,但比例怎么配?以前全靠炼丹。

XRZero-G0 团队做了一件特别扎实的事,系统性穷举实验,最终发现了一个"黄金比例"。

在这之前,他们对比了三套方案:

▪ 500 条纯真机数据(基线)

▪ 500 条真机+500 条无本体(1:1

▪ 50 条真机+500 条无本体(10:1)

结果出乎意料:10:1 的方案,成功率跟 500 条纯真机基线持平,甚至更高。 说人话就是:你把真机数据用量砍掉 90%,总成本压到传统方式的二十分之一,训出来的模型一样聪明。 20 倍的成本效率跃升。

论文解释了这背后的原因,叫"少样本物理锚定效应"。

国内首个!具身数采「黑箱」正式开源,具身数据昂贵的时代结束了

还没完,这套数据训出来的模型,还能做到"零样本"跨本体迁移。

前面说了,传统真机遥操作,最怕本体迁移。桌子高了十公分,或者换一台机器人,直接崩。但 XRZero-G0 是背包式的,操作员走来走去,采集过程中视角、高度、光照天然充满了动态变化。这种丰富的"噪声",反而让模型练就了极强的鲁棒性。(雷峰网(公众号:雷峰网)

论文展示了非常震撼的细节:把这套混合数据训出来的模型,扔到 EX001 和 CX001 上,没有见过真机数据,直接部署, 结果插花、叠毛巾、装香肠都没问题。

国内首个!具身数采「黑箱」正式开源,具身数据昂贵的时代结束了

简单聊聊XRZero-G0 读后感,这篇论文核心就是把"怎么低成本采数据"和"怎么高效用数据"两件事,像说明书一样,掰开揉碎了给从业者看。

大家都能感知到,具身行业正从"拼Demo"转向"拼数据"。但该如何堆时长,行业是缺乏共识和方向的。XRZero-G0把"更方便地采数据"、"找到完美的数据配比",进而到最终实现"零样本跨本体迁移"这一整条链路,都教给行业了。

这种工程化的工作,不是某一个高校实验室或者明星学者能单枪匹马完成的,它必须是一支既懂学术又懂产业的产业界团队。(雷峰网)

XRZero-G0 背后的公司,是自变量机器人(X-Square Robot)。

要理解自变量为啥能做XRZero-G0,看他们的路径选择就知道,公司从Day One就选端到端大模型,同时探索VLA、WM、WUM三条路线。圈内人都懂,这种路线没有扎实Infra能力根本跑不通,所以早期的从WALL-OSS,到XRZero-G0,自变量一直在建和Infra有关的基础设施。

这条路虽然难,但是正确。看资本就知道了,自变量不到两年9轮融资,估值过百亿,字节、美团、阿里、小米四家大厂都在股东名单。

至于XRZero-G0全量开源的原因,更简单粗暴了。

具身的"ChatGPT时刻"不可能靠一家公司憋出来。当高校、中小团队、个人开发者都能用XRZero-G0这套标准化工具链批量产数据时,全行业的数据飞轮才真正开始转动,那时候自变量的护城河,就建起来了。

文末附上 XRZero-G0 的GitHub主页,建议大家去玩玩看:

https://github.com/X-Square-Robot/XRZero-G0

国内首个!具身数采「黑箱」正式开源,具身数据昂贵的时代结束了
国内首个!具身数采「黑箱」正式开源,具身数据昂贵的时代结束了

雷峰网原创文章,未经授权禁止转载。详情见转载须知

国内首个!具身数采「黑箱」正式开源,具身数据昂贵的时代结束了