惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

E
Exploit-DB.com RSS Feed
Google Online Security Blog
Google Online Security Blog
SecWiki News
SecWiki News
Application and Cybersecurity Blog
Application and Cybersecurity Blog
The Last Watchdog
The Last Watchdog
GbyAI
GbyAI
Microsoft Azure Blog
Microsoft Azure Blog
MyScale Blog
MyScale Blog
Y
Y Combinator Blog
Microsoft Security Blog
Microsoft Security Blog
Martin Fowler
Martin Fowler
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
B
Blog RSS Feed
Hacker News - Newest:
Hacker News - Newest: "LLM"
D
DataBreaches.Net
Cloudbric
Cloudbric
Help Net Security
Help Net Security
B
Blog
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
罗磊的独立博客
PCI Perspectives
PCI Perspectives
Apple Machine Learning Research
Apple Machine Learning Research
量子位
P
Proofpoint News Feed
N
News and Events Feed by Topic
Attack and Defense Labs
Attack and Defense Labs
Stack Overflow Blog
Stack Overflow Blog
Recent Commits to openclaw:main
Recent Commits to openclaw:main
T
The Blog of Author Tim Ferriss
J
Java Code Geeks
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
人人都是产品经理
人人都是产品经理
小众软件
小众软件
www.infosecurity-magazine.com
www.infosecurity-magazine.com
The Register - Security
The Register - Security
S
Secure Thoughts
The GitHub Blog
The GitHub Blog
Forbes - Security
Forbes - Security
M
MIT News - Artificial intelligence
Recorded Future
Recorded Future
H
Heimdal Security Blog
S
Security Archives - TechRepublic
WordPress大学
WordPress大学
C
Cisco Blogs
博客园 - 【当耐特】
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
C
Check Point Blog
AI
AI
美团技术团队
Blog — PlanetScale
Blog — PlanetScale

雷峰网

1.8亿人在小红书读书:图书业在小红书电商营收规模年增超30% | 雷峰网 减重300kg,首搭5nm智驾芯片:2026款乐道L90正式亮相 | 雷峰网 阶跃和千⾥科技官宣战略合作:打造原⽣智驾基座模型,提升物理AI能⼒上限 | 雷峰网 “还债骑手”被强制下线240次:“开始我很反感过劳提醒,影响赚钱” | 雷峰网 石头科技:2025年营收高增56.51%,2026Q1营收增23.31% | 雷峰网 Mythos引爆攻击工业化时代,奇安信:构建三位一体内生安全体系是破解之道 | 雷峰网 曝两家科技大厂争投DeepSeek,估值飙至200亿美元;小米深夜放大招!最强大模型MiMo-V2.5系列发布;微软 Xbox 部门将裁员15% | 雷峰网 RGB-Mini LED电视普及风暴,海信正式发布小墨E5S Pro | 雷峰网 标配8255芯片与CDC,奇瑞试图终结“燃油车无智驾”时代 | 雷峰网 德赛西威也不相信,智驾能让Tier1躺着赚钱 | 雷峰网 找来刘翔做代言人,可能是智己LS8最好的一步棋 | 雷峰网 「中国版Grok上车」分水岭:阶跃交出首份量产答卷 | 雷峰网 百度Create大会双主论坛议程揭晓,多项重磅升级发布将集中亮相 | 雷峰网 泄露用户隐私!曝某AI助手将B用户简历发给A用户;苹果更换CEO原因曝光;微信宣布5国可用微信支付;航旅纵横「崩」了一天,借钱功能却正常 | 雷峰网 一季度交付1200件精益工具,希音深入技术创新提升按需时尚竞争力 | 雷峰网 从“替代”到“重构”:联想开天“1+2+N”如何重写信创AI PC逻辑? | 雷峰网 中山大学郭裕兰团队:数据充足却训练失败,多智能体到底卡在哪丨CVPR 2026 | 雷峰网 上交大 x vivo 团队:一个简单改动,让 diffusion 全面提升丨CVPR 2026 死亡率「99%」的芯片创业淘汰赛,为旌科技为何能活下来? | 雷峰网 清华段岳圻团队论文:从调参数到做控制,文生图迎来一次方法论升级丨CVPR 2026 | 雷峰网 东南大学耿新团队:模型不是不会做,而是被「挤掉了能力」丨CVPR 2026 | 雷峰网 西湖大学张驰团队:不重训,也能让视频生成更长更稳丨CVPR 2026 | 雷峰网 西湖大学张驰团队:从视觉合成到空间理解,视频 AI 正在「转向」丨CVPR 2026 | 雷峰网 21.0975 公里,是人形机器人的里程碑,也是 RISC-V 的新起点 | 雷峰网 独家 | 华为19级天才少年赵立晨离职创业,瞄准具身 Agentic OS 独家 | CMU系⼜诞⽣⼀家具⾝智能公司「Zeno AI」 | 雷峰网 Token消耗量翻10倍才算企业转型及格线?三位产业一线大佬教你用出性价比 | 雷峰网 阿里发布Qwen3.6-Max预览版,登顶最佳国产模型 | 雷峰网 郭达雅加入巨头背后:顶尖AI人才为何向大厂「回流」? | 雷峰网 解决机器人散热困境,华科冷芯高速悬浮泵液冷方案助力荣耀人形机器人“闪电”夺冠 | 雷峰网 智元邓泰华宣布:具身智能行业进入「部署态」 | 雷峰网 独家丨前安克研发总监丁准离职创业,获头部美元基金押注 | 雷峰网 曝DeepSeek V4将于本周发布,梁文锋对外融资20亿;雷军在服务区被堵车里维权?小米徐洁云回应;宇树H1半马被担架抬离赛道丨雷峰早报 | 雷峰网 广州一斗虾赛现场各路选手比拼蒸馏,现场诞生近50个“技能包” | 雷峰网 智元 ×Hitch Open|深耕具身智能,共建全球物理智能学术生态 | 雷峰网 2026广汽科技日重磅发布五大核心技术,以“科技向心”引领智能出行时代 | 雷峰网 一汽大众与卓驭科技的七年协同,交出一份燃油车智能化的成绩单 | 雷峰网 腾讯的长青游戏,今天又进化了一次 | 雷峰网 智己LS8上市:24.98万起售,刘翔站台的这台「最强8系」能打吗? | 雷峰网 全球1100万台出货,追觅打造最聪明的扫地机 | 雷峰网 阶跃率先跑通“中国版 Grok 上车”量产交付!超级 Eva 搭载极氪8X 今起上市 物理AI时代,为什么需要一颗“舱驾融合”芯片? | 雷峰网 逸安启欢迎问界加入,与宝马、梅赛德斯-奔驰携手, 共同推进中国豪华超充网络的发展 | 雷峰网 逐际动力开源 FluxVLA Engine:专为具身智能打造的标准化VLA工程底座 | 雷峰网 独家丨AWS大中华区多位L8高管迎来变动,SA部门负责人代闻离职 | 雷峰网 头部品牌 “加码”东南亚 泡泡玛特新品在Lazada发售 | 雷峰网 D19起售价21.98万元,零跑能成为9系SUV的“破局者”吗? | 雷峰网 全球首款!进迭时空 RISC-V AI CPU K3 成功适配 OpenHarmony 6.1 4小时闭门会,15位运动科技创业者聊透了哪些「不能公开说」的真相 | 雷峰网 在女性黑客松上,看见AI硬件的另一种可能 | 雷峰网 Plaud 爆火后,YoooClaw 要改写 AI 硬件的剧本 黄仁勋:DeepSeek在华为芯片上发布「很可怕」;抖音集团副总裁辟谣郭达雅亿元年薪入职字节;五角大楼与通用、福特等汽车制造商讨论造军火 | 雷峰网 正式官宣!佑驾创新与荣耀(HONOR)达成合作,以“无人车+机器人”打通全链路无人化闭环 | 雷峰网 解耦性能与厚重,英特尔AI高静Plus正在重写游戏本定义 | 雷峰网 独家丨Somnia Lab 完成千万美元天使轮融资,瞄准人机关系入口与万亿级具身情感生态 | 雷峰网 腾讯发布并开源混元世界模型 2.0,一句话造出3D世界,兼容游戏引擎! | 雷峰网 阿里发布世界模型HappyOyster,与谷歌Genie3竞争 | 雷峰网 从「集体暴跌」到「双轨分化」:一篇论文误读如何撕开DDR真实行情? | 雷峰网 格力高管炮轰友商被狂怼:又当又立!「真铜实料」这四字不姓格;美国将退还超1万亿元关税;品牌GMV高速增长,速卖通将成品牌出海全新主场 | 雷峰网 全球线上首发!辉瑞新一代减重药先维盈®开启预售服务,美团买药又下一城 | 雷峰网 傲基「生死局」:绝地反杀与盈利迷途 | 雷峰网 阿里ATH发布AI开发工具Meoo,已打通阿里云核心产品 | 雷峰网 美团闪购升级闪电仓供应链服务平台:向全行业商家开放即时零售供应链基建 | 雷峰网 阿里云连续5年稳居游戏云市场份额第一! | 雷峰网 与阿里成立合资公司后,新世界旗下Gmarket商品交易额(GMV)实现双位数增长 | 雷峰网 度小满发布DXMClawPay 面向Skill开发者提供一站式支付接入方案 | 雷峰网 滴滴自动驾驶全球化布局加快,年内在阿联酋开展试点 | 雷峰网 金立创始人刘立荣消失8年后最新动向:疑在印尼卖家具;月薪3万,DeepSeek聘人去内蒙草原守机房;比亚迪坪山园区大火,公司回应火势已扑灭 | 雷峰网 水下绞杀:清洁机器人渠道里的生意与生死 | 雷峰网 墨腾报告:东南亚电商平台成交额五年翻三倍 三大平台瓜分万亿市场 | 雷峰网 火山引擎:Seedance 2.0 API 服务全面开放 | 雷峰网 中远海运特运X火山引擎:“数字员工”驶向智慧航运新蓝海 | 雷峰网 重新认识具身行业,从自变量的这封邀请函开始 | 雷峰网 做了5年3D打印机,我发现了世界模型的Scaling Law | 雷峰网 别克×火山引擎:至境E7行业首发搭载豆包大模型最新版 | 雷峰网 强强联手,追觅牵手阿里速卖通,将在海外加大投入 | 雷峰网 推理卡毛利率下滑超7%,天数智芯「降价换量」的买卖值不值? | 雷峰网 明日新程完成连续两轮融资,领跑Harness群体多智能体赛道 | 雷峰网 「作弊」内幕曝光!3DMark回应将某知名国产手机除名;李想朋友圈炮轰东风日产恶意拉踩,后者高管回应;美的空调又发行业首创产品 | 雷峰网 50万起步的蔚来ES9,能否站稳高端? | 雷峰网 汽车行业已在阿里云上使用超10万卡“真武”PPU研发智驾 | 雷峰网 百度智能云联合多家头部具身智能企业,打造具身智能数据超市 | 雷峰网 从汽车到物理 AI:何小鹏眼中的智能汽车下半场 | 雷峰网 首个跑通端到端闭环的全模态安全脱敏的龙虾盒子,无问芯穹InfiniClaw Box让本地龙虾也能放心用! | 雷峰网 当参数不再决定胜负,AI时代的企业级SSD靠什么「赢」?|MemoryS 2026 | 雷峰网 独家丨继大疆押注后,智能派再获数亿元融资,或与拓竹正面硬刚 | 雷峰网 阿里视频生成大模型Wan2.7登顶DesignArena榜单 | 雷峰网 KV Cache需求暴涨32倍,AI如何重写存储产业链的「旧分工」?| MemoryS 2026观察 | 雷峰网 微软小冰,生不逢时 | 雷峰网 豆包APP实时语音通话升级全双工模型 抗干扰与低时延能力提升 | 雷峰网 中国充电联盟与万勋科技联合发布《中国新能源汽车自动充电用户行为洞察报告》加速自动充电规模商用 | 雷峰网 继“同事.skill”走红,周鸿祎回应“把自己炼成AI分身”:这才是数字分身的正确未来 | 雷峰网 章鱼动力获得新加坡顶级风投 K3领投的数亿元投资 | 雷峰网 港中文薛天帆团队:实现 4K 全景视频生成,普通视频也能「长出空间」丨CVPR 2026 | 雷峰网 独家丨前大疆T4悍将谢博文:从具身机器人转战桌面CNC,深圳再启「无限工坊」 | 雷峰网 2026淘宝直播三大主线:提效新品,造优质主播差异化,增优质内容曝光 | 雷峰网 阿里云百炼上线Agent记忆库,让「龙虾」应用更懂用户 | 雷峰网 百度官宣!Create2026百度AI开发者大会定档5月13至14日 | 雷峰网 印度禁止中国大陆产摄像头监控:花高价大批替换,国产厂商回应;传宇树科技与阿里达成出海战略合作;DeepSeek上线专家模式 | 雷峰网 20分钟破1000万!首日破3000万!创想三维2026全球3D打印类目众筹王者!AI+生态双向助推,3D打印布道者重新定义3D打印生态! | 雷峰网
对话速腾聚创杨先声:机器人的通用智能,先从一双「不骗人」的眼睛开始 | ICRA 2026 | 雷峰网
2026-06-15 · via 雷峰网
对话速腾聚创杨先声:机器人的通用智能,先从一双「不骗人」的眼睛开始 | ICRA 2026
机器人不仅要看得见,还要看得远、看得稳、看得全。

    作者丨高景辉

    编辑丨马晓宁

当全球具身智能公司都在ICRA 2026的展台上比拼 DEMO 时,一个棘手的问题却被众人所忽视:机器人至今没有一双真正好用的眼睛。

这是整个行业心照不宣的卡点。所有人都在说大模型、VLA带来了通用智能的曙光,但落地时却卡在了最原始的环节——机器人看不准三维世界,做不了精细操作,速度永远赶不上人类。为了弥补传感器的缺陷,解决制约物理AI的卡点,公司们不得不投入大量资源搭建仿真环境、采集标注数据,用算法去“猜”深度……本质上是在用软件填硬件的坑。

在这一背景下,速腾聚创副总裁杨先声在 ICRA 做了一场学术汇报,展示了一套面向机器人的全新视觉感知架构。与行业普遍采用的“先分别采集、后算法融合”不同,这套架构在物理层面就实现了深度探测与RGB的天然对齐,深度信息与颜色信息无需后期校准,直接输出给后端。

在杨先声看来,这才是解决机器人感知问题的根本路径。但这一新架构究竟要如何打破传统3D相机“稳定、距离、精度”的不可能三角?从雷峰网(公众号:雷峰网)·AI科技评论在 ICRA 现场与杨先声的对话中,我们或许可以找到答案。

对话速腾聚创杨先声:机器人的通用智能,先从一双「不骗人」的眼睛开始 | ICRA 2026

AI科技评论:速腾在ICRA带来了新的视觉感知架构,可以简单透露下吗?

杨先声:新的架构和之前相比,最大不同在于原始数据底层就已经融合好了,所以在物理层面上,它的深度信息和颜色信息是天然对齐,不需要后期算法去处理。所以这个架构在精度、可靠性上,包括成本、性能,各方面都是比之前的方案要好,会大幅提升机器人训练数据的质量和实时感知能力,将会大大加速物理AI的进化。

AI科技评论:现在机器人在感知方面的痛点是什么?

杨先声:你可以看到所有机器人现在做一些很精细的活,但它速度很慢,远远达不到人类效率。其中主要的卡点在于感知能力,而感知能力在物理层面上是有限制的,更何况机器人在开放环境需要实时的感知决策,所以难度很大。

当然,用一个简单的传感器也能做到高智能,但这对其他技术的要求会高很多。而如果机器人对世界有清晰的感知,再做一些控制或者其他的决策就容易多了。否则就会花很多精力去做训练,做试错,让它慢慢慢慢的收敛,还要使它可控。所以我们关注的第一步就是先解决机器人的感知。

AI科技评论:相当于你们在感知层面给了机器人更高的起点,后面做其他环节就可以更加简单?

杨先声:对,这个可以分两个层面,机器人相比于自动驾驶更复杂,不光是维度更高,从一个平面会到立体空间,它面对的操作和环境也是千变万化的。而且它是有接触的,但车不需要接触障碍物。人能完成操作,是因为人的感知力很强,不仅有触觉,还有力觉,甚至还有那种接触觉,这种复合的空间立体感知能力可以准确感知周围事物空间位置的变化。

但目前机器人的眼睛现在其实并不准,大大限制了它的泛化能力。而我们现在做是,先解决他能感知环境的能力。现在机器人需要大量数据去帮助它在环境中训练,把真实世界的环境输入进去,这一步就很难了,因为把真实环境照搬仿真环境里的工作量非常大,对于很多公司是不现实的。

但如果三维空间传感器足够好,就能把完整的立体空间和色彩信息全部输入给机器人和仿真环境,成本会大大降低,所以这是关键第一步。现在机器人缺乏高质量的空间数据,不只是激光雷达这种带点云的,它还需要带色彩纹理的RGB的信息,因此我们的传感器应运而生。

AI科技评论:您在报告里强调了“深度”,机器人对深度的感知是不是行业目前比较薄弱的环节?

杨先声:对,激光雷达已经是一个比较可靠的深度传感器了,以自动驾驶为例,在大空间、长距离、车载环境上,一般每100米只有5厘米到10厘米深度误差,对于车载是够用的。但是对于机器人面对这种的复杂环境,需要到毫米级的深度感知。

目前能用的像双目结构光、ToF这种传统3D相机,它们在很多环境都不稳定,测距范围也就是一米左右。

而且还有三个物理层面无法解决的缺陷:第一,这三种方案都属于间接测量,能力被环境光变化限制;第二这三种方案的分辨率低,也都做不到RGBD的像素级对齐;第三,这三种方案都有CIS(图像传感器)的问题,存在无法克服的炫光、精度衰减等问题。这些方案都非常耗算力,在提升帧率、降低时延等影响机器人末端控制的关键技术点上很难做出有价值的突破。

所以,虽然大家都在用这些方案,但是都只在特定的环境当中用。而我们用激光雷达,如果能把这深度信息的精度解决,再把它的分辨率再提升,就可能是一个相对完美的传感器。我们正奔着大家心目中理想的传感器在演进,试图打破稳定、距离、精度的不可能三角。

AI科技评论:就视觉感知来说,从智驾到具身智能,哪些技术可以复用?

杨先声:我们现在其实整个激光雷达底层的技术,都已经统一了,就是我们SPAD-SoC这套数字化架构。只不过对于车载来说,我们更加专注于长距离、高分辨率、低成本,对机器人而言,我们关注近距离,高精度,小体积,低功耗,甚至要跟RGB做融合,这个其实跟体感技术是很类似的,但是我们把它最终产品形态上做了很大的区分。

AI科技评论:你们的技术路线有哪些独特的优势?

杨先声:我们的SPAD技术路线最大价值就是更高的集成度。原来SiPM可能做128线就已经是旗舰产品了,但对于我们SPAD来说,做个几百线,甚至上千线都是很容易的事情。这相当于是在性能层面已经到了另外一个维度。所以今年友商其实都在跟进这个新的方向。在这个方向上,我们的芯片有两年的代差优势。

AI科技评论:开发的壁垒在哪里?

杨先声:我们现在是全栈自研的,就是从接收芯片,发射、驱动,甚至SOC全是自研的。所以从芯片设计,芯片的流片,再到整个系统架构,包括芯片的稳定性和成本,系统的调通,系统优化……这个整个全链路其实都是壁垒,我们也是花了很长时间才走通。

AI科技评论:我看到您有一个非常通俗的表达,就是说机器人不仅要看得见,还要看得远、看得稳、看得全,能不能介绍这三个分别对应的技术问题是什么?

杨先声:“看得见”意思是,现在传统的这种机械式激光雷达分辨率很低,就是16线、32线阶段,这个雷达只能做导航,用来做空间定位,其实它是看不清你身边有什么东西,所以以前激光雷达的作用是非常有限的。

当我们推出这种几百线、上千线的高线数的激光雷达之后,它就能把整个环境用三维的方式给还原出来,那这个时候就不只是用来做的定位导航,我们还可以做精细感知。

再然后,当我们在底层,把RGB融合进来后,空间环境感知的所有信息我们用一个传感器就可以都解决。

AI科技评论:这种新的技术会不会对机器人数据采集的效率、质量有所提升?

杨先声:这是一定的,因为大部分数采公司找我们合作。他们遇到的问题是一样的:视觉可以通过大量的数据训练去获得一个比较好的成果,但是终归它不是一个很稳定、很鲁棒的一个东西,所以它精度上限不高。

虽然未来机器人可以用视觉去完成大部分工作,因为这样成本比较低,可以推广,但是在早期做训练和研究的时候,不可能用视觉去做,而且数采本身就是为了拿这个数据作为基准去训练,所以它需要高质量的数据。虽然很多人都用视觉做数采,但并不意味着真的能满足客户需求,我们其实已经收到很多终端客户的反馈,认为大部分的纯视觉数据在质量上难以满足需求。我们今年接触到很多这种做数采的客户,都在想办法去拿基于高精度的三维感知,去提升他们整体的数据质量。

AI科技评论:随着这种全新形态的RGB-D设备出现,会不会增加端测处理信号的算力要求?

杨先声:其实不会。虽然双目设备很便宜,就两个摄像头,但是需要大量的算力把深度信息给反解算出来,所以很消耗算力。而我们这种RGB-D融合的方式,可以直接计算深度信息,直接把图像信息和深度信息给到后端,没有解析的过程,所以其实它反而大大节省了算力,还能提升帧率、降低延迟,对整个VLA性能和末端控制的提升都很有价值。

AI科技评论:随着线数的增加,点云的密度在增加,处理的信号不会更多吗?

杨先声:对,但这个可以自己选择,如果不需要这么密的深度信息,依然可以选择低密度采样的方式,但是无论如何,我们至少节省了客户在后端计算的过程,提升了他们的效率,而且还节省了很多存储的空间。

AI科技评论:很多具身公司是从智驾行业转过来的,他们在选择供应商时会不会有路径依赖?

杨先声:其实会有这个趋势。因为具身智能是比自动驾驶更高端的领域,技术维度也比智驾更高,它不仅包括感知、决策、规划,还包括更高精度、更高维度的传感器的这种设计和需求,更不用说后面的控制和感知的算法其实更加复杂。所以对大家而言,不管是我们作为上游的传感器厂商,还是作为下游的这些机器人公司,他们都会一起来做,所以我觉得大家是共同在进步。

AI科技评论:未来3-5年机器人在感知方面最大的变数在哪里?

杨先声:现在有两大突破点,一是对环境的3D环境的感知,这是我们的优势。当我们这种新的RGBD方案成熟的话,那我觉得未来机器人在眼睛这个程度上,就会逐步收敛,就跟人一样,有一双眼睛就够了。然后就是要把触觉再逐步优化,因为现在触觉第一是贵,第二是它的可靠性、耐用性不够,第三是成本太高。

AI科技评论:从技术原理的角度,触觉会不会要比视觉更难达到新的高度?

杨先声:对,因为视觉归根结底还是个非接触性传感器,不会有太多的材料上面的问题。触觉传感器要实时跟环境有接触,接触会带来摩擦,就会带来可靠性的问题,甚至接触不同的物体,对不同材质啊、温度都很敏感。一旦产生交互之后,所有的问题都会升级很多。

AI科技评论:对于纯视觉的方案和激光雷达方案,企业在选择上会有什么考虑?

杨先声:我觉得机器人不存在所谓的纯视觉概念,因为人类空间感知也都是立体视觉和三维感知的。因为所谓的纯视觉没办法在这种复杂环境当中确保稳定性,而操作一定需要很高精度的空间感知能力,所以所谓的纯视觉没办法做到既高效又可靠的。

去哪看 ICRA 核心【演讲/论文】详解?

为了让国内的研发者、创业者与投资人能够毫无时差地掌握本届 ICRA 2026 的完整干货,雷峰网已全面上线【ICRA 2026 深度专区】

专区不仅全面收录了重磅论文的工程化解读、专家前沿演讲,更将持续更新前方记者的第一手会议动态。

扫描下方二维码,或点击阅读原文关注专区。

对话速腾聚创杨先声:机器人的通用智能,先从一双「不骗人」的眼睛开始 | ICRA 2026

与全球 8000 名顶尖大脑同步呼吸,抢先透视具身智能的下一个五年!

雷峰网原创文章,未经授权禁止转载。详情见转载须知