自动驾驶数据集 nuScenes

又见苍岚

COLMAP PatchMatch Stereo 算法详解事件驱动的状态机框架：从理论到工程实践 Git 在国内网络环境下无法 Push 的排查与修复 —— 配置 Clash 代理分段五次多项式插值原理详解路径插值方法深度对比研究 Claude Code 使用指南 OpenClaw 记忆管理与技能创建指南 CBS(Conflict-Based Search)算法详解 A* 算法及其变种详解 OpenClaw 配置多 Agents Windows Powershell 无法加载文件，因为在此系统上禁止运行脚本问题的解决方案 MaxClaw 安装流程大模型 AI 名词介绍 AList 网盘聚合工具简介 Protobuf 简介与测试 Claude Code 简介以及 GLM 4.7 模型接入 Github 歌词下载工具 163MusicLyrics Python __getattr__ 懒加载 Python TypedDict 机器人仿真平台 Gazebo 安装记录机器人仿真平台 Gazebo 简介多机器人路径规划问题(Multi-Agent Path Finding, MAPF)简介 Python exifread 读取修改过的 jpeg 信息错误问题修复 3D 坐标系变换的理解 3D 旋转矩阵基本概念 MongoDB Compass 介绍 Python 环境管理工具 uv Flutter 开发指南 Snipaste 安装下载与黑屏问题解决方案全局路径规划算法记录 2025 Python 版本性能测试 Flutter Hello World Flutter 安装环境配置 Ubuntu VMware 硬盘扩容后 SMBus Host controller not enabled 报错问题解决 Python NetworkX 教程 Docker GPU 报错 - Failed to initialize NVML Unknown Error 解决方案 Python matplotlib 图表绘制 cuda-toolkit 安装替代 Cuda 与 Cudnn Jinja2 Python 利用 docxtpl 和 Jinja2 生成基于模板的 Word 文档 Docker 实现 CPU 核心隔离 LoFTR 基于 Transformer 的特征提取匹配算法 OmniGlue 特征匹配 SuperGlue 使用图神经网络学习特征匹配 Ubuntu 下将 xlsx 文件按照 sheet 转换为图片 Python 使用 SQLAlchemy Python FastAPI 教程 openwrt 软路由配置安装 Nav2 地图文件（PGM/YAML）规范标准 3D OBJ 模型转换为 glb 瓦片格式 Python 源码 Redis 数据库介绍 Ubuntu 22.04 内核自动升级导致 MongoDB 7.0.12 错误记录 ubuntu 20.04 安装 ROS Noetic ubuntu 18.04 安装 ROS Melodic VMware Workstation Pro 个人免费版下载、安装、使用指南 Hybrid A-star 路径规划 Reeds-Shepp 曲线 Dubins 曲线 Linux kvm 虚拟机网络不通的问题解决方法 Ubuntu 自动内存清理 BiliBili 缓存视频转 mp4 Python 求解线性规划 3D Gaussian Splatting 官方源码实践记录 ImageMagick 教程 Ubuntu 22.04 安装 Colmap 对数几率 odds Ubuntu nmcli 网络管理工具使用指南 SuperPoint 自监督深度学习特征点提取 SyncTV Music Tag Web 在线音乐信息整理工具 ncm 格式转 mp3 MusicBrainz 音乐元数据百科数据库 Ubuntu 网络流量监控工具私人云音乐平台 Navidrome 入门手眼标定四元数（Quaternions） OHTTPS 实现免费自动 https 证书申请、更新、部署 ubuntu 22.04 安装 CloudCompare 单机 KVM 虚拟机冷迁移 Ubuntu 22.04 使用 mdadm 实现软 raid 小鱼一键安装 ROS-humble Fluid -46- 基于 Simpletex API 构建公式识别页面公式识别 API 简介 -- Simpletex 使用 Python web 部署库 waitress 3D Gaussian Splatting for Real-Time Radiance Field Rendering Ubuntu Swap 简介与空间扩展 Ubuntu 24.04 安装 forticlient Clash Verge 使用 MongoDB 7.0.17 集群 Docker 构建源码 Error code - 2013. Lost connection to MySQL server during query 问题解决 Python 日志记录库 loguru 使用指北 Python 实现 Web 日志查看服务 MySQL LOAD DATA LOCAL INFILE 极速数据加载 Image size exceeds limit of 89478485 pixels 解决方案 Docker 使用 NVIDIA GPU 驱动错误解决阿里云 docker 镜像仓库 Ubuntu中没有wired connected的解决方案 MinIO 简介 subconverter 代理订阅格式转换修复 node –openssl-legacy-provider is not allowed in NODE_OPTIONS 错误

自动驾驶数据集 nuScenes

Yiwei Zhang · 2024-09-05 · via 又见苍岚

nuScenes 是一个大型公开自动驾驶数据集，它使研究人员能够研究具有挑战性的城市驾驶情况，使用真实自动驾驶汽车的全套传感器。

简介

NuScenes 数据集 (发音为/nuːsiːnz/) 是一个公开的大规模自动驾驶数据集，由 Motional (以前的 nuTonomy)团队开发。动感正在使无人驾驶汽车成为一种安全、可靠和易于使用的现实。通过向公众发布我们的数据子集，Motion 的目标是支持公众对计算机视觉和自动驾驶的研究。

为此，我们在波士顿和新加坡收集了1000个驾驶场景，这两个城市以拥挤的交通和极具挑战性的驾驶环境而闻名。20秒长的场景是手动选择，以显示不同的和有趣的驾驶机动，交通情况和意想不到的行为。NuScenes 的丰富复杂性将鼓励开发方法，使安全驾驶在城市地区与每个场景几十个对象。通过收集不同大陆的数据，我们可以进一步研究计算机视觉算法在不同地点、天气条件、车辆类型、植被、道路标记和左右交通中的泛化。

为了方便常见的计算机视觉任务，例如目标检测和跟踪，我们在整个数据集上用 2Hz 的精确三维边界框对23个对象类进行注释。此外，我们还注释对象级属性，如可见性、活动和姿态。

对于 nuScenes 数据集，我们在波士顿和新加坡收集了大约15小时的驾驶数据。对于完整的 nuScenes 数据集，我们发布来自 Boston Seaport 和新加坡的 One North、昆斯敦和 Holland Village 地区的数据。驾驶路线是精心选择，以捕捉具有挑战性的情况。我们的目标是不同的地点，时间和天气条件。为了平衡班级频率分布，我们包含了更多稀有班级的场景(如自行车)。使用这些标准，我们手动选择1000个场景，每个场景持续时间为20秒。这些场景是由人类专家精心注释的。注释器指令可以在 devkit 存储库中找到。

我们在波士顿和新加坡使用两辆雷诺佐伊汽车，它们的传感器布局完全相同。这些数据是从一个研究平台收集的，并不能说明在 Motion 产品中使用的设置。有关感应器的位置，请参阅上图。

数据集特点：

全套传感器（一个激光雷达，五个雷达，六个摄像头, IMU, GPS）
1000 个场景数据，每组数据 20s
1400000 摄像头图像
390000 激光雷达扫描数据
两个城市数据：波士顿和新加坡
详细的地图信息
为23个对象类手动注释的1.4 M 3D 边界框
可见性，活动和姿势等属性
1.1 B 激光雷达点32类手动注释
非商业用途免费使用

官方地址：https://nuscenes.org/

下载链接：https://nuscenes.org/nuscenes

传感器校准

为了获得高质量的多传感器数据集，必须对每个传感器的外部特性和内部特性进行标定。我们表示相对于自我框架的外部坐标，即后车轴的中点。最相关的步骤如下:

激光雷达

我们使用激光线来准确测量激光雷达的相对位置的自我框架。

相机

我们在摄像机和激光雷达传感器前面放置一个立方体形状的校准目标。标定目标由三个具有已知模式的正交平面组成。在检测到图案之后，我们通过校准目标的平面来计算从相机到激光雷达的变换矩阵。给定上述计算的激光雷达到自我帧变换，我们就可以计算摄像机到自我帧变换和由此产生的外部参数。

雷达

我们把雷达安装在水平位置。然后我们通过在城市环境中驾驶来收集雷达测量数据。在滤波雷达返回的运动目标，我们校准偏航角使用蛮力的方法，以最小化补偿距离率的静态目标。

相机内部标定

我们使用一个具有已知模式集的校准目标板来推断摄像机的内在参数和畸变参数。

传感器同步

为了在激光雷达和相机之间实现良好的跨模态数据对齐，当顶部激光雷达扫过相机的视野中心时，相机的曝光被触发。图像的时间戳是曝光触发时间; 激光雷达扫描的时间戳是当前激光雷达帧完全旋转的时间。考虑到相机的曝光时间几乎是瞬间的，这种方法通常产生良好的数据对齐。请注意，相机运行在 12Hz，而激光雷达运行在 20Hz。12个相机的曝光在20个激光雷达扫描中尽可能均匀地分布，因此并非所有的激光雷达扫描都有相应的相机框架。将摄像机的帧频降低到12Hz 有助于减少感知系统的计算量、带宽和存储需求。

评价指标

nuScenes 检测任务的度量。我们的最终得分是平均精度(mAP)和几个真正正值(TP)指标的加权和。

Average Precision metric

mean Average Precision (mAP)

我们使用众所周知的平均精度度量，但是通过考虑地平面上的二维中心距离来定义匹配。具体来说，我们将预测与具有最小中心距离达到一定阈值的地面真相对象进行匹配。对于给定的匹配阈值，我们通过积分召回与精度曲线来计算平均精度(AP) ，并且精度 > 0.1。最后，我们平均超过{0.5,1,2,4}米的匹配阈值，并计算类间的平均值。

在评测时依旧使用检测领域的AP，不过AP的阈值匹配不使用IoU来计算，而使用在地平面上的2D中心距离d来计算。这样解耦了物体的尺寸和方向对AP计算的影响。d设置为 $D={0.5,1,2,4}$ 米。在计算AP时，去除了低于0.1的recall和precision并用0来代替这些区域。不同类以及不同难度D用来计算mAP：
$$
\mathrm{mAP}=\frac1{|\mathbb{C}||\mathbb{D}|}\sum_{c\in\mathbb{C}}\sum_{d\in\mathbb{D}}\mathrm{AP}_{c,d}
$$

True Positive metrics

我们为一组真正的正面(TP)定义了度量转换/尺度/方向/速度和属性错误的指标。在匹配过程中，所有 TP 指标都使用2m 中心距离的阈值计算，并且它们都被设计为正标量。

匹配和评分分别发生在每个类别，每个指标是每个达到的召回水平超过10% 的累积平均值的平均值。如果某个类没有达到10% 的召回率，则该类的所有 TP 错误都设置为1。我们定义以下 TP 错误:

指标	含义
Average Translation Error (ATE)	以米为单位的二维欧几里得中心距离。
Average Scale Error (ASE)	1 - IoU, 其中 IoU 是角度对齐后的三维交并比
Average Orientation Error (AOE)	弧度预报与地面真实度的最小偏航角差。方向误差评定在360度，除了障碍，所有类别只评定在180度。忽略锥体的方向错误。
Average Velocity Error (AVE)	忽略了障碍物和锥体在 m/s 速度误差中的绝对速度误差, 二维速度差的L2 范数(m/s)。
Average Attribute Error (AAE)	计算为1-acc，其中 acc 是属性分类精度。忽略障碍和锥的属性误差。

TP 指标是按类定义的，然后我们采用类的平均值来计算 mATE、 mASE、 mAOE、 mAVE 和 mAAE。

nuScenes detection score

nuScenes detection score (NDS)

我们通过计算加权和 (mAP、 mATE、 mASE、 mAOE、 mAVE 和 mAAE) 来合并上述指标。作为第一步，我们将 TP 错误转换为 TP 得分，即 $TP_{score} = max (1-TP _ {error}，0.0)$。然后，我们分配一个权重为 5 的 mAP 和 1 的 5 TP 分数，并计算归一化的总和。
$$
\begin{aligned}\text{NDS}&=\frac{1}{10}[5\text{ mAP}+\sum_{\text{mTP}\in\text{T}\mathbb{P}}(1-\min(1,\text{ mTP}))]\end{aligned}
$$

原始论文

参考资料

文章链接：
https://www.zywvvd.com/notes/study/deep-learning/dataset/nuscenes/nuscenes/

此内容由惯性聚合(RSS阅读器)自动聚合整理，仅供阅读参考。原文来自 — 版权归原作者所有。

推荐订阅源

又见苍岚

简介

传感器校准

激光雷达

相机

雷达

相机内部标定

传感器同步

评价指标

Average Precision metric

True Positive metrics

nuScenes detection score

原始论文

参考资料