当前位置：首页 > news >正文

保姆级教程：用Python和nuscenes-devkit从零玩转nuScenes自动驾驶数据集（附完整代码）

news 2026/6/1 4:41:38

从零玩转nuScenes自动驾驶数据集：Python实战指南

自动驾驶技术正在重塑未来交通格局，而高质量数据集是算法研发的基石。nuScenes作为业界领先的多模态自动驾驶数据集，为研究者提供了丰富的传感器数据与精细标注。本文将带您从零开始，通过Python代码实战掌握nuScenes的核心操作技巧。

1. 环境配置与数据准备

在开始探索nuScenes之前，我们需要搭建合适的工作环境。Google Colab因其免配置和GPU支持成为理想选择，本地Jupyter环境同样适用。

Colab环境配置步骤：

!mkdir -p data/sets/nuscenes !wget https://www.nuscenes.org/data/v1.0-mini.tgz !tar -xf v1.0-mini.tgz -C data/sets/nuscenes !pip install nuscenes-devkit &> /dev/null

安装完成后，让我们验证数据集结构：

nuscenes └── v1.0-mini ├── samples ├── sweeps ├── maps └── v1.0-mini.json

初始化数据集对象是后续所有操作的基础：

from nuscenes.nuscenes import NuScenes nusc = NuScenes(version='v1.0-mini', dataroot='data/sets/nuscenes', verbose=True)

提示：首次运行时建议使用mini数据集（约3.5GB），完整版数据集达300GB，下载需较长时间。

2. 数据结构深度解析

nuScenes采用token机制关联各类数据，理解其组织结构至关重要。主要数据结构包括：

数据类型	描述	关键字段
Scene	20秒连续驾驶场景	token, nbr_samples
Sample	0.5秒间隔的关键帧	data, anns
SampleData	传感器原始数据	filename, sensor_modality
SampleAnnotation	3D物体标注	size, rotation

数据关系可视化：

scene = nusc.scene[0] sample = nusc.get('sample', scene['first_sample_token']) print(f"场景包含{sample['nbr_samples']}个样本") print(f"首个样本的传感器数据：{sample['data'].keys()}")

3. 多模态数据可视化实战

nuScenes的强大之处在于其多传感器同步数据。让我们探索几种典型的可视化方法。

3.1 激光雷达点云渲染

将LIDAR点云投影到相机图像：

sample_token = nusc.sample[10]['token'] nusc.render_pointcloud_in_image(sample_token, pointsensor_channel='LIDAR_TOP', render_intensity=True)

3.2 3D标注框可视化

展示特定物体的3D边界框：

annotation = nusc.sample_annotation[15] nusc.render_annotation(annotation['token'])

关键参数说明：

translation: 框中心坐标(x,y,z)
size: 框尺寸(长,宽,高)
rotation: 四元数朝向(w,x,y,z)

3.3 多传感器融合展示

同时渲染相机图像和雷达数据：

nusc.render_sample(sample_token, underlay_map=True, show_lidarseg=True)

4. 高级查询与数据分析

掌握高效的数据查询方法能极大提升研发效率。

4.1 复杂条件查询

查找所有移动中的车辆标注：

from nuscenes.utils.data_classes import LidarPointCloud vehicle_anns = [] for ann in nusc.sample_annotation: if nusc.get('category', ann['category_token'])['name'] == 'vehicle': attr = nusc.get('attribute', ann['attribute_tokens'][0]) if 'moving' in attr['name']: vehicle_anns.append(ann)

4.2 轨迹追踪分析

追踪特定物体在整个场景中的运动：

instance = nusc.instance[42] anns = nusc.field2token('sample_annotation', 'instance_token', instance['token']) trajectory = [nusc.get('sample_annotation', t)['translation'] for t in anns]

4.3 统计数据分析

计算各类物体的平均尺寸：

import numpy as np from collections import defaultdict category_stats = defaultdict(list) for ann in nusc.sample_annotation: cat = nusc.get('category', ann['category_token'])['name'] category_stats[cat].append(ann['size']) avg_sizes = {k: np.mean(v, axis=0) for k,v in category_stats.items()}

5. 自定义数据处理管道

构建高效的数据加载流程是模型训练的关键。

5.1 数据加载器实现

class NuScenesLoader: def __init__(self, nusc, sensor='CAM_FRONT'): self.nusc = nusc self.sensor = sensor def __getitem__(self, sample_token): sample = nusc.get('sample', sample_token) cam_data = nusc.get('sample_data', sample['data'][self.sensor]) img = Image.open(os.path.join(nusc.dataroot, cam_data['filename'])) anns = [nusc.get('sample_annotation', t) for t in sample['anns']] return img, anns

5.2 点云数据处理

def load_lidar_points(sample_token): sample = nusc.get('sample', sample_token) lidar_data = nusc.get('sample_data', sample['data']['LIDAR_TOP']) pcl_path = os.path.join(nusc.dataroot, lidar_data['filename']) points = LidarPointCloud.from_file(pcl_path).points.T return points[:, :4] # x,y,z,intensity

5.3 数据增强技巧

def random_flip(point_cloud, images): if np.random.rand() > 0.5: point_cloud[:,1] = -point_cloud[:,1] # y轴翻转 images = [img.transpose(Image.FLIP_LEFT_RIGHT) for img in images] return point_cloud, images

6. 性能优化技巧

处理大规模数据集时需要特别关注效率问题。

内存优化策略：

使用生成器替代列表存储
延迟加载大文件
采用内存映射文件

def sample_generator(nusc, batch_size=32): tokens = [s['token'] for s in nusc.sample] for i in range(0, len(tokens), batch_size): yield [process_sample(nusc, t) for t in tokens[i:i+batch_size]]

加速查询的索引构建：

from collections import defaultdict # 构建category到annotation的快速映射 category_index = defaultdict(list) for ann in nusc.sample_annotation: cat_token = ann['category_token'] category_index[cat_token].append(ann['token'])

7. 实际应用案例

让我们看一个完整的物体检测流程示例。

7.1 数据预处理管道

def prepare_training_data(nusc, sample_tokens): features = [] labels = [] for token in sample_tokens: # 加载点云 points = load_lidar_points(token) # 加载图像 sample = nusc.get('sample', token) img_data = nusc.get('sample_data', sample['data']['CAM_FRONT']) img = load_image(img_data) # 加载标注 anns = [nusc.get('sample_annotation', t) for t in sample['anns']] # 坐标转换 calib = nusc.get('calibrated_sensor', img_data['calibrated_sensor_token']) points = transform_points(points, calib) features.append((points, img)) labels.append(anns) return features, labels

7.2 模型训练示例

import torch from torch.utils.data import DataLoader dataset = NuScenesDataset(nusc) loader = DataLoader(dataset, batch_size=8, shuffle=True) model = DetectionModel().cuda() optimizer = torch.optim.Adam(model.parameters()) for epoch in range(10): for points, images, targets in loader: predictions = model(points, images) loss = compute_loss(predictions, targets) optimizer.zero_grad() loss.backward() optimizer.step()

7.3 结果可视化验证

def visualize_detections(sample_token, predictions): sample = nusc.get('sample', sample_token) nusc.render_sample(sample_token) for pred in predictions: box = pred['3d_box'] draw_box(box, color='red') plt.show()

掌握这些核心技能后，您可以基于nuScenes数据集开展各类自动驾驶算法研发。建议从简单的物体检测任务开始，逐步尝试更复杂的多任务学习和预测模型。

查看全文

http://www.rkmt.cn/news/1438407.html