一、综合感知:目标检测 + 分割(一套数据多任务复用)
这几个数据集覆盖面广,一份数据往往能同时支撑检测、分割、跟踪等多个任务,是搭建感知 pipeline 的主力。
- KITTI Vision Benchmark Suite:自动驾驶领域的经典基准,采集自德国卡尔斯鲁厄的城市、乡村与高速场景。覆盖 2D/3D 目标检测、多目标跟踪、语义与实例分割、道路检测、深度估计等多项任务。授权为 CC BY-NC-SA 3.0,仅限非商用,需署名。
- nuScenes:由 Motional 发布的多模态数据集,配备 6 路相机、激光雷达与毫米波雷达,含 1000 个场景及密集 3D 标注(具体场景数、3D 框数、类别数以官方页面为准)。配套的 nuImages 专门提供 2D 图像的检测与分割标注。需注册账号并同意官方 Terms of Use 后下载,非商用授权。
- Waymo Open Dataset:含 Perception(2030 段、约 39 万帧,12.6M 个 3D 框、11.8M 个 2D 框,23 类语义分割)与 Motion 等子集,多传感器、多地域。官方明确为非商用授权(具体规模以官方页面为准)。
- BDD100K:伯克利发布的大规模驾驶视频数据集,10 万段视频、覆盖 10 类任务,包括目标检测、语义/实例分割、车道线、可行驶区域分割、跟踪等,地域与天气多样。代码仓采用 BSD-3-Clause,数据下载与具体条款以官方说明为准。
二、语义/实例分割(像素级标注)
- Cityscapes:城市街景像素级分割的标杆,含 5000 张精标 + 20000 张粗标图像,覆盖 50 个城市、30 个类别,支持语义、实例与全景分割。免费提供给学术与非学术机构用于非商用目的,商用需另行同意许可条款,下载需注册。
- Mapillary Vistas:全球众包采集的街景分割数据集,地域覆盖远超单一城市数据集,含语义与实例分割标注,类别数随版本不同(具体图像数与类别以官方页面为准)。采用 CC BY-NC-SA(非商用)授权,下载需在官方页面注册。
三、车道线检测(专用数据集)
通用数据集里 BDD100K 自带车道线标注,但若专攻车道线,下面这几个更对口:
- TuSimple:CVPR 2017 车道线检测挑战赛数据集,以高速公路场景为主,标注以折线点形式给出。代码仓为 Apache-2.0,数据与真值通过仓库 Issues 页协调下载。
- CULane:香港中文大学发布,采集自北京,含 133235 帧、覆盖正常与 8 类挑战场景(夜间、拥堵、阴影等),含遮挡车道的上下文补全标注。仅限非商用,需署名,禁止再分发,通过 Google Drive 或百度云下载。
- LLAMAS:高速公路车道线数据集,10 万余张图像,借助高精地图自动投影生成标注(无需逐帧人工画线)。非商用授权、需署名,下载需注册登录。
四、车牌识别(强地域属性,注意隐私)
车牌几乎绑定国家与地区格式,选数据集前先确认目标地域:
- CCPD(中国城市停车数据集):面向中国车牌的检测与识别,ECCV 2018 发布,含 30 万张以上图像,涵盖模糊、倾斜、远景、新能源绿牌等多个子集,标注信息编码在文件名中。MIT 授权,通过 Google Drive 或百度云下载。做中国车牌优先选它。
- OpenALPR Benchmarks:OpenALPR 项目配套的车牌基准测试数据,含检测、端到端、分割与 OCR 等测试集(具体地域覆盖以仓库内容为准)。注意其授权为 AGPL-3.0,对衍生作品与分发有较强约束,商用集成前务必读清条款。
五、怎么选,以及常见的坑
按任务与是否商用来选: 想一份数据覆盖检测+分割+跟踪,优先 BDD100K(任务最全)或 nuScenes/Waymo(多传感器、3D 强);只做像素级分割,Cityscapes 是标杆、Mapillary 地域更广;车道线专项看 CULane/TuSimple/LLAMAS;中国车牌几乎只看 CCPD。特别注意:上面绝大多数(KITTI、nuScenes、Waymo、Cityscapes、Mapillary、CULane、LLAMAS)都是非商用授权,真要做商业产品,必须回到官方页面确认许可,或寻求商用授权,切勿想当然。
几个反复踩的坑: 一是标注格式不统一——KITTI、COCO、各家 JSON、文件名编码(CCPD)互不兼容,跨数据集训练前要先做格式转换与类别映射;二是商用授权红线,学术数据集拿去商用是常见的合规风险;三是地域差异,欧美场景训练的模型在中国道路(车型、标线、招牌、车牌)上往往掉点,跨地域要做域适应;四是车牌涉及个人隐私与车辆信息,采集、存储与公开使用都要遵守当地数据保护法规,公开演示前注意脱敏。
如果你不确定某个具体场景该用哪份数据、或想快速比对多个数据集的标注与授权细节,可以用数聚天成的数据集检索服务按需求描述检索——我们会基于公开信息给出可核验的候选与来源,最终授权与规模请以各数据集官方页面为准。
参考来源
- https://www.cvlibs.net/datasets/kitti/
- https://www.nuscenes.org/nuscenes
- https://waymo.com/open/
- https://github.com/bdd100k/bdd100k
- https://www.cityscapes-dataset.com/
- https://www.mapillary.com/dataset/vistas
- https://github.com/TuSimple/tusimple-benchmark
- https://xingangpan.github.io/projects/CULane.html
- https://unsupervised-llamas.com/llamas/
- https://github.com/detectRecog/CCPD
- https://github.com/openalpr/benchmarks
