自动驾驶合成数据集
UrbanSyn 是由 Computer Vision Center(UAB)与 CITIC(University of A Coruña)提供的合成自动驾驶场景数据集,包含 7.5k+ 张高写实标注图像。它的定位不是通用开发者 SaaS,而是面向计算机视觉、自动驾驶感知与域自适应研究的数据资源,重点用于降低合成数据到真实世界数据之间的 domain gap。
数据内容较完整:RGB 图像分辨率为 2048x1024,PNG 格式;语义分割提供灰度 Class ID 与 Cityscapes 配色版本,遵循 Cityscapes 19 个训练类别;深度图为 EXR 32-bit float;还提供动态目标的 panoptic instance segmentation、2D bounding boxes JSON 以及相机元数据。边界框字段包括 bbox、实例颜色、类别标签和遮挡比例等。需要注意的是,实例分割和 2D 框仅覆盖车辆、行人、骑行者等动态类别,不是全类别实例标注。
UrbanSyn 免费向学术与非学术实体开放,可用于研究、科学出版、教学和商业目的。许可为 CC-BY-SA 4.0,但条款额外禁止使用生成式 AI 技术逆向工程资产,或基于该数据集创建 stock media 平台内容。因此商业使用前仍应仔细审阅 terms of use。
页面提供各类数据的大小、格式、下载镜像、目录说明、论文引用和 changelog,并说明数据也可在 Hugging Face 获取;这对科研复现较友好。其类别体系贴近 Cityscapes,便于和常见自动驾驶语义分割流程衔接。但正文未看到 API、SDK、加载脚本、训练示例或基准评测协议,工程接入仍需要团队自行编写数据读取与转换逻辑。
优点是免费、标注维度丰富、图像分辨率高,并强调基于路径追踪和 AI 降噪获得较强写实度;对 synthetic-only baseline、domain adaptation、语义分割、深度估计和目标检测研究很有价值。缺点是规模仅 7.5k+,相较大规模自动驾驶数据集偏紧凑;服务支持主要是邮箱联系,未见 SLA 或社区支持机制。适合高校实验室、自动驾驶算法团队和需要合成数据补充真实数据的视觉研发者。
正文未说明中国大陆访问、镜像地域或支付方式;由于数据免费,支付不是主要障碍,但访问 Hugging Face 或外部镜像时可能受网络环境影响,实际可用性需测试。可对比 Cityscapes、SYNTHIA、GTA5 Dataset、CARLA 生成数据、BDD100K、Mapillary Vistas 等替代或补充数据源。
本测评基于公开资料整理,不构成购买建议,请以 urbansyn.org 官网实际信息为准。
含下载、论文和标注信息,适合视觉/自动驾驶研究。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。