车内动作识别数据集
Drive&Act 是由 Fraunhofer IOSB 与 KIT 相关团队发布的自动驾驶车内行为识别基准数据集,主要服务于细粒度驾驶员行为识别研究。它不是传统意义上的开发框架或 SaaS 工具,而是面向计算机视觉和自动驾驶座舱感知算法的研究数据资源。
该数据集提供 12 小时视频数据,包含 29 个长序列,并使用 5 视角标定多相机系统采集。模态方面覆盖 NIR、Depth 与 Color 数据,同时提供无标记动作捕捉结果,包括 3D Body Pose 与 Head Pose。标注体系较细,包含 83 个人工标注的层级活动标签:长时间任务、语义动作,以及 action/object/location 形式的交互三元组。这些信息使其适合多模态动作识别、姿态估计、驾驶员监测和车内人机交互研究。
页面未显示商业定价,标注为 Copyright Fraunhofer IOSB,并明确 Usage for research only,说明其主要面向科研使用,而非开放商业复用。更新信息显示登录限制已移除,数据现在无需申请许可即可获取,这降低了学术复现实验门槛。由于页面没有列出支付方式,因此可视为非付费下载型科研数据集。
从开发者工具视角看,Drive&Act 的优势在数据本身,而不是工具链。页面提供下载入口、论文引用和团队信息,但未说明 API、SDK、数据加载脚本、框架适配或基准评测代码。文档能让用户了解数据构成,但对于快速工程接入仍偏简略,研究者可能需要自行解析数据、整理标注并构建训练流程。
优点是场景垂直、模态丰富、标签层级细,并且有论文支撑,适合发表论文、复现 benchmark 或构建驾驶员行为识别模型。缺点是仅限科研使用,许可边界限制商业落地;页面最后更新停留在 2021 年,持续维护信息有限。它更适合高校、研究机构、自动驾驶感知团队的前期研究,不太适合作为企业级生产数据平台。
抓取文本未提供中国大陆访问、镜像稳定性或下载速度信息,因此中国访问状态判断为未知。如下载受限,可考虑使用机构网络、学术镜像或选择 BDD100K、nuScenes、Waymo Open Dataset、A2D2 等相关替代数据集。
本测评基于公开资料整理,不构成购买建议,请以 driveandact.com 官网实际信息为准。
多模态自动驾驶动作识别基准数据集。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。