一种新型的多模态自主驾驶数据集 ANAID:面向自然化避障与驾驶员行为建模的数据支撑

《Data》:ANAID: Autonomous Naturalistic Obstacle-Avoidance Interaction Dataset Manuel Garcia-Fernandez, Maria Juarez Molera, Adrian Canadas Gallardo, Nourdine Aliane and Javier Fernandez Andres

【字体: 时间:2026年04月09日 来源:Data 2

编辑推荐:

  本文介绍了研究人员为解决自动驾驶领域中自然化避障和驾驶员-车辆交互研究数据不足的问题,开发了一个名为 ANAID 的新型多模态数据集。该数据集利用配备 Comma-3X 设备的车辆采集了包含高分辨率前视视频和详细车辆状态(CAN 总线)数据的同步信息,并通过多阶段处理流程实现了数据对齐和规避操作的自动标注,为驾驶控制预测、驾驶员建模等研究提供了重要的数据基础,具有显著的实际应用价值。

  
随着自动驾驶技术的飞速发展,如何让机器学会像人类一样“自然”地应对复杂的道路环境,成为了一个关键挑战。其中,避障是自动驾驶核心能力之一。然而,训练和验证高效的自动驾驶算法,需要海量真实、多样且标注精准的驾驶数据。目前,虽然已有一些公开的自然驾驶数据集,但它们在场景范围、标注类型或驾驶模式上往往存在局限。例如,有的数据集覆盖场景过于宽泛,有的则专注于接管时刻,未能充分利用全程的自然驾驶数据用于算法训练。这使得在真实、连续的城市交通流中进行精细化的驾驶员行为研究、控制策略优化和人机交互评估依然面临数据瓶颈。
为了填补这一空白,来自 Manuel Garcia-Fernandez, Maria Juarez Molera, Adrian Canadas Gallardo, Nourdine Aliane 和 Javier Fernandez Andres 的研究团队,在《Data》期刊上发表了一项工作,介绍了一个专门为解决上述问题而设计的全新多模态数据集——ANAID(Autonomous Naturalistic obstacle-Avoidance Interaction Dataset)。这个数据集的核心目标是提供一个完全对齐、非破坏性的自然驾驶行为表示,以支持在真实交通条件下的控制预测、驾驶员建模、异常检测和人-自主性交互等研究。
研究人员为构建 ANAID 数据集,主要采用了以下几项关键技术方法:数据采集基于一辆配备 Comma-3X 自动驾驶开发套件的现代 Tucson 混动汽车,在西班牙马德里欧洲大学校园的固定城市环路上进行。该设备通过 OBD-II 接口访问车辆控制器局域网(Controller Area Network, CAN),同步采集高分辨率前视摄像头视频和包含速度、加速度、方向盘转角、踏板位置等在内的详细车辆状态(carState)遥测数据。数据采集分四次进行,每次由一名驾驶员完成约1小时的连续驾驶,共获得208段约1分钟的视频片段。后续,通过一个多阶段处理流程,包括使用时间戳将视频帧(20帧/秒)与CAN总线数据进行时序对齐,并从与方向盘相关的信号中,利用基于阈值的时间序列分析,自动检测和标注出避障操作时段,形成数据集的结构化表示。
数据描述
ANAID 数据集涵盖了四次数据采集活动,总计包含 240,014 帧同步的视频和车辆状态数据。采集线路设计包含了环岛、十字路口、行人横道等多种典型的城市驾驶场景,旨在捕捉多样化的真实世界情境。数据集提供了两个同步的原始数据源:以 .jsonl 格式存储的车辆 CAN 总线遥测日志,以及 .ts 格式的前视摄像头视频。数据处理后,提取出的图像帧与对应的遥测值通过文本文件关联。此外,数据集还包含一个基于转向相关信号分析得出的、标识避障操作的额外标注层,为每个视频片段提供了避障操作的时间区间及其统计信息。
描述性统计
对数据集整体特性的分析显示,方向盘扭矩的分布高度集中在零值附近,表明大部分驾驶属于接近直线行驶的情况,而大幅度的转向操作相对罕见。不同采集活动之间,在扭矩范围、均值、转向方向分布等方面存在显著差异。例如,Run 4 显示出强烈的正向转向偏置,而 Run 3 则相反。这种变异性反映了不同驾驶员或路线带来的真实驾驶行为差异,也表明在模型训练时需要考虑针对每次采集活动进行数据归一化。尽管如此,所有活动中被定义为避障操作(使用各活动扭矩分布的 90% 分位数作为阈值)的比例都稳定在 10% 左右,确认了正常驾驶与关键事件之间存在严重的类别不平衡。方向盘方向、扭矩范围、标准差以及各次活动中避障操作数量的详细统计图表,进一步量化了数据集内部的特性和变异性。
方法学
数据采集
研究详细描述了数据采集平台和流程。采集车辆装备了 Comma-3X 设备,该设备集成了高清前视摄像头并可访问 Openpilot 生态系统,便于同步数据收集。数据在一条包含直线、弯道以及需要避障场景的预定义校园环路上采集,每次活动由不同的驾驶员完成,以增加行为多样性。
数据处理
数据处理管道将原始的、异构的视频和遥测数据转换为结构化的、对齐的数据集。具体包括解析 CAN 总线日志、提取并保留 carState 消息、以固定速率(20 帧/秒)从视频中提取帧,并利用时间戳通过最近邻匹配实现视频帧与遥测数据的同步关联。
避障操作的检测与标注
避障操作的标注是基于方向盘相关车辆遥测(如 steeringAngleDeg, steeringTorque 等)的确定性、基于规则的流程自动完成的。该流程采用了两种互补的检测策略(滞后事件配对检测器和孤立峰值检测器)并随后合并结果。主要参数包括滞后阈值(ANGLEON= 10°, ANGLEOFF= 6°),允许的总操作时长约束(1.0 s ≤ Ttotal≤ 8.0 s),以及配对子事件之间的最大允许时间间隔(Tgap≤ 2.0 s)。候选转向事件通过应用于绝对转向角度信号 a(t) = |steeringAngleDeg(t)| 的双阈值滞后来识别,以抑制小幅振荡引起的虚假检测。事件在 a(t) ≥ 10° 时开始,在 a(t) ≤ 6° 时结束。随后,每个候选事件会进一步通过其持续时间和峰值幅度等约束进行过滤,以减少误报。只有满足 0.15 s ≤ Tsub≤ 4.5 s 的事件才会被保留。最终,为每个检测到的操作生成包含起止时间、持续时间和统计信息的标注文件。
结论与讨论
ANAID 数据集的建立,为自动驾驶研究社区提供了一个专注于自然化避障和驾驶员-车辆交互的宝贵资源。与现有数据集相比,其优势在于:1) 数据采集是完全自然化的驾驶过程,允许将正常驾驶场景也用于算法训练,而不局限于特定模式(如接管);2) 提供了明确的场景标注(避障操作),并保留了原始的、非破坏性的数据流,便于灵活的二次利用;3) 通过详细、同步的多模态数据(视觉+车辆状态)和对不同驾驶行为的统计呈现,支持从感知到控制的端到端研究,以及驾驶员建模、行为异常检测等多种下游任务。
该研究的统计分析揭示了不同数据采集活动间驾驶行为的显著变异性,这强调了在利用此类数据集进行模型训练时,采用适当的归一化策略或考虑活动间差异的重要性。数据集已通过 Zenodo 和 Kaggle 平台公开,并附有 CC-BY-4.0 许可,其数据处理代码也在 GitHub 上开源,极大地促进了研究的可重复性和社区的协作创新。总之,ANAID 数据集通过提供高质量、标注丰富、场景真实的驾驶数据,有望推动自动驾驶系统在复杂、动态的真实世界环境中的性能提升和安全保障,对实现更智能、更人性化的自动驾驶具有重要意义。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号