基于行人轨迹预测的自动驾驶车辆碰撞避免控制研究
《Displays》:Research on collision avoidance control of autonomous vehicles based on pedestrian trajectory prediction
【字体:
大
中
小
】
时间:2026年04月12日
来源:Displays 3.4
编辑推荐:
本研究提出基于 pedestrian 轨迹预测的主动碰撞避免策略,采用轻量级 YOLOv5-Light 模型结合 DeepSORT 实现实时检测与跟踪,改进 LSTM 模型整合多交通参与者动态交互机制,并通过 MPC 框架实现风险分区控制,仿真验证有效降低碰撞误差。
吴广新|李少松|周素瑜|田丽媛|崔高建|卢晓辉|江俊晨
长春工业大学机电工程学院,中国长春,130012
摘要
自动驾驶技术不仅有望显著提高道路安全,还能有效缓解城市交通拥堵。然而,当前的自动驾驶系统在行人安全方面仍面临诸多挑战,尤其是在应对行人行为的动态变化时。为了解决这些问题,本研究提出了一种基于行人轨迹预测的主动避碰控制策略。该策略首先引入了轻量级的YOLOv5-Light模型进行物体检测,并结合DeepSORT算法准确获取行人历史轨迹。随后,使用改进的LSTM模型预测行人运动趋势,该模型通过动态交互机制考虑了不同交通参与者对行人轨迹的影响。在InD数据集上,该预测模型表现出优异的性能,平均位移误差和最终位移误差分别减少了15.94%和18.39%。基于预测结果,提出了一种利用碰撞风险区域划分的MPC(模型预测控制)框架进行避碰控制。最后,全面的仿真测试充分验证了该方法的可靠性和有效性。
引言
自动驾驶技术被认为是提高道路安全、减少交通事故和缓解拥堵的关键解决方案,同时为公众提供了更便捷的出行选择[1]。然而,在现实道路环境中实施自动驾驶面临诸多挑战,尤其是交通场景的复杂性和多样性。行人是最关键且最脆弱的群体,他们的安全直接关系到自动驾驶的可靠性和社会接受度[2]。交通场景中行人的行为非常复杂且变化显著[3]。他们的速度和方向可能会突然改变,常常受到周围行人和车辆的影响。此外,行人经常遇到视觉遮挡问题,这使得预测其行为变得复杂[4]。近年来,许多研究致力于开发行人避碰系统,这些系统可以大致分为几个关键方面:行人检测方法[5]、避碰策略、动作执行、计算平台和测试方法,详见[6]。这种系统分类表明,尽管取得了显著进展,但有效整合实时感知、精确轨迹预测和可靠控制仍然是确保动态环境中行人安全的关键任务。
在行人检测方面,传统方法通常依赖于手动提取特征并结合经典机器学习技术。传统的行人检测方法,如结合HOG或Haar特征的滑动窗口方法[7],并使用SVM[8]或AdaBoost[9]进行分类,在特征提取方面存在局限性,且在检测窗口的灵活性方面不足。相比之下,神经网络方法通过自主学习复杂特征,从而提高了准确性并实现了实时处理。在实际应用中,目标检测方法主要分为两种类型:(1)从图像中提取可能包含目标的候选区域,然后对这些区域进行分类并精确调整边界框以提高检测精度;(2)在整个图像上进行同时的目标分类和定位,从而绕过了候选区域生成阶段。这些方法分别对应于两阶段模型(例如R-CNN系列)[10]和一阶段模型(例如YOLO系列)[11]。值得注意的是,一阶段算法以其流程简化性和快速检测速度为特点,并通过网络结构优化和多尺度训练进一步提高性能和适应性,使其在行人检测中得到广泛应用。
未来的轨迹预测可以提供更全面的信息,显著提高决策准确性。在行人轨迹预测领域,方法可以大致分为传统方法和基于深度学习的方法。传统方法使用手动设计的模型来预测轨迹,如社会力模型[12]、行为模型[13]、非参数统计模型[14]和隐马尔可夫模型[15]。这些模型能够在特定场景中准确预测行人运动。然而,它们在复杂和拥挤环境中的泛化能力有限。另一方面,深度学习方法,如循环神经网络(RNN)[16]及其高级变体长短期记忆(LSTM)和门控循环单元(GRU),利用历史数据捕捉行人行为中的时间关系。尽管如此,这些模型通常关注内在因素,常常忽略外部影响。整合社会动态的模型,如Social-LSTM[17]和Social-GAN[18],利用复杂的网络架构来精细模拟行人之间的交互,从而在人口密集的环境中提高预测能力。然而,它们尚未充分考虑交通场景中其他交通参与者的影响。
在行人避碰控制领域,研究人员探索了各种先进算法,包括PID控制[19]、自适应控制[20]、模糊控制[21]和模型预测控制(MPC)[22]、[23]、[24]。其中,MPC因其出色的约束优化能力而受到特别关注,激发了一系列创新研究。KIM等人提出了一种开创性的动态预测区间调整MPC方法[25],该方法通过根据路径曲率和障碍物分布灵活调整预测区间,显著提高了控制精度并大幅降低了计算成本。He等人专注于优化避碰约束的准确性[26],创新设计了基于车辆实际尺寸的三角形避碰约束,与传统圆形约束相比,更能准确捕捉车辆的几何特性。然而,这些研究通常假设行人信息是静态的,忽略了行人未来轨迹的动态变化。为了解决这一限制,Keller等人提出了一种基于行人状态轨迹实时预测的主动避碰技术[27]。Yuan等人研究了不同类型行人的避碰意图[28],通过三次多项式规划优化了车辆避碰路径。尽管这些研究在预测未来行人影响方面取得了显著进展,但它们通常将历史轨迹视为已知条件,未能充分考虑多智能体交互的复杂动态。本研究的主要贡献如下:
(1) 本研究采用YOLOv5s作为基础框架,并用更轻量级的MobileNetV3替换其主干网络,以提高其在移动设备上的适用性,参数数量减少了85%,模型大小减少了76%。在此基础上,该模型整合了DeepSORT算法以促进行人目标跟踪。
(2) 基于LSTM网络设计了一种考虑行人之间以及行人-车辆相互作用的轨迹预测模型。通过使用选择性池化,计算复杂性降低,使得InD数据集上的平均位移误差(ADE)和最终位移误差(FDE)分别减少了15.94%和18.39%。
(3) 将行人检测和轨迹预测整合到避碰控制算法中,最终开发出了纵向-横向联合避碰控制系统。该系统有效应对了行人运动的不确定性,从而提高了行人避碰效果。
本文的其余部分组织如下:第2节简要回顾相关工作。第3节介绍行人检测方法。第4节关注行人轨迹预测,第5节介绍相应的避碰算法。最后,第6节给出最终结论。
部分摘录
模型框架
本研究的整体框架如图1所示,包括三个主要组成部分:行人检测与跟踪、行人轨迹预测和避碰控制。行人检测与跟踪模块对连续图像中的目标进行实时检测和跟踪,然后输出轨迹信息。行人轨迹预测模块包括交互信息提取、编码器和解码器。
行人检测与跟踪
基于YOLOv5s的全面行人目标检测方案如图2所示,包括四个关键组成部分:具有自适应图像缩放和Mosaic数据增强的输入层、采用MobileNetV3卷积构建的主干网络、包含双向特征金字塔(BiFPN)的多尺度融合的颈部网络,以及优化用于锚框选择和置信度预测的输出层。为了提高移动平台的适应性,原始
结合道路交互信息的行人轨迹预测
如图1所示,本文提出了一种集成道路交互信息的行人轨迹预测模型。社会池化策略旨在学习行人之间的交互规则。具体来说,它根据目标行人与周围交通参与者的相对位置、方向和速度提取融合特征。然后使用学习函数来量化这些参与者对目标行人未来的影响
主动避碰控制策略
本节将行人未来轨迹预测模型与TTC(时间到碰撞)风险评估框架相结合,以识别行人穿越区域。基于TTC,该研究将车-行人体交风险分为多个危险等级,并为不同的驾驶速度设计相应的避碰策略,确保纵向和横向控制策略之间的清晰分离。这种解耦有助于制定个性化的避碰策略
结论
本文探讨了自动驾驶车辆在主动避碰过程中未能充分考虑行人动态的问题。它提出了一种基于行人轨迹预测的无人驾驶汽车主动避碰策略。首先,引入了轻量级的行人检测模型YOLOv5-Light,以确保检测精度和实时性能。接下来,提出了一个结合道路交互信息的行人轨迹预测模型
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。
致谢
本工作得到了吉林省科技发展计划(项目编号:20240101084JC)的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号