基于物理信息势场和TD3强化学习的自动驾驶车辆分层动态路径规划框架
潘岩、
王宇、
冉斌
《Applied Sciences》:A Hierarchical Dynamic Path Planning Framework for Autonomous Vehicles Based on Physics-Informed Potential Field and TD3 Reinforcement Learning
Yan Pan,
Yu Wang and
Bin Ran
【字体:
大
中
小
】
时间:2026年04月08日
来源:Applied Sciences 2.5
摘要
在密集交通中,自动驾驶需要制定确保安全、精确路径跟踪和乘坐舒适性的策略。然而,仅依靠强化学习(RL)存在样本效率低和安全性保障不足的问题,而传统的人工势场(APF)方法则缺乏对动态场景的适应性。本文提出了PIPF-TD3算法,该算法将APF理论与双延迟深度确定性策略梯度(TD3)相结合,通过将复合势值和多普勒加权梯度作为物理信息特征嵌入到状态向量中。混合A*规划器生成一个表示吸引力的参考路径;排斥场利用实时感知数据模拟附近的障碍物;多目标奖励函数同时优化路径跟踪、碰撞避免和乘坐舒适性。在CARLA 0.9.14平台上的两个场景(一个包含混合障碍物的高速公路段和一个有冲突转向动作的信号化交叉口)中的实验表明,PIPF-TD3的任务完成率为100%,且未发生任何碰撞,而未使用势场引导的TD3碰撞率为90%。PIPF-TD3将平均横向偏差降低到0.12米(相比基于规则的有限状态机(FSM)基线降低了72.1%),保持了67.0%的安全间隙,并使纵向和横向加速度分别达到1.12米/秒2和0.75米/秒2,性能分别优于FSM 37.1%和42.7%。这些结果证实,在复杂交通条件下,多普勒加权的物理先验显著提升了基于RL的驾驶安全性和质量。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号