基于物理信息势场和TD3强化学习的自动驾驶车辆分层动态路径规划框架潘岩、王宇、冉斌

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Applied Sciences》：A Hierarchical Dynamic Path Planning Framework for Autonomous Vehicles Based on Physics-Informed Potential Field and TD3 Reinforcement Learning Yan Pan, Yu Wang and Bin Ran

【字体：大中小】 时间：2026年04月08日 来源：Applied Sciences 2.5

编辑推荐：

　　摘要

摘要

在密集交通中，自动驾驶需要制定确保安全、精确路径跟踪和乘坐舒适性的策略。然而，仅依靠强化学习（RL）存在样本效率低和安全性保障不足的问题，而传统的人工势场（APF）方法则缺乏对动态场景的适应性。本文提出了PIPF-TD3算法，该算法将APF理论与双延迟深度确定性策略梯度（TD3）相结合，通过将复合势值和多普勒加权梯度作为物理信息特征嵌入到状态向量中。混合A*规划器生成一个表示吸引力的参考路径；排斥场利用实时感知数据模拟附近的障碍物；多目标奖励函数同时优化路径跟踪、碰撞避免和乘坐舒适性。在CARLA 0.9.14平台上的两个场景（一个包含混合障碍物的高速公路段和一个有冲突转向动作的信号化交叉口）中的实验表明，PIPF-TD3的任务完成率为100%，且未发生任何碰撞，而未使用势场引导的TD3碰撞率为90%。PIPF-TD3将平均横向偏差降低到0.12米（相比基于规则的有限状态机（FSM）基线降低了72.1%），保持了67.0%的安全间隙，并使纵向和横向加速度分别达到1.12米/秒2和0.75米/秒2，性能分别优于FSM 37.1%和42.7%。这些结果证实，在复杂交通条件下，多普勒加权的物理先验显著提升了基于RL的驾驶安全性和质量。

联系信箱：

粤ICP备09063491号

摘要

热点排行