随着城市人口的增长,交通拥堵和通勤压力等问题日益严重,城市轨道交通系统面临着越来越复杂的运营挑战。城市轨道交通系统通常采用两种解决方案来满足不断增长的乘客需求。一种是在大规模上建设新的城市轨道交通线路,但这种方法成本高昂且缺乏灵活性。另一种是提高现有线路的利用率,即在现有线路上实现更多列车的安全协作运行,研究重点已从单列车运行转向两列或多列车的协调。在现有轨道基础设施条件下,为了提高线路运输能力,铁路信号闭塞系统经历了三个阶段的发展:手动闭塞、固定闭塞和移动闭塞,通过逐步缩短列车运行间隔来优化运输效率。移动闭塞技术通过动态优化安全间隔来提高效率,但其设计逻辑要求列车在预设距离前必须制动,这限制了线路容量的增长。为了克服这一技术瓶颈,相关研究逐渐转向探索基于列车间通信的协作控制机制,以实现更紧凑的列车编组。
在这种背景下,Bock和Varchmin(1999年)提出的列车虚拟耦合技术逐渐出现,为提高轨道交通效率提供了新的动力。虚拟耦合技术相较于现有的移动闭塞技术有了显著进步。后者假设领头列车是静止的,并将两列或多列列车虚拟地组合在一起,从而大幅减少了列车跟踪间隔(Cao, Wen, & Ma, 2021)。然而,由于“安全第一”的原则以及列车间通信的局限性,虚拟耦合技术最初更多地侧重于理论研究(Felez & Vaquero-Serrano, 2023; Wu, Ge, Han, & Liu, 2023)。近年来,随着硬件速度的提高和大数据计算能力的增强,机器学习在实际应用中的实施成本有所下降。作为机器学习的一个分支,强化学习(Hu et al., 2024; Milani, Topin, Veloso, & Fang, 2024)强调通过持续的试错探索找到支持决策制定的最优解,并能够通过实时收集和分析大数据(包括乘客流量、天气条件、线路状态等信息)来动态调整列车协作运行控制策略,以更灵活地应对快速变化的运营环境。基于强化学习研究城市轨道交通虚拟耦合列车的协作控制具有重要的理论意义和实际价值。这不仅提升了城市轨道交通虚拟耦合列车系统的智能化水平,也为强化学习在复杂工业系统中的应用提供了重要参考。
为了在确保列车运行安全的同时提高城市交通运营效率,本文的主要创新如下:
1. 本文通过改进的粒子群优化算法优化了虚拟耦合列车编组中领头列车的运行轨迹。建立了一个包括领头列车轨迹生成和后续列车跟踪的运动学模型。在能耗、准点率、精确停车和安全性保护的限制下,改进了粒子群算法参数,构建了一个多目标优化模型,以求解最优速度曲线,其中领头列车的轨迹作为后续列车的跟踪参考。
2. 本文提出了一种带有噪声网络和优先经验回放(D3QN-NPER)的Dueling Double Deep Q-Network算法,用于优化城市轨道交通虚拟耦合列车的协作运行控制策略。在列车协作编组控制领域,D3QN算法由于其独特的双网络架构和价值函数分解特性,在列车间距优化方面表现出显著优势。同时,为了提高样本利用效率和增强模型的鲁棒性,基于D3QN算法引入了优先经验回放机制和噪声网络。
3. 基于北京颐庄线基础设施数据的实验模拟表明,与其他传统的DQN算法相比,本文提出的D3QN-NPER算法不仅提高了列车编组的间距控制精度,还更好地平衡了安全性和效率等多个优化目标,为智能列车协作控制提供了更可靠的技术支持。
本文的其余部分组织如下:第2节回顾了列车协作控制运营问题的相关文献。第3节详细介绍了本文的研究问题,包括列车动力学模型、虚拟耦合列车组模型和运营约束以及两站间运行轨迹的优化。第4节提出了本文的解决方案,设计了一种基于D3QN-NPER算法的虚拟耦合列车组协作控制方案。第5节通过数值模拟和比较证明了该方案的有效性。最后,第6节提供了结论并提出了未来的研究方向。