基于最优控制与博弈均衡的多机雷雨规避协同航迹规划方法

《Aerospace》：A Cooperative Trajectory Planning Method for Multi-Aircraft Thunderstorm Avoidance Based on Optimal Control and Game Equilibrium

【字体：大中小】 时间：2026年06月10日 来源：Aerospace 2.2

编辑推荐：

　　本文提出一种基于博弈论最优控制框架的多机航空器雷雨规避协同航迹规划方法。研究人员将多机系统建模为非合作博弈（non-cooperative game），采用迭代最佳响应（Iterative Best Response, IBR）算法将耦合的规划问题分解为一系列

本文提出一种基于博弈论最优控制框架的多机航空器雷雨规避协同航迹规划方法。研究人员将多机系统建模为非合作博弈（non-cooperative game），采用迭代最佳响应（Iterative Best Response, IBR）算法将耦合的规划问题分解为一系列单智能体非线性最优控制子问题。各子问题利用CasADi框架求解，可连续同步优化航空器的速度和航向。该方法直接生成平滑、动力学可行的四维（4D）轨迹，满足各航路点严格的到达时间（Estimated Time of Arrival, ETA）约束，解决了现有许多方法的这一关键局限。仿真表明，该框架不仅能确保与雷雨区及其他航空器的安全间隔，还能有效管理到达时间，误差达秒级。结果表明，该方法可为动态气象环境下的复杂多机相遇场景生成安全、高效、准时的轨迹。

论文解读：基于最优控制与博弈均衡的多机雷雨规避协同航迹规划方法

一、研究背景与意义

随着空中交通密度增加及雷暴（thunderstorms）等强对流天气频发，传统独立规避易导致航空器汇聚引发新冲突，且现有方法难以在满足严格四维（4D，即三维空间+时间）航路点预计到达时间（Estimated Time of Arrival, ETA）约束的同时生成连续动力学可行轨迹。离散图搜索法（如A）受网格分辨率限制且难保连续性；人工势场法（Artificial Potential Field, APF）易陷局部极小且难加时间窗约束；采样法（如RRT）收敛慢且需后处理。集中式最优控制（Optimal Control）在多机时面临"维数灾难"。为此，研究人员开展基于博弈论（Game Theory）与连续最优控制的协同规划研究，成果发表于《Aerospace》。

二、主要关键技术方法

研究人员假设巡航定高、水平面运动，建立质点运动学模型；雷暴危险区由雷达反射率≥30 dBZ定义，通过快速距离变换构建带符号距离场（Signed Distance Field, SDF）并用B样条拟合为连续可微函数引入约束；单机4D航迹规划建模为含路径长度、控制量、控制平滑度及曲率惩罚的加权代价非线性规划（Nonlinear Programming, NLP）问题，采用直接配点（Direct Collocation）法离散并由CasADi提供自动微分、IPOPT（Interior Point Optimizer）求解；多机建模为非合作博弈，以迭代最佳响应（Iterative Best Response, IBR）算法分解耦合问题，顺序求解各机最优控制子问题直至轨迹变分范数小于阈值ε=10 m或达最大迭代次数，逼近局部纳什均衡（Local Nash Equilibrium）。仿真参数参照EUROCONTROL BADA及ICAO标准（速度720~870 km/h，加速度±0.5 m/s2，最小间隔d_ac=10 km，雷暴余量d_s=20 km）。

三、研究结果

2. Mathematical Models and Problem Formulation（数学模型与问题表述）

研究人员给出二维水平面质点运动学微分方程?=v cosψ, ?=v sinψ, v?=a, ψ?=ω及速度、加速度、转弯率盒约束。雷暴以30 dBZ等值线为边界构建SDF ??(p,t_k)≥d_s；机间约束‖p_i(t)-p_j(t)‖≥d_ac；ETA通过积分可行性条件∫₀^Tv_i(t)dt≥直线距离及终端等式约束x_i(T)=x_i^dest, y_i(T)=y_i^dest（T=T_ETA固定）实现硬约束。

3. Proposed Planning Framework（提出的规划框架）

3.1 Single-Aircraft Trajectory Planning（单机航迹规划）：代价J_i=w₁J_path+w₂J_ctrl+w₃J_smooth+w₄J_curve（w₁=5.0,w₂=0.8,w₃=0.1,w₄=1.0），Direct Collocation转NLP由CasADi/IPOPT解。

3.2 Multi-Aircraft Conflict Resolution and Coordination Framework Based on Game Theory（基于博弈论的多机冲突解脱与协调框架）：非合作博弈中每机最小化C_i(τ_i,τ_-i)，IBR按序固定他机轨迹解本机最优控制子问题（Best Response），收敛判据为各机轨迹无穷范数变化量<ε。

3.3 Analysis of Convergence for the Coordination Mechanism（协调机制收敛性分析）：每步子问题满足KKT条件保证局部改进；轨迹变分范数Δ^(k)=max_i‖τ_i^(k)-τ_i^(k-1)‖_∞单调递减至<ε时达局部纳什均衡，具操作可用性。

4. Experimental Validation（实验验证）

4.1 Simulation Environment and Parameter Settings（仿真环境与参数设置）：Python 3.9, CasADi 3.5.5, IPOPT 3.13.4，A320性能包线及标准间隔参数见表1。

4.2 Single-Aircraft Avoidance Scenario Analysis（单机规避场景分析）：单架机成功绕飞三个密集雷暴区并重入原计划航线，轨迹连续可飞。

4.3 Multi-Aircraft Avoidance Scenario Analysis（多机规避场景分析）：三机从不同方向接近同一雷暴，IBR经4次迭代收敛（单次计算0.77~1.14 s）；实际到达时间与预设ETA误差仅数秒；机间及机-雷暴间隔全程高于阈值；速度剖面调节补偿绕飞距离，"先调速、后改向（speed-first, heading-second）"决策层级自然涌现而非预设启发式规则。

4.4 Baseline Method Comparison（基准方法对比）：与A+IBR比——本文法路径更短（446.57 vs 505.89 km）、平滑度远优（0.153 vs 64.446）、无安全违规（A+IBR低于最小间隔）；与ADMM比——路径更短（446.57 vs 495.15 km）、控制量更小（5.528 vs 118.467）、计算更快（3.76 s vs 25.33 s），且ADMM软约束致次优机动。本文是唯一同时满足零违规、最短路径、最佳平滑度与较快计算的方案。

4.5 Monte Carlo Study and Sensitivity Analysis of Formation Size（蒙特卡洛研究与编队规模敏感性分析）：1~7架机500组随机场景100%收敛且全满足约束；8~10架略有下降但仍较高；求解时间随机数对二次增长（10机架约32 s），绕飞比增幅<0.5%，适合预战术（pre-tactical）重规划。

4.6 Dynamic Rerouting Case Study Based on Real-World Flight Data（基于真实航班数据的动态改航案例）：选用2026-04-07四架真实商业航班（GJ8860, CZ6586, JD5067, CZ3572）及对应日中国气象局对流天气，生成协同规避建议，最小机间隔10.45 km、雷暴余量20.24 km，航程增约6.42%，验证实际适用性。

四、讨论与结论总结

研究人员得出结论：所提框架融合连续最优控制（NLP/Direct Collocation/CasADi/IPOPT）与博弈论IBR协调，能有效规避动态雷暴及机间冲突并精确满足4D航路点ETA约束（秒级误差），较A*+IBR和ADMM在安全性、航迹质量与计算效率上综合占优，真实航线与蒙特卡洛验证其实际适用性与稳定性。未来工作拟纳入风场不确定性、垂直维度及大规模机群扩展性评估。

热点排行