基于终端时间预测的再入飞行器智能轨迹凸优化(Reentry Vehicle Intelligent Trajectory Convex Optimization Method Based on Terminal Time Prediction)——基于神经网络终端时间预测的再入飞行器轨迹序列凸优化(Sequential Convex Optimization, SCO)加速方法

《Aerospace》：Reentry Vehicle Intelligent Trajectory Convex Optimization Method Based on Terminal Time Prediction

【字体：大中小】 时间：2026年06月10日 来源：Aerospace 2.2

编辑推荐：

　　为解决传统序列凸优化(Sequential Convex Optimization, SCO)方法在高超音速再入飞行器长航程飞行中因终端时间(tf)不确定而导致计算效率低的问题，研究人员提出了一种引入基于神经网络(Neural Network, NN)的终端时

为解决传统序列凸优化(Sequential Convex Optimization, SCO)方法在高超音速再入飞行器长航程飞行中因终端时间(tf)不确定而导致计算效率低的问题，研究人员提出了一种引入基于神经网络(Neural Network, NN)的终端时间预测策略的改进方法，其计算效率显著高于传统方法。在该改进方法中，研究人员利用神经网络拟合再入飞行器当前状态量与终端时间之间的映射关系，从而在优化过程中替代参数迭代计算，进而提升效率。对于网络训练，研究人员首先采用传统序列凸优化方法生成大量样本轨迹；随后采用多层前馈神经网络近似再入飞行器飞行状态到终端时间的映射关系，完成离线训练。仿真结果表明，所提算法较SCO算法计算时间缩短50%以上，满足在线轨迹生成(Online Trajectory Generation)要求，且可适应起止位置变化的特殊情况。

论文解读：《基于终端时间预测的再入飞行器智能轨迹凸优化方法》

一、研究背景与意义

高超音速飞行器(Hypersonic Vehicle, HV，Ma≥5)的再入滑翔段具有多约束、强耦合、快时变、高度非线性及长航时等特征，传统轨迹优化方法多限于离线应用，难以应对环境扰动及起止点变化。凸优化(Convex Optimization)理论可将经松弛后的非凸问题转化为二阶锥规划(Second-Order Cone Programming, SOCP)子问题，配合原始对偶内点法(Primal-Dual Interior-Point Method)具确定性收敛与较高求解速度。序列凸化(Sequential Convexification / Sequential Convex Optimization, SCO)通过对非线性动力学逐次线性化并引入信赖域(Trust Region)约束迭代求解，已被应用于火星软着陆(Lossless Convexification，无损凸化)及再入轨迹优化。然而，再入问题中终端时间t_f通常未知且参与优化，传统做法需在SCO迭代中反复试探或固定初猜，显著降低在线求解效率，难以满足机载实时性要求。神经网络因具强非线性映射能力及快速前向推理特性，适合离线训练后嵌入在线预测。现有结合凸优化与神经网络预测的研究较少。为此，研究人员提出用离线训练的多层前馈神经网络直接预测当前飞行状态对应的终端时间，替换SCO中耗时的t_f寻参过程，以提高再入轨迹在线生成效率并保持精度与适应性。该文发表于MDPI期刊《Aerospace》。

二、关键技术方法概述

研究人员选取CAV-H(Common Aero Vehicle-H)为对象，建立无量纲三自由度再入动力学模型(地球旋转球模型，1976 US Standard Atmosphere大气密度)，以倾转角(bank angle, σ)导数为新控制量、σ本身为新状态量进行状态增广，并将时间t增广为状态变量使t_f可优化；代价函数取最小化t_f。非线性问题经动力学与过程约束(热流、动压、过载)一阶线性化、引入松弛变量及信赖域约束转化为凸最优控制问题，采用梯形离散化为SOCP子问题，用SCO迭代求解至收敛。为加速SCO，研究人员以再入器当前无量纲地心距r、速度V及与目标间大圆距离R_go(取代经纬度)为输入，t_f为输出，对初始状态施加随机扰动生成大规模样本，用传统SCO求取各样本对应t_f，离线训练四隐层全连接前馈神经网络(激活函数ReLU)，测试集相对误差控制在0.15%以内；在线阶段直接由NN预测t_f代入SCO初始化，省去t_f迭代寻优。通过标称仿真、对比GPOPS-II及传统SCO，以及Monte Carlo(50次，含初始状态扰动及终端位置变动)验证精度、效率与鲁棒性。

三、研究结果

2. Problem Formulation of Reentry Trajectory Planning（再入轨迹规划问题建模）

研究人员给出含地球自转的无量纲再入三自由度动力学方程，定义地心距r(无量纲化基准地球平均半径R_E=6378137 m)、相对地心速度V(无量纲化基准√(g₀R_E)，g₀=9.7803 m/s2)、经度λ、纬度φ、航迹角γ、航向角χ、倾转角σ；升阻力L,D经S=ρV2S_refC_L,D/m无量纲化。约束含初始/终端等式约束(位姿、速度)及过程不等式约束——热流Q?=k√(R_N)ρ^0.5V^3.0≤Q?_max、动压q=0.5ρV2≤q_max、法向过载n_z=L/(mg₀)≤n_z,max，以及攻角α、倾转角σ及其变化率限幅。将σ增广为状态(dσ/dt=u为控制)，时间t增广为状态(dt/dt=1，?_t=1，x_t(0)=0)，取J=t_f最小为性能指标，构成非线性最优控制问题(Problem 1)。

3. Online Trajectory Optimization Method（在线轨迹优化方法）

研究人员对增广动力学在参考轨迹处一阶Taylor展开线性化，过程约束同样线性化并引入松弛变量，形成凸最优控制问题(Problem 2)。采用梯形公式对时间轴N等分离散，节点间状态满足梯形积分等式约束，转换为有限维SOCP。SCO流程为：初始化标称轨迹→逐次线性化得凸子问题→求解→更新参考轨迹→判断信赖域内残差收敛(‖x^(k+1)?x^(k)‖<ε)，否则继续迭代。

3.4. Terminal Time Prediction（终端时间预测）

研究人员指出再入终端时间主要受当前r、V及剩余大圆距R_go影响，故NN输入取[r, V, R_go]，输出为t_f。样本生成步骤：设定初/终态及攻角剖线→对初态叠加随机扰动(各分量独立均匀采样)→以传统SCO全迭代求对应t_f→记录(r,V,R_go)→t_f样本对→更换扰动直至达到样本数N_s。网络结构为输入层—四隐藏层—输出层(单神经元)，ReLU激活，经反向传播训练。测试表明相对误差<0.15%。在线求解时NN直接输出t_f初值供SCO使用，消除t_f外层扫描。

4.1. Offline Training of Neural Network Dataset（神经网络数据集离线训练）

按上述样本生成流程建立数据库，经调参训练后网络预测值与SCO算得t_f吻合良好，绝对误差与相对误差分布显示测试集最大相对误差约0.15%，证明NN具足够拟合精度。

4.2. Simulation Verification（仿真校验）

对标称任务，NN-SCO、传统SCO及GPOPS-II所得高度—时间、经纬—轨迹、航迹角—时间、航向角—时间、倾转角—时间曲线几乎重合，终端约束满足且误差小。算法耗时对比显示NN-SCO较传统SCO及GPOPS-II减少50%以上计算时间，证明该方法在保持精度的同时显著提升实时性，可满足在线轨迹生成需求。

4.3. Monte Carlo Simulation（蒙特卡洛仿真）

对初态施加表列不确定性(位置、速度、航迹角等随机扰动)运行50次Monte Carlo，NN-SCO与传统SCO落点均位于目标4 km内，精度相当；NN-SCO平均单次求解时间显著低于传统SCO。进一步将终端位置也设为不确定参数变动，NN-SCO仍引导飞行器高精度抵达变动后的目标点，验证输入取相对量大圆距R_go使网络不依赖固定初/终态，具较强适应性。

四、讨论与结论翻译

研究人员得出结论：针对高超音速飞行器再入轨迹优化问题，本文提出一种带终端时间预测的在线轨迹优化方法。研究人员采用神经网络拟合飞行器当前状态与终端时间间的映射关系，替代优化过程中的参数计算。仿真结果表明，相比SCO方法及GPOPS-II，改进方法在计算效率上提升50%以上且保持相当精度。此外，Monte Carlo仿真分析显示，由于神经网络训练输入选用相对状态量(剩余大圆距)，改进方法可适应初/终位置在一定范围内超出训练集的扰动，且不依赖于固定的初态与终态。该方法为拓展再入飞行器任务重瞄与在线决策能力提供了思路。

（论文Conclusion原文凝练转述：For the reentry trajectory optimization problem of hypersonic vehicles, this paper proposes an online trajectory optimization method with terminal time prediction. A neural network is employed to fit the mapping between the vehicle's current state and the terminal time, replacing parameter computations in the optimization process. Simulation results demonstrate that, compared with the SCO method and GPOPS-II, the improved method achieves a more than 50% increase in computational efficiency while maintaining comparable accuracy. Monte Carlo simulation shows that, because the input variables selected for neural network training are relative state quantities, the improved method can adapt to perturbations within a certain range beyond the training set and does not rely on fixed initial and terminal states. This method provides insights for further developing the mission retargeting and online decision-making capabilities of reentry vehicles.）

热点排行