基于飞行路径角重构的多约束多项式引导律梁宏、张哲辰、常思江

《Aerospace》：A Flight Path Angle Reconstruction-Based Polynomial Guidance Law with Multiple Constraints Hong Liang, Zechen Zhang and Sijiang Chang

【字体：大中小】 时间：2026年04月23日 来源：Aerospace 2.2

编辑推荐：

　　摘要提出了一种新颖的多项式引导律，用于飞行器的终端引导，该引导律受到多个约束的限制，包括发射角、撞击角、撞击时间和零终端加速度。这种方法将飞行路径角度轮廓重构为两个部分：一部分满足约束条件，另一部分确保目标拦截。面向约束的部分被定义为相对剩余距离的多项式函数。基于这种重构框架，

　　摘要提出了一种新颖的多项式引导律，用于飞行器的终端引导，该引导律受到多个约束的限制，包括发射角、撞击角、撞击时间和零终端加速度。这种方法将飞行路径角度轮廓重构为两个部分：一部分满足约束条件，另一部分确保目标拦截。面向约束的部分被定义为相对剩余距离的多项式函数。基于这种重构框架，引入了一种新的线性化方法来处理非线性交战运动学问题。然后推导出一种封闭形式的引导律以满足多个约束，并从理论上分析了其收敛性。为了优化控制力，随后将数据驱动方法整合到该框架中。数值仿真结果表明，所提出的引导律能够高精度地满足多个约束条件。与现有方法相比，它所需的控制力也更小。具体来说，撞击角误差在0.02°以内，撞击时间误差在0.05秒以内。

1. 引言
引导律是飞行器引导和控制系统中的核心组成部分。它生成加速度指令以引导飞行器拦截目标。在终端归航阶段，施加多个轨迹约束以增强穿透能力和杀伤力。例如，撞击角约束允许从脆弱方向发动攻击；撞击时间约束可以实现协同齐射攻击以击败近距离防御；零终端加速度（ZTA）约束防止引导指令饱和，从而提高终端性能。最初的发射角通常不被视为轨迹约束，但它直接影响中途到终端的过渡条件和交战几何形态。因此，应将其视为一个关键输入变量。此外，引导律还期望最小化控制力，这可以减少执行器的负担并为应对意外机动留出足够的余地。

迄今为止，已经开展了大量关于多约束引导律的研究，其中最基础的是撞击时间和角度控制引导（ITACG）律。Chen等人[1]在小角度假设下推导出了最优ITACG律，并通过时间误差反馈项解决了大撞击角度时的奇异性问题。在[2]中，引导指令是从明确指定的剩余时间函数反向推导出来的，从而得到了满足ZTA约束的ITACG律。在[3]中探索了一种几何引导策略，该方法引入了一个虚拟目标并动态调整其速度，设计出无需剩余时间估计的ITACG律。Cao等人[4]建立了飞行路径角度与交战状态之间的映射，并使用数据驱动方法开发出具有良好能源效率的两阶段ITACG律。Chen等人[5]通过虚拟非线性变量和状态依赖的剩余时间轮廓将视野（FOV）约束纳入其中，实现了有限时间收敛。为了同时满足FOV和横向加速度约束，Singh等人[6]采用了障碍李雅普诺夫函数，以确保在非线性运动学下的收敛性。然而，这些方法在多个轨迹约束下难以同时实现精确拦截。

多项式轨迹整形方法作为一种有前景的多约束引导律方法脱颖而出，因为它结构简洁且物理意义明确。Lee等人[7]通过将引导指令定义为剩余时间的双项式多项式，提出了剩余时间多项式引导（TPG）律，实现了满足ZTA约束的撞击角控制。Kim等人[8]通过添加一个常数项将TPG扩展到撞击时间控制，并进一步将常数增益推广为任意时变函数[9]，从而实现了复杂任务下的灵活引导指令整形，并保持了终端特性。作为另一种新方法，引入了几何整形方法[10,11,12]。在这种方法中，飞行器轨迹被参数化为典型的几何曲线，这使得可以用最少的信息控制发射角、撞击角和撞击时间。此外，基于贝塞尔曲线的方法[13,14,15,16,17]也受到了广泛关注。这些方法利用了可调节的控制点和可控的端点方向等几何属性，从而可以解析表达多个终端约束。更广泛地，Duan等人[18]将轨迹参数化为通用多项式以满足撞击角和时间约束，然后引入了位置误差反馈项来补偿小角度假设的误差。Shi等人[19]通过梯度下降法解析确定了多项式系数，实现了在撞击角和禁止飞行区约束下的实时闭环引导。同样，范围整形方法[20,21,22]将剩余距离参数化为飞行器状态的多项式函数。航向误差也被明确构建为飞行器状态的解析函数[23,24,25,26]。通过这种方式，多约束问题被转化为几何量设计任务，从而无需数值迭代即可得到简洁且可行的引导指令。

总体而言，上述研究存在以下局限性：(a) 大多数多项式引导律将时间约束与角度约束耦合在一起，这限制了轨迹塑形的灵活性。(b) 大多数研究仅关注撞击角和撞击时间控制，难以同时满足多个约束。(c) 许多研究难以处理非线性交战运动学问题，它们通常依赖于小角度假设或数值迭代。(d) 尽管满足了终端约束，现有方法往往未能从轨迹塑形的几何角度最小化全局控制力。为了应对这些问题，本文提出了一种基于飞行路径角度重构的多项式引导律。飞行路径角度轮廓被解析重构为两个部分：一个多项式项和一个比例导航项。多项式项旨在满足轨迹约束，而比例导航项确保零偏离距离。飞行路径角度的多项式项被定义为剩余距离的多项式函数，旨在满足所需的发射角、撞击角和撞击时间约束。然后，推导出了最小可实现撞击时间的解析解，并从理论上分析了ZTA约束的收敛性。此外，采用数据驱动方法来优化全局控制力。数值仿真验证了所提出引导律的有效性和优越性。

与现有研究相比，本文的主要创新之处在于：(a) 提出了一种基于飞行路径角度重构的新颖多项式轨迹整形方法，该方法通过多项式设计将角度约束与时间约束解耦，从而增强了轨迹塑形的灵活性并实现了多个约束。(b) 引入了一种基于加权均方误差的新线性化方法，该方法在解决非线性问题时具有高精度。(c) 使用反向传播神经网络（BPNN）来优化控制力，这也为多项式引导律的参数优化提供了新的视角。

2. 问题表述
本文研究的问题与其他文献中提出的问题类似（参见参考文献[5]及其中的参考文献）。在描述交战场景之前，为了方便起见，给出三个广泛接受的假设：燃料质量被认为远小于飞行器的总质量，且质量变化可以忽略不计；火箭型飞行器和大多数有翼飞机在终端归航阶段的速度变化缓慢，飞行器的速度被认为是恒定的；在终端归航阶段，飞行器的速度被认为显著大于目标的速度，且目标被认为是静止的。对于高度机动的目标，这一假设可能不成立，这将是未来的研究方向。在本文中，飞行器和目标都被视为点质量。与参考文献[10,11,12,13]类似，我们考虑了如图1所示的二维平面交战几何形态。图1. 飞行器-目标交战几何形态。飞行器以恒定速度从其发射点朝向静止目标运动，实时坐标为...。所需的发射角和撞击角分别为...和...。飞行器与目标的相对运动由以下微分方程描述：
...
其中...表示横向加速度；...表示飞行路径角度；...表示视线（LOS）角度；...表示航向误差；...表示剩余距离（飞行器-目标距离）。对航向误差关于剩余距离求导得到：
...
重新排列上述方程得到：
...
方程(8)控制了沿轨迹的航向误差演变，将在后续章节中用于推导引导指令并分析其收敛性。

3. 引导律设计
3.1. 飞行路径角度重构引导框架
飞行路径角度被重构为两个独立部分，如下：
...
其中...用于满足发射角、撞击角和撞击时间的约束，而...确保精确的目标拦截。对两侧关于时间求导得到：
...
因此，横向加速度指令也可以分解为两部分。
...
受比例导航的启发，...被设置为LOS速率的...倍，其中...是导航比率。因此，...和...可以表示为：
...
方程(11)表明，所提出的框架在结构上类似于有偏比例导航律。此外，通过数学推导，独立变量从时间域转换到了距离域，这便于后续的引导律设计。

3.2. 发射角和撞击角设计
为了确定...，将其建模为...的多项式，如下：
...
其中...和...是满足...的引导增益，...是需确定的系数，以满足轨迹约束。这个多项式为引导指令设计提供了一个简洁的框架。在本文中，其三个系数对应于三个轨迹约束：发射角、撞击角和撞击时间。因子...有助于解耦约束，使设计更加灵活。引导增益...和...可以独立优化，而不影响约束。实际上，如果任务需要，这种多项式结构可以扩展到更多约束。
飞行器轨迹的初始和终端约束由以下给出：
...
其中...和...是飞行器的初始和最终位置；...和...分别是实际发射角和撞击角。由于...缺乏显式表达，因此首先需要推导出在任何给定...下的...值。将方程(11)-(13)代入方程(8)得到：
...
重新排列上述方程得到：
...
...的表达式可以写为：
...
将方程(17)代入方程(18)并积分得到：
...
实际轨迹必须满足发射角和撞击角约束：
...
结合方程(14)和(19)得到：
...
上述方程得到：
...
其中...是初始航向误差。
3.3. 撞击时间设计
方程(14)中的第三项用于实现所需的撞击时间。根据方程(3)，其表示如下：
...
为了获得解析解，引入了一个比例系数（详见第3.4节），并将其近似为...
将方程(25)代入方程(24)得到：
...
同样，为了获得...的显式表达式，定义一个比例系数（详见第3.4节）。由于方程(16)是一阶非线性微分方程，将其近似为...
将方程(27)代入方程(16)得到：
...
对方程(14)的两侧关于...求导得到：
...
将方程(29)代入方程(28)并积分得到...的表达式，如下：
...
方程(30)中显示的系数如下：
...
将方程(30)和(31)代入方程(26)得到关于...的二次方程，如下：
...
由积分结果确定的系数...明确表示如下：
...
设置...时，方程(32)只有在其满足...的情况下才有实数解，即：
...
使用二次公式，可以得到满足撞击时间约束的...值。
根据方程(26)和(30)，...可以写为：
...
其中被积函数...对所有...都有效。因此，...始终成立。
从方程(34)可以看出，...是...的线性函数。由于...随...线性增加，因此存在一个最小值...，在该值下方程(32)有一个唯一的实数解。当方程（32）没有实数解时，表明无法满足撞击时间约束。因此，所提出的导引律的最小可实现撞击时间由以下公式给出：（36）以某两个具体值为例，图2绘制了随着这两个值变化的最小可实现撞击时间的变化情况。如图2所示，当这些值满足特定条件时，最小可实现撞击时间接近50秒（即直线飞行的最短时间），并且随着这两个值的增加而增加。基于上述推导，第3.2节确定了多项式系数a和b，以满足发射角和撞击角约束。第3.3节进一步结合了撞击时间约束，得到了最小可实现撞击时间的闭合形式表达式。这些结果为后续章节提供了基础。3.4. 比例系数设计为了获得航向误差微分方程和撞击时间积分的解析解，使用低阶泰勒级数近似了正切函数和正割函数。随后引入了比例系数a和b，即（37）。假设航向误差可以趋近于零，定义了两个加权均方误差函数（38），其中w1和w2是权重函数。为了确保在航向误差趋近于零的终端阶段有足够的精度，权重函数应随着航向误差的减小而增加。通过迭代研究，并考虑到解析解的必要性，权重函数被选定如下（39）。加权均方误差（WMSE）定义为在给定权重下近似值与真实值之间的均方误差。为了最小化WMSE，变分原理得出（40）。根据方程（38），比例系数a和b由以下公式给出（41）。图3展示了上述比例系数的变化情况。从图3可以看出，当航向误差增大时，两个比例系数都随之增加；当航向误差较小时，它们接近于一，表明未经加权的线性近似是足够的。当航向误差进一步增大时，两个系数明显偏离于一，且a的增长速度快于b。为了评估所提近似的有效范围，进行了数值测试。初始航向误差从某个值变化到另一个值，使用方程（36）计算撞击时间。轨迹和近似误差的结果显示在图4中。图4展示了不同初始航向误差下的轨迹和近似误差情况。图4a显示了不同初始航向误差下的轨迹；图4b绘制了近似误差与初始航向误差的关系。可以看出，所有测试中的撞击角误差都非常小；对于某些初始航向误差，撞击时间误差约为0.1秒或更少，因此这些误差在实际应用中是可以接受的。4. 收敛性分析所提出的导引律具有复合结构：a满足轨迹约束，而b保证目标拦截。为了验证其收敛性，必须检查航向误差和侧向加速度，以确保终端动态的平滑性和误差的稳定收敛。为了便于分析航向误差和侧向加速度随着时间变化的渐近行为，使用了渐近符号来表征它们的终端衰减率。对于定义在某个区间上的函数，如果存在正常数a和b，使得对于所有x满足某个条件，则表示该函数以某个速率衰减。可以看出，当满足特定条件时，航向误差将以某个速率衰减至零；否则，无法保证收敛性。此外，较大的a值会导致更快的收敛速率。4.1. 航向误差的收敛性根据方程（30），在a的前三项中，高阶项衰减最快，而b衰减最慢。考虑到第四项，a的主导衰减阶为（42）。如前所述，导引增益满足某些条件、导航比率和比例系数要求。显然，因此a自动得到满足。4.2. 侧向加速度的收敛性所提出的导引律如下：（43）首先分析b的终端收敛性。根据方程（29），b的主导衰减阶为（44），其终端值由（45）给出。根据方程（30），b的主导衰减阶为（46）。结合方程（44）和（46），终端侧向加速度由（47）给出。为了确保终端侧向加速度收敛至零，需要满足某些条件。与传统的终端位置约束不同，所提出的导引律引入了以渐近收敛为特征的过程约束。为实现这一点，它隐含要求终端侧向加速度至少具有一阶平滑衰减。根据上述分析，并结合相关条件，所提出导引律的收敛条件如下（48）。在下一节中，这些条件将用于指导导引增益和导航比率的选取。5. 使用数据驱动方法的控制力优化控制力是轨迹设计中的一个重要问题。导引增益与导航比率直接影响到收敛速率和控制力。如前所述，较大的a或b值会导致更快的收敛速率。然而，a与b成正比，同时b也会影响收敛速率。因此，需要平衡收敛速率和控制力。在实际应用中，a通常选择在3到6之间的值[4,5,6]。根据方程（48），a满足一阶收敛速率。同时，它保持b相对较小。因此，在本文中a被设定为3。然后，b可以作为优化变量，受第4节中推导出的收敛约束的限制。优化问题可以表述如下（49）。这个问题是一个受限的非线性优化问题。传统的数值方法需要迭代计算，这对于机载实现来说太耗时。因此，本文采用了基于BPNN的方法。该方法可以离线训练，并在启动时直接调用以输出最优增益，无需迭代，因此适用于实时应用。详细步骤如下：(a) 数据集构建：通过在某个范围内均匀采样并组合，共生成了274,013组初始仿真条件。对于每种条件，使用序列二次规划（SQP）解决了方程（49）中的优化问题，得到的最优导引增益作为真实数据。(b) BPNN映射架构的构建：构建了一个具有三个隐藏层的BPNN。输入层包含三个节点，输出层包含两个节点。每个隐藏层包含100个节点。为了确保训练过程中始终满足某个约束，定义了某些参数，使得条件得到满足。然后对输出层节点进行设置（50）。根据上述配置，BPNN的映射架构如图5所示。图5展示了BPNN的映射架构。(c) 网络训练和测试：生成的数据集被随机分为训练集、验证集和测试集，比例分别为70%、15%和15%。所有输入和输出在训练前都进行归一化。网络使用Levenberg–Marquardt（LM）算法进行训练，损失函数为均方误差（MSE），迭代次数最多为3000次。训练过程中训练集、验证集和测试集的误差历史如图6所示。图6显示，在第2953次迭代时达到最小验证误差0.0267，表明映射网络的收敛性和泛化性能良好。此外，闭合形式的导引律不需要迭代。注意，全投入仿真（包括神经网络调用）大约需要40.82毫秒，这使其适用于实时应用。6. 数值模拟进行了数值模拟以验证所提导引律的性能。除非另有说明，飞行器的速度被设定为某个值。初始条件被设定为某两个值。通过将侧向加速度建模为一阶动态系统来考察自动驾驶仪滞后对导引律性能的影响[12]：（51）。其中表示实际导引指令，自动驾驶仪时间常数为某个值。此外，在整个仿真过程中侧向加速度被限制在某个范围内，其中表示重力加速度。6.1. 导引律的性能验证为了验证所提出的导引律，考虑了四组仿真参数，如表1所示。对于每种情况，通过将参数代入方程（50）定义的训练有素的映射网络中，获得了相应的最优导引增益。表1列出了性能验证的仿真参数和最优导引增益。图7展示了四种测试情况的仿真结果，其中图7a和b显示了每种情况的轨迹和侧向加速度曲线。所有情况都遵循平滑轨迹并准确拦截目标。初始时侧向加速度指令较大，用于轨迹成形，但随后平滑收敛至零，这与第4.2节的分析一致。图7c和d展示了飞行路径角和航向误差的时间历史。所有情况都实现了预期的撞击角，且撞击时刻的航向误差收敛至零。此外，实际撞击时间分别为54.95秒、60.02秒、65.05秒和70.00秒，与预期值吻合良好。这也验证了第4.1节中介绍的比例系数的合理性。6.2. 协同攻击由于所提出的导引律提供了最小可实现撞击时间的显式表达式，这里将其应用于协同攻击场景。考虑三个飞行器在平面攻击中攻击一个静止目标的情况。以固定的导引增益为例。初始条件如表2所示。根据方程（36），每个飞行器的最小可实现撞击时间分别为48.427秒、48.604秒和48.995秒。因此，将a设定为49秒。表2列出了协同攻击的仿真参数。图8展示了协同攻击的仿真结果。图8a显示了三个飞行器的轨迹。尽管初始位置不同，所有飞行器同时拦截目标，且具有不同的撞击角。图8b显示了侧向加速度曲线。所有飞行器的加速度指令最初较大，用于轨迹成形，但随后平滑收敛至零，这与第4.2节的分析一致。图8c和d分别展示了飞行路径角和剩余航程的时间历史。所有飞行器的剩余航程同步减少，并在同一时间达到零。这充分证明了所提导引律在协同攻击任务中的有效性，并为饱和攻击战术提供了技术支持。6.3. 对比分析为了进一步证明所提导引律的优越性，在相同条件下进行了对比仿真。仿真参数设定为某些值。使用方程（50）得到了最优导引增益。撞击角误差和撞击时间误差分别定义为某个值和另一个值。表3列出了选定的导引律以及它们能够满足的轨迹约束。表3还呈现了对比分析的数值模拟结果。可以观察到，与其他导引律相比，所提出的导引律满足了最多的轨迹约束，同时控制力最小。图9展示了对比分析的仿真结果。图9a显示所有五种导引律都以较小的偏差拦截目标。如图9c和表3所示，每种导引律的撞击角和撞击时间误差都相对较小。图9b展示了侧向加速度曲线。参考文献[1]中的加速度指令在初始阶段饱和，并在终止阶段表现出非零的终端加速度。尽管参考文献[12]中的终端横向加速度趋于零，但从图9d中可以看出，这两种导引律（参考文献[1,12]）的控制力度相对较高。图9显示了与现有方法的仿真结果对比，“Tsalik, R (2019)”代表参考文献[11]，“Chen, X (2019)”代表参考文献[1]，“Kedarisetty, S (2024)”代表参考文献[12]，“Hou, L (2023)”代表参考文献[3]。仿真结果表明，参考文献[11]的控制力度也相对较低，但其能满足的约束条件较为有限，且终端加速度不为零。虽然参考文献[3]能够满足更多的约束条件，但所提出的导引律仍然实现了更低的控制力度。此外，本文还考虑了初始发射角度的约束，进一步体现了所提出的导引律相较于文献中现有研究的全面优越性。

7. 结论

本文提出了一种基于飞行路径角度重建的多约束多项式导引律。通过将飞行路径角度分解为多项式和比例导航分量，该方法能够灵活控制多种约束条件，包括发射角度、撞击角度、撞击时间以及零终端加速度。引入了线性比例系数来高精度处理非线性动力学问题。收敛性分析为选择保证终端误差平滑收敛的导引增益提供了依据。同时，采用反向传播神经网络优化导引增益，显著降低了整体控制力度。仿真结果表明，所提出的导引律能够精确满足多种约束条件，并在协作交战场景中实现同时撞击。撞击角度误差在0.02°以内，撞击时间误差在0.05秒以内；航向误差在终端阶段趋于零，横向加速度也至少以一阶平滑方式趋于零。总体而言，所提出的导引律在综合性能上优于现有方法。

热点排行