高效鲁棒的主动飞机防御制导：一种混合筛选关联全局化对偶启发式规划（HS-AGDHP）方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Aerospace Science and Technology》：Efficient and Robust Guidance for Active Aircraft Defense: A Hybrid-Screened Associated Globalized Dual Heuristic Programming Approach

【字体：大中小】 时间：2026年06月04日 来源：Aerospace Science and Technology 5.8

编辑推荐：

　　在目标-防御者-攻击者（T-D-A）交战中的高维非线性和强对抗交互对主动飞机防御构成了重大挑战。为解决这些复杂性，研究人员提出了一种统一的主动防御决策框架，用于在线同步策略优化，同时生成目标飞机的最优规避机动和防御导弹的精确拦截指令。为解决强智能体间耦合和跨尺

在目标-防御者-攻击者（T-D-A）交战中的高维非线性和强对抗交互对主动飞机防御构成了重大挑战。为解决这些复杂性，研究人员提出了一种统一的主动防御决策框架，用于在线同步策略优化，同时生成目标飞机的最优规避机动和防御导弹的精确拦截指令。为解决强智能体间耦合和跨尺度动力学问题，开发了一种混合筛选关联全局化对偶启发式规划（HS-AGDHP）算法。其架构核心是一种由混合尺度激活函数增强的新型关联对偶网络，该网络有效捕捉异构作战动力学并缓解传统多层感知器（MLP）的谱偏差。与依赖噪声敏感自动微分的传统自适应动态规划（ADP）不同，该架构在前向传播中显式输出性能指标及其共态（costates）。通过绕过递归反向传播的需要，这种无梯度机制降低了计算开销，展示了在线制导应用的理论潜力。为加强该结构，基于随机配置网络（SCN）的物理启发式筛选机制选择噪声不敏感节点，有效缓解了随机环境中的噪声。此外，饱和嵌入Actor网络有效约束物理执行器，防止激进机动下的策略振荡，而时变增量模型（TVIM）减轻了对全局先验动力学的依赖。全面的统计仿真表明，HS-AGDHP框架在指令平滑性、控制努力效率和环境鲁棒性之间实现了强劲的综合平衡。

**研究背景与问题**
随着空对空导弹在精度、机动性和智能化方面的显著进步，其交战包线大幅扩展，无逃逸区显著增大，使得传统被动防御手段难以应对高价值飞行器的生存挑战。针对此困境，主动飞机防御策略成为航空航天制导领域的研究热点：目标飞机部署防御导弹进行拦截，同时自身执行规避机动，形成典型的目标-防御者-攻击者（T-D-A）多智能体交战场景。该场景涉及强对抗博弈、多物理约束耦合，对制导控制算法的在线性能、最优性和鲁棒性提出了极高要求。现有研究主要基于最优控制、微分博弈、视线（LOS）制导和强化学习等方法，但传统自适应动态规划（ADP）在T-D-A场景中存在关键缺陷：全局长距离对偶启发式规划（GDHP）虽被认为是ADP中最稳健的变体，却需计算性能指标的二阶混合偏导数，依赖繁琐的反向传播（BP）链式法则，计算负担随网络深度和宽度指数增长，严重制约其在资源有限的弹载平台上的在线应用。此外，系统动力学呈现跨尺度特征且受强随机噪声污染，高维对抗下的递归自动微分会指数级放大噪声，导致梯度退化与策略发散。为此，研究人员提出了一种混合筛选关联全局化对偶启发式规划（HS-AGDHP）算法，旨在突破现有技术瓶颈。该论文发表在《Aerospace Science and Technology》。

**主要关键技术方法**
（1）混合多尺度特征映射：集成Softplus、Tanh、Sinusoid和线性特征等异构激活函数，实现复杂作战动力学的全包络表示，缓解传统MLP的谱偏差，同时保持计算效率。（2）物理信息稀疏筛选：利用随机配置网络（SCN）机制，稀疏选择与相对距离、视线角速率等物理目标相关的隐节点，提供“物理信息热启动”，减轻盲初始化带来的噪声敏感和过拟合问题。（3）饱和嵌入Actor框架：在Actor网络中集成Tanh激活函数，以平滑、可微分的方式严格确保制导指令符合物理执行器限制。（4）统一主动防御框架：基于时变增量模型（TVIM）建立同步在线策略优化框架，处理飞机规避与导弹拦截之间的强耦合。所有仿真均在标准计算平台上完成，未提及具体样本队列来源。

**研究结果**
（1）消融研究（Ablation Study）：通过解耦核心组件——“混合多尺度特征”和“SCN筛选机制”——量化了它们各自对网络逼近能力和收敛速度的贡献，验证了混合激活函数可有效捕捉异构动力学并缓解谱偏差，而SCN筛选机制通过选择噪声不敏感节点提升了环境鲁棒性。
（2）对比性能基准测试（Comparative Performance Benchmarking）：将HS-AGDHP与现有ADP变体（HDP、DHP、GDHP、AGDHP）及经典制导律进行严格对比。统计仿真表明，HS-AGDHP框架在指令平滑性、控制努力效率和环境鲁棒性之间实现了强劲的综合平衡，同时指令生成计算开销更低，理论上适用于在线制导。
（3）评估结果中还包括对T-D-A场景下多目标协同的验证：饱和嵌入Actor框架有效防止了激进机动下的策略振荡；时变增量模型（TVIM）减轻了对全局先验动力学的依赖，增强了算法对未建模动态的适应性。

**总结与结论**
该研究提出的HS-AGDHP框架成功应对了强耦合的T-D-A交战问题。作为控制层面的主要创新，该框架实现了同步双目标协同，同时生成载机的最优规避机动和防御导弹的精确拦截指令。从航空航天制导实践的角度看，HS-AGDHP框架的意义远超单纯的计算性能提升，它通过物理启发的智能体协作，从根本上改变了主动防御场景下实时决策的可行性。
结论翻译（Conclusion部分）：总之，本研究提出了HS-AGDHP框架，用于解决强耦合的目标-防御者-攻击者（T-D-A）交战问题。作为主要的控制层面创新，该提出的框架实现了同步双目标协同，同时生成载机的最优规避机动和防御导弹的精确拦截指令。从航空航天制导实践的角度来看，提出的HS-AGDHP框架的意义远远超出了单纯的计算性能提升——它通过物理启发的智能体协作，从根本上改变了主动防御场景下实时决策的可行性。

联系信箱：

粤ICP备09063491号

热点排行