《Aerospace Science and Technology》:Efficient and Robust Guidance for Active Aircraft Defense: A Hybrid-Screened Associated Globalized Dual Heuristic Programming Approach
编辑推荐:
在目标-防御者-攻击者(T-D-A)交战中的高维非线性和强对抗交互对主动飞机防御构成了重大挑战。为解决这些复杂性,研究人员提出了一种统一的主动防御决策框架,用于在线同步策略优化,同时生成目标飞机的最优规避机动和防御导弹的精确拦截指令。为解决强智能体间耦合和跨尺
在目标-防御者-攻击者(T-D-A)交战中的高维非线性和强对抗交互对主动飞机防御构成了重大挑战。为解决这些复杂性,研究人员提出了一种统一的主动防御决策框架,用于在线同步策略优化,同时生成目标飞机的最优规避机动和防御导弹的精确拦截指令。为解决强智能体间耦合和跨尺度动力学问题,开发了一种混合筛选关联全局化对偶启发式规划(HS-AGDHP)算法。其架构核心是一种由混合尺度激活函数增强的新型关联对偶网络,该网络有效捕捉异构作战动力学并缓解传统多层感知器(MLP)的谱偏差。与依赖噪声敏感自动微分的传统自适应动态规划(ADP)不同,该架构在前向传播中显式输出性能指标及其共态(costates)。通过绕过递归反向传播的需要,这种无梯度机制降低了计算开销,展示了在线制导应用的理论潜力。为加强该结构,基于随机配置网络(SCN)的物理启发式筛选机制选择噪声不敏感节点,有效缓解了随机环境中的噪声。此外,饱和嵌入Actor网络有效约束物理执行器,防止激进机动下的策略振荡,而时变增量模型(TVIM)减轻了对全局先验动力学的依赖。全面的统计仿真表明,HS-AGDHP框架在指令平滑性、控制努力效率和环境鲁棒性之间实现了强劲的综合平衡。
**研究背景与问题**
随着空对空导弹在精度、机动性和智能化方面的显著进步,其交战包线大幅扩展,无逃逸区显著增大,使得传统被动防御手段难以应对高价值飞行器的生存挑战。针对此困境,主动飞机防御策略成为航空航天制导领域的研究热点:目标飞机部署防御导弹进行拦截,同时自身执行规避机动,形成典型的目标-防御者-攻击者(T-D-A)多智能体交战场景。该场景涉及强对抗博弈、多物理约束耦合,对制导控制算法的在线性能、最优性和鲁棒性提出了极高要求。现有研究主要基于最优控制、微分博弈、视线(LOS)制导和强化学习等方法,但传统自适应动态规划(ADP)在T-D-A场景中存在关键缺陷:全局长距离对偶启发式规划(GDHP)虽被认为是ADP中最稳健的变体,却需计算性能指标的二阶混合偏导数,依赖繁琐的反向传播(BP)链式法则,计算负担随网络深度和宽度指数增长,严重制约其在资源有限的弹载平台上的在线应用。此外,系统动力学呈现跨尺度特征且受强随机噪声污染,高维对抗下的递归自动微分会指数级放大噪声,导致梯度退化与策略发散。为此,研究人员提出了一种混合筛选关联全局化对偶启发式规划(HS-AGDHP)算法,旨在突破现有技术瓶颈。该论文发表在《Aerospace Science and Technology》。
**主要关键技术方法**
(1)混合多尺度特征映射:集成Softplus、Tanh、Sinusoid和线性特征等异构激活函数,实现复杂作战动力学的全包络表示,缓解传统MLP的谱偏差,同时保持计算效率。(2)物理信息稀疏筛选:利用随机配置网络(SCN)机制,稀疏选择与相对距离、视线角速率等物理目标相关的隐节点,提供“物理信息热启动”,减轻盲初始化带来的噪声敏感和过拟合问题。(3)饱和嵌入Actor框架:在Actor网络中集成Tanh激活函数,以平滑、可微分的方式严格确保制导指令符合物理执行器限制。(4)统一主动防御框架:基于时变增量模型(TVIM)建立同步在线策略优化框架,处理飞机规避与导弹拦截之间的强耦合。所有仿真均在标准计算平台上完成,未提及具体样本队列来源。
**研究结果**
(1)消融研究(Ablation Study):通过解耦核心组件——“混合多尺度特征”和“SCN筛选机制”——量化了它们各自对网络逼近能力和收敛速度的贡献,验证了混合激活函数可有效捕捉异构动力学并缓解谱偏差,而SCN筛选机制通过选择噪声不敏感节点提升了环境鲁棒性。
(2)对比性能基准测试(Comparative Performance Benchmarking):将HS-AGDHP与现有ADP变体(HDP、DHP、GDHP、AGDHP)及经典制导律进行严格对比。统计仿真表明,HS-AGDHP框架在指令平滑性、控制努力效率和环境鲁棒性之间实现了强劲的综合平衡,同时指令生成计算开销更低,理论上适用于在线制导。
(3)评估结果中还包括对T-D-A场景下多目标协同的验证:饱和嵌入Actor框架有效防止了激进机动下的策略振荡;时变增量模型(TVIM)减轻了对全局先验动力学的依赖,增强了算法对未建模动态的适应性。
**总结与结论**
该研究提出的HS-AGDHP框架成功应对了强耦合的T-D-A交战问题。作为控制层面的主要创新,该框架实现了同步双目标协同,同时生成载机的最优规避机动和防御导弹的精确拦截指令。从航空航天制导实践的角度看,HS-AGDHP框架的意义远超单纯的计算性能提升,它通过物理启发的智能体协作,从根本上改变了主动防御场景下实时决策的可行性。
结论翻译(Conclusion部分):总之,本研究提出了HS-AGDHP框架,用于解决强耦合的目标-防御者-攻击者(T-D-A)交战问题。作为主要的控制层面创新,该提出的框架实现了同步双目标协同,同时生成载机的最优规避机动和防御导弹的精确拦截指令。从航空航天制导实践的角度来看,提出的HS-AGDHP框架的意义远远超出了单纯的计算性能提升——它通过物理启发的智能体协作,从根本上改变了主动防御场景下实时决策的可行性。