基于高斯过程在线学习的非合作航天器自适应姿态接管控制
《Aerospace Science and Technology》:Adaptive Attitude Takeover Control of Noncooperative Spacecraft via Gaussian Process Online Learning
【字体:
大
中
小
】
时间:2026年06月19日
来源:Aerospace Science and Technology 5.8
编辑推荐:
夏宇朗|宾路|刘向东|陈震北京工业大学自动化学院,中国北京市海淀区中关村南街5号,邮编100081摘要随着太空物体数量的增加,对能够处理巨大不确定性的航天器姿态接管控制方法提出了新的需求。近年来,蜂窝式航天器作为一种简单、经济且可重复使用的解决方案,受到了广泛关注。为了解决非合作
夏宇朗|宾路|刘向东|陈震北京工业大学自动化学院,中国北京市海淀区中关村南街5号,邮编100081摘要随着太空物体数量的增加,对能够处理巨大不确定性的航天器姿态接管控制方法提出了新的需求。近年来,蜂窝式航天器作为一种简单、经济且可重复使用的解决方案,受到了广泛关注。为了解决非合作目标尤其是那些能够产生未知扭矩的目标的姿态接管控制问题,本文提出了一种结合高斯过程在线学习与自适应控制的控制方法。采用稀疏在线高斯过程来实现系统不确定性的在线学习,并将学到的模型纳入自适应控制框架中用于控制器设计。所提方法的控制误差在概率意义上被严格证明是有限的。对于多蜂窝式航天器系统,还构建了带有能量平衡约束的分布式控制分配问题,并使用SDC-ADMM算法进行求解。数值仿真结果表明,所提出的控制策略能够实现组合航天器的高精度姿态控制,其跟踪性能优于传统控制方法,同时也验证了所提出的分布式控制分配方案的有效性。引言近年来,在轨服务已成为延长航天器寿命、减少太空碎片以及支持可持续空间运营的重要手段[1]。随着太空物体数量的增加,包括在轨加油、在轨维护以及主动清除碎片在内的复杂空间任务也日益频繁地被执行[2]。目前已部署了多种在轨服务任务,包括延长寿命的服务,如任务延长飞行器(MEV)[3];检查与维修服务,如地球同步卫星机器人服务系统(RSGS)[4];加油服务,如轨道快车[5];以及清除碎片的任务,如RemoveDEBRIS任务[6]。这些任务的成功执行依赖于服务航天器协助目标实现并保持稳定姿态的能力,这被称为航天器姿态接管控制。在实际场景中,任务目标可能是非合作的,即无法与服务航天器建立信息交流,其动态参数也是未知的,比如失效的航天器或太空碎片。此外,某些目标航天器可能由于通信子系统故障或推进及姿态控制系统故障而产生未知的控制扭矩。这些因素大大增加了目标动态的不确定性,从而给航天器姿态接管控制中的精确建模、控制器设计以及稳定性保障带来了巨大挑战。航天器姿态接管控制的前提是成功捕获目标航天器。目前已有三种主要的捕获方法被广泛研究。第一种方法是利用机械臂通过目标航天器上的专用接口建立机械连接,从而形成组合系统[7]、[8]。这种方法通常会导致系统复杂性和成本上升,且不适用于缺乏标准化接口的非合作目标。第二种方法是利用空间网来捕获目标[9],但由于网与目标之间的相互作用具有灵活性和松散约束性,很难实现对捕获对象的精确姿态控制。第三种方法则越来越受到重视,它依靠多个附着在目标航天器表面的蜂窝式航天器来完成捕获任务[10]。这些航天器通常被设计成小型、同质的单元,能够协同形成一个集成系统,同时在任务执行过程中能够实现分散部署并独立产生控制扭矩。大量研究已经为利用蜂窝式航天器实现航天器姿态接管控制奠定了理论和技术基础。Asri和Zhu[11]采用了同时定位与映射技术,使得多个蜂窝式航天器能够捕获移动的太空目标,并通过数值仿真验证了该方法的可行性。Spenko[12]系统研究了使蜂窝式航天器能够主动附着在刚体表面并自主脱离的技术,并在微重力条件下实验验证了它们的有效性。Han等人[13]研究了利用纳米卫星识别未知动态参数的方法。Chang等人[14]解决了使用多个蜂窝式航天器进行航天器姿态接管时的分布式控制分配问题,并明确考虑了能量平衡约束。此外,DARPA的Phoenix计划[15]以及用于在轨卫星服务的智能构建模块(iBOSS)[16]的不断进展,正在将这一概念从理论探索逐步转化为实际应用。鉴于蜂窝式航天器的应用潜力以及现有的研究成果,本文重点研究蜂窝式航天器捕获目标后用于姿态接管的控制算法设计。在航天器姿态接管控制中,目标航天器产生的未知扭矩以及环境干扰会引入较大的建模不确定性,使得基于模型的控制器无法发挥作用,而自适应控制则为在线补偿这类未知动态提供了良好的框架。Zhou等人[17]为组合航天器系统开发了一种自适应终端滑模控制器,其中采用了基于不确定性上界估计的参数化自适应律来补偿系统不确定性。Huang等人[18]提出了一种基于命令滤波自适应反步控制的自适应姿态接管控制框架,用以减轻参数不确定性。Zhang等人[19]设计了一种改进的自适应滑模控制器,用于抑制目标航天器的未知角动量,从而实现非合作目标的快速捕获后稳定。Chen等人[20]构建了一个非奇异滑模面,并设计了带有指数函数的自适应律,以实现不确定航天器的固定时间姿态稳定。Xie等人[21]和Yang等人[22]研究了使用反步法实现单个航天器的预定时段姿态控制以及多航天器在状态约束下的姿态一致性控制。Ning等人[23]提出了一种事件触发型自适应模糊控制方案,其中利用模糊逻辑系统在线估计系统不确定性,同时降低通信负担并保证闭环系统的有界性。作为经典的自适应控制范式,模型参考自适应控制通过参考模型明确纳入期望的闭环动态特性,使得受控系统能够在不确定性存在的情况下渐近跟踪预定的动态行为,同时还保持了严格的稳定性分析框架。传统的MRAC方案已通过引入径向基函数网络来实现自适应参数更新[24]。然而,大多数现有方法依赖于先验知识或启发式参数调优,例如滑模控制中所需的不确定性界限,或是径向基函数中心点和宽度的选择,而在不确定性变化极大的姿态接管场景中,这些参数很难确定。此外,大多数现有研究假设目标航天器已丧失产生未知扭矩的能力,但实际上,由于控制器故障、剩余动量管理或执行器意外激活等原因,非合作目标可能仍保留部分驱动能力。也有不少基于数据驱动的方法被提出用于航天器姿态接管控制。基于神经网络的方法,如径向基函数网络[25]、[26]以及长短期记忆网络[27],已被用来近似系统不确定性。此外,强化学习方法也被用于设计控制策略[27]、[28]、[29]。但这些方法通常存在一些局限性,包括缺乏严格的稳定性保证、在小样本场景下适用性有限以及训练成本高昂,这些都是在实际应用中难以克服的难题。高斯过程是一种基于贝叶斯理论的非参数学习方法,它无需预先定义功能结构,即可灵活地对未知函数进行建模[30]。高斯过程回归通过核函数描述数据之间的相关性,并以数据驱动的方式重建未知函数及其相关不确定性。稀疏在线高斯过程引入了基于Kullback–Leibler散度的信息保留准则,对训练样本进行稀疏化处理,从而显著降低计算复杂度并实现在线预测。这极大地提升了基于高斯过程的方法在实时控制系统中的应用能力。高斯过程回归对于高度不确定的系统具有很强的泛化能力,无需预先定义功能形式,能够提供带有量化不确定性的概率预测,即使在训练数据有限的情况下也能保持良好的性能。已有研究表明,将高斯过程模型纳入控制框架中,可以有效提升系统的性能和鲁棒性。Ignatyev等人[32]将SOGP应用于增量反步飞行控制,实现了更好的闭环稳定性和跟踪性能。Beckers等人[33]利用基于高斯过程的置信信息来调整欧拉-拉格朗日系统中的反馈增益,并证明了跟踪误差在指定概率下是全局有界的。Hewing等人[34]将高斯过程整合到模型预测控制框架中,通过仿真展示了其在控制性能和安全性方面的显著提升。这些研究都表明,高斯过程在处理系统不确定性方面具有应用潜力。基于这些进展,Liu等人[35]设计了一种基于高斯过程的自适应控制方案,用于非合作航天器的姿态接管控制。然而,该方法依赖于离线训练且缺乏在线数据更新,限制了其在实时应用中的适用性以及应对时变目标动态的适应性。非合作目标航天器姿态接管控制所面临的困难可总结如下。首先,由于系统干扰以及非合作目标产生的未知主动控制扭矩,存在较大的不确定性,这使得依赖精确系统动态的传统基于模型的控制方法难以应用,因为这些未知的系统动态很容易违反闭环系统稳定性所需的严格建模假设。其次,大多数现有自适应控制方法的性能取决于先验参数的选择,而在非合作接管场景中,这类先验参数通常是不可获得的。为了解决这些问题,本文将基于高斯过程的在线学习方法与自适应控制理论相结合,设计了一种用于航天器姿态接管系统的非参数控制算法,以确保在系统不确定性存在的情况下仍能实现精确的姿态调节。本文的主要贡献有两方面。首先,针对非合作航天器的姿态接管控制,开发了一种基于高斯过程的自适应控制方法,该方法能够通过在线学习来应对不确定的系统动态以及目标航天器产生的未知扭矩,且无需进行先验参数调优。其次,为多个蜂窝式航天器设计了一种分布式扭矩分配策略,用于实现对非合作航天器的姿态接管控制。本文的其余部分结构如下。第2节介绍了包含系统不确定性的组合航天器姿态动力学模型,并给出了控制目标。第3节介绍了所提出的控制方法,并进行了相应的稳定性分析。此外,还定义了多蜂窝式航天器系统的分布式优化问题,并开发了一种有效的解决方法。第4节通过数值仿真验证了所提方法的有效性。第5节则对全文进行了总结。组合航天器姿态动力学模型图1展示了通过蜂窝式航天器实现姿态接管控制的概念示意图。在经过探测和追逐阶段后[11],一群蜂窝式航天器会附着在目标航天器表面,从而形成组合航天器系统。xIyIzI坐标系是固定在地球上的惯性坐标系,而xbybzb坐标系则是固定在目标航天器上的机体坐标系。假设xbybzb坐标系的原点与目标航天器的质心重合。控制器设计系统(8)的控制目标由一个参考模型给出。将参考模型的状态向量表示为xrm=[σrm?,σrm˙?]?∈R6。引入二阶线性闭环动态关系如下[38]:x˙rm=[0I3?Kp,rm?Kp,rm]xrm+[0Kr,rm]r,其中下标rm表示参考模型,参数Kp,rm,Kd,rm,Kr,rm∈R3×3为增益矩阵。参考输入r∈R3表示施加在参考模型上的指令输入,对应于根据MRP要求的期望姿态。引入参考模型数值仿真本节通过仿真展示了使用SOGP-MRAC算法对非合作航天器进行姿态接管控制,以及基于SDC-ADMM算法对多蜂窝式航天器系统进行分布式控制分配的情况。通过展示和比较相应的仿真结果,验证了所提方法的有效性。名义惯性矩阵设置为J0=[20010910170595150]kg·m2,并引入了相对较大的惯性不确定性。结论本文提出了一种基于稀疏在线高斯过程的自适应控制方法,用于解决非合作航天器的姿态接管控制问题。在AMI-MRAC框架下,系统不确定性被明确估计,同时利用稀疏在线高斯过程实现在线学习和预测功能,从而使参考模型能够提前设计,以规定期望的闭环性能。经证明,由此产生的控制误差是有界的。未标注参考文献[43] CRediT作者贡献说明:郎晓宇:写作——审稿与编辑、写作——初稿撰写、可视化、方法论、研究设计、资金获取、正式分析、数据整理、概念构建。卢斌:写作——初稿撰写、可视化、验证、软件开发。刘向东:监督指导。陈震:监督指导。利益冲突声明:作者声明不存在任何可能影响本文所报告工作的已知财务利益或个人关系。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号