《Acta Astronautica》:Predictive calibration for digital sun sensors using sparse submanifold convolutional neural networks
编辑推荐:
近年来,人工智能在空间应用领域的发展反映了其在地面领域所取得的成就,特别是在数据丰富的计算机视觉任务中。在航天器姿态敏感器中,数字太阳敏感器(DSS)因其简单性、鲁棒性和低成本而得到广泛应用,但其可达到的姿态精度往往受到传感器误差和标定质量的限制。虽然这些误差
近年来,人工智能在空间应用领域的发展反映了其在地面领域所取得的成就,特别是在数据丰富的计算机视觉任务中。在航天器姿态敏感器中,数字太阳敏感器(DSS)因其简单性、鲁棒性和低成本而得到广泛应用,但其可达到的姿态精度往往受到传感器误差和标定质量的限制。虽然这些误差可以通过标定来缓解,但传统的DSS标定程序成本高昂、耗时费力,现有的标定算法依赖于质心等浅层特征,并非端到端方法,需要分割操作,具有掩模特异性,且受噪声限制。此外,传统的多路复用方法通常依赖于显式模板匹配进行相关映射。本研究聚焦于预测标定以提升DSS性能,其动机源于纳卫星平台的相关实际约束,其中有限的硬件调谐和制造精度增加了对高质量标定的依赖。为应对传统标定方法的局限性,研究人员提出了一种针对DSS的端到端预测标定框架,利用稀疏子流形卷积神经网络(SSCNN)直接从光照图像估计双轴太阳角。所提方法在评估的掩模配置和研究的本地区域视场(FOV)范围内达到了亚角分精度,平均绝对误差约为0.005°。在原理验证评估之后,本研究聚焦于通过全局归一化对四个FOV区域进行局部映射,以展示网络原型设计和评估,并引入局部归一化以支持未来系统级扩展练习中的可扩展FOV扩展。该网络仅用于方法原型设计和预训练,并非用于飞行就绪状态;弥合这一从模拟到现实(Sim2Real)的差距被确定为未来工作,建议采用域自适应方法以实现真实空间部署。本研究的主要贡献包括:将基于CNN的回归框架应用于DSS预测标定、以端到端标定方法取代传统的基于质心的处理流程、具备多路复用能力的网络使得局部光斑特征和相关规则成为学习表示而非先验编码模板,以及开发公开可用的基于物理的合成DSS数据集和仿真框架。
研究背景与问题阐述。姿态敏感器通过感知天文目标来确定航天器姿态,太阳和恒星是两类主要的天文感知目标。太阳敏感器、磁强计、星敏感器和地球敏感器均属于此类敏感器,其中太阳敏感器是小型卫星姿态确定中最常见且最重要的敏感器之一。数字太阳敏感器(DSS)构成了现代高精度太阳敏感器中最大的一类。然而,利用DSS进行姿态估计的主要挑战在于传感器误差,这些误差限制了整体可达到的姿态估计精度。在研制和在轨运行期间,传感器受到多种不确定性来源的影响,包括制造、环境、干扰源或传感器架构固有的因素。太阳敏感器标定过程尤为困难,因为所涉及的不确定性具有复杂性质。现有文献调研识别出三个关键挑战:缺乏公开可用的数据集来测试和训练太阳敏感器标定算法;模型通常与特定架构紧密耦合且需要手动误差表征;特征提取改进面临收益递减,且其在利用丰富特征空间进行标定映射方面的能力有限。此外,传统多路复用方法通常依赖显式模板匹配进行相关映射,需要精心设计的编码模板和相关模型的显式标定。对于纳卫星平台而言,这些挑战尤为突出,因为有限的硬件调谐和制造精度增加了对高质量标定的依赖,以获取精确的姿态估计。传统太阳敏感器标定技术受到多方面因素限制:依赖劳动密集型的数据采集,需要对复杂不确定性进行建模,且所依赖的特征提取方法性能已趋于瓶颈。
研究开展与主要结论。为解决上述挑战,研究人员提出了一种基于CNN的多路复用标定框架,用于DSS的预测标定。该框架利用物理引导神经网络(PgNN)方法,通过学习嵌入已知DSS物理特性的基于物理的高保真仿真框架生成的一致性训练数据,将几何、衍射和探测器响应等物理效应隐式地嵌入学习到的图像到角度的映射中,而非通过显式参数模型施加。该框架支持通过多路复用原理进行局部映射实现可扩展的角度重建,扩展角范围的同时保持局部角精度。研究针对单孔径和多孔径两种掩模配置进行了评估,在有效FOV为9.1°的四个拼接FOV区域内,实现了约0.005°平均绝对误差的亚角分精度。研究还开发并公开了基于物理的合成DSS图像数据集及仿真框架。
研究重要意义。该研究首次将基于CNN的回归模型应用于DSS预测标定问题,首次提出了基于CNN的多路复用标定框架,其中局部光斑特征和相关规则是学习的表示而非先验编码模板。端到端训练方法仅需传感器图像、FOV区域类别和双轴太阳角度目标即可构建标定映射,减少手动模型制定。稀疏卷积层仅在非稀疏像素上操作,显著降低计算开销,消除分割需求,使深度学习模型在边缘设备上的部署成为可能,支持实时卫星操作。该成果发表在《Acta Astronautica》。
主要技术方法。本研究采用基于Ansys Zemax OpticStudio和MATLAB编程环境的高保真物理仿真框架生成合成数据集。仿真采用顺序光线追迹模式,使用Huygens点扩散函数计算衍射图样,考虑了太阳作为扩展光源的AM0光谱、Sony IMX477探测器的光谱响应(包括Bayer彩色滤波阵列)以及实测传感器噪声特性。数据增强包括添加泊松分布散粒噪声和高斯分布读出噪声,以及上阈值处理模拟像素饱和。数据集按8:1:1比例分为训练集、验证集和测试集。
网络架构基于ResNet-34骨干网络,采用稀疏子流形卷积层(SSCNN)处理DSS图像的稀疏性。输入为513×513单通道光照图像和FOV区域类别,输出为弧度制的双轴太阳角估计。网络包含四个残差块(层配置分别为3、4、6、3),使用稀疏子流形卷积保持输出稀疏性,下采样层使用规则稀疏卷积。通过one-hot编码的类别嵌入块将FOV区域信息与卷积输出拼接,实现从粗到细的全球局部化。网络使用Adamax优化器,采用带热重启和衰减的余弦退火学习率调度策略,以均方误差(MSE)为损失函数。
研究结果。
单孔径配置结果。绝对误差热图显示,在有效FOV 9.1°范围内,双轴误差总体较低,约为0.005°,但在FOV角落和FOV区域类别边界处存在较高误差的局部区域。角落误差源于单孔径在传感器边缘部分可见时的精度下降;类别边界误差源于穿越FOV区域时的类别不确定性,单孔径在边界处可能同时被感知为属于两个或多个类别。绝对误差直方图显示误差分布形状相似,误差范围在0.02°内,平均值约为0.005°;增强模型与非增强模型性能相近,非增强模型精度略优。预测值与实际值对比图显示测试数据与目标总体拟合良好,大多数误差位于FOV角落和原点处。
多孔径配置结果。多孔径配置的热图比单孔径更加平滑,误差同样约为0.005°,但局部高误差区域更少且更局限。多孔径配置基本解决了FOV角落的误差问题,类别边界误差也显著降低,但类别不确定性表现为沿相应角度估计零线的误差线。绝对误差直方图显示与单孔径类似的分布特征,平均值约为0.005°。预测值与实际值对比图显示误差多集中于原点而非角落。
鲁棒性评估结果。在固定噪声强度下,增强模型(噪声自适应)显著优于非增强模型:单孔径增强模型的平均误差为0.006°(分布范围0.03°),非增强模型为0.01°(分布范围0.06°);多孔径增强模型平均误差为0.006°,非增强模型为0.02°。单孔径增强模型表现出与多孔径增强模型相当的鲁棒性,削弱了多孔径配置的传统优势。在变化噪声强度下,增强模型在全强度范围内保持稳定的精度,甚至能泛化至训练噪声水平之外;非增强模型随噪声增加显著退化,对读出噪声尤为敏感。多孔径配置中,非增强模型在低噪声时表现优异,但对高散粒噪声敏感,读出噪声影响较小,这可归因于多孔径特征聚合的噪声平均效应。
讨论与结论。本研究提出的SSCNN预测标定框架将特征提取、相关映射和回归统一于单一推理模型中,消除了手动模型制定和分割操作。主要局限性包括:FOV扩展的实验验证局限于9.1°有效FOV,更广泛的FOV区域拼接和重建仅作讨论未经验证;难以与传统标定方法进行直接基准比较;数据集的FOV扩展性挑战;未专门 benchmark 实时操作效率;深度学习模型的不可解释性;以及Sim2Real差距——模拟图像数据与真实硬件测量之间的差异源于未建模的光学、机械和环境效应,训练好的网络仅用于方法原型设计和预训练,不足以用于在轨使用,需要通过域自适应来弥合这一差距。
研究结论指出,所提出的基于SSCNN的端到端预测标定框架通过数据驱动、物理引导的模型取代了传统标定流程,在单孔径和多孔径掩模配置下实现了亚角分精度。该框架的多路复用公式通过FOV区域拼接和重建支持可扩展的宽FOV扩展,其中局部光斑特征和相关规则为学习表示而非依赖先验编码模板。尽管结果展示了该方法在模拟条件下的潜力,但弥合Sim2Real差距仍是未来工作,域自适应是实现从模拟到硬件过渡的预期机制。