遥感(RS)技术对于地球观测任务变得越来越重要,包括气候预测、城市规划、灾害监测和军事监视(Gao, Li, Wen, Chen, Niu, Liu, 2024a; Gao, Niu, Zhang, Chen, Mei, Jubair, 2023; Ge, Qin, Zhang, Huang, 2025; Wen, Gao, Chen, 2024a)。然而,由于航空和卫星观测涉及的长距离成像和复杂的大气条件,捕获的图像经常受到雾蚀和大气散射的影响而退化。悬浮颗粒如气溶胶和水滴会沿成像路径散射入射光,导致对比度降低、颜色失真和结构细节显著丢失。这种退化不仅降低了视觉质量,还严重影响了后续遥感应用的可靠性。因此,开发专门针对遥感图像的有效去雾技术已成为一个重要的研究问题。
现有的去雾策略大致可以分为两类:传统的基于先验的方法和数据驱动的学习基方法。传统的图像去雾方法主要基于大气散射模型(Narasimhan & Nayar, 2003),该模型将观测到的雾景图像描述为真实场景辐射经过传输介质衰减后的结果加上全球大气光的叠加效应。基于这一模型,提出了许多基于先验的方法,如暗通道先验(DCP)(He, Sun, & Tang, 2010)、颜色衰减先验(Zhu, Mai, & Shao, 2015)和雾线先验(Berman, Treibitz, & Avidan, 2018)。这些方法依赖于手工制作的先验和对场景统计的假设,具有很强的物理可解释性。然而,当处理现实世界遥感图像中的复杂雾分布时,它们的性能往往不尽如人意,因为先验假设经常被违反,导致传输估计错误和明显的视觉伪影。
最近,随着深度学习的快速发展,基于学习的去雾方法通过利用大规模标注的数据集直接学习从雾景图像到清晰图像的映射,取得了显著的成功(Gao, Zhang, Chen, Wen, 2025; Liang, Yang, Jing, 2025a; Liang, Gao, Chen, Zhang, Wang, Li, 2025b; Song, He, Qian, Du, 2023)。最近的研究进一步探索了结合多样化的先验和特征表示来提高去雾的鲁棒性和泛化能力。为了更好地捕捉雾的频率特性,一些方法尝试将频域先验整合到去雾流程中。
例如,FrDiff(Liu, Qi, Pan, Qian, & Yang, 2025a)利用傅里叶先验来对齐雾景和清晰域之间的特征分布,通过强制全局频率约束来提高泛化能力。类似地,FrTrGAN(Dwivedi & Chakraborty, 2025)在GAN框架内利用传输图的频率成分来精细化结构感知的去雾。此外,DCE-Net(Liu, Pang, & Wang, 2025b)通过捕捉特定领域的频率先验的频率感知模块来增强图像细节和语义内容。另外,WDMamba(Sun, Liu, Wang, Zhang, & Wei, 2026)发现雾相关信息主要存在于小波域的低频成分中,并采用粗到细的恢复框架逐步恢复图像细节。这些研究表明,频域和小波基先验可以有效指导去雾过程并显著提高恢复质量。然而,尽管这些方法表现出了良好的性能,但许多现有模型仍然依赖于复杂的深度架构,这些架构表现为黑箱,缺乏足够的可解释性。此外,当处理具有复杂空间结构和大规模雾分布的遥感图像时,它们的泛化能力仍然有限。
在这项工作中,我们提出了一种基于小波引导和物理感知的去雾网络(WPD-Net)。如图1所示,它在去雾性能和计算效率之间实现了理想的平衡,使其在遥感图像去雾任务中具有明显优势。WPD-Net专门设计用于将频域先验和物理可解释的约束整合到一个统一的深度学习框架中,用于遥感图像去雾。它引入了两个核心创新:一个基于小波引导的交叉自注意力变换器(WCSAformer)骨干,用于增强空间-频率表示学习;以及一个基于物理感知的残差去雾模块(PRDM),将大气散射模型嵌入到残差学习结构中。这两个组件共同实现了准确的雾去除和在多种成像条件下的强泛化能力。
为了有效利用频域信息,WCSAformer采用了一种新的空间-频率联合表示策略,由三个紧密集成的模块组成。首先,我们开发了小波空间增强模块(WSEB),它执行离散Haar小波变换,将输入特征分为高频和低频子带。这种设计使网络能够自适应地调节不同的频率成分,在高频子带中增强边缘和细节信息,同时在低频子带中抑制广泛的雾蚀。尽管之前的工作已经整合了频率感知机制,但大多数方法在整个频谱上采用均匀处理,没有选择性强调。相比之下,WSEB允许模型专注于与雾相关的成分,提高了恢复图像的感知质量和结构保真度。同时,我们提出了基于小波引导的交叉自注意力模块(WCSAB),将增强的频率特征整合到全局建模过程中。与仅作用于空间特征的传统自注意力机制不同,WCSAB引入了空间表示和小波增强特征之间的交叉注意力路径,其中注意力计算由频域先验引导。这有助于在特征学习过程中同时考虑空间和频率线索。随后,为了平衡结构保留和感知一致性,我们引入了空间重加权模块(SRM),通过学习到的动态注意力图自适应地融合空间特征和小波增强表示。SRM确保融合的特征有效地整合了高频细节和低频雾成分,形成了WCSAformer架构,实现了高效且可解释的空间-频率特征学习,用于遥感图像去雾。
此外,为了进一步提高模型的泛化能力和物理可解释性,我们引入了基于物理感知的残差去雾模块(PRDM),它将经典的大气散射模型嵌入到一个可学习的残差校正框架中。PRDM不是直接估计清晰图像,而是基于通过轻量级卷积层得到的近似传输和大气光图来预测残差雾成分。然后将这个残差与输入结合,重建去雾后的输出,确保物理一致性,同时保持数据驱动学习的灵活性。通过以残差形式明确建模雾蚀过程,PRDM提供了一种物理约束的细化路径,提高了鲁棒性和结构保真度,特别是在具有复杂雾分布的遥感图像中。
最终,我们在包括合成和真实世界遥感图像在内的九个基准数据集上评估了WPD-Net,这些图像具有不同的雾级别。广泛的实验表明,我们的方法取得了最先进的结果。
总结来说,我们的主要贡献如下:
我们提出了一种基于小波引导和物理感知的去雾网络,将频率先验和物理约束整合到一个统一的框架中。我们设计了一种基于小波引导的交叉自注意力变换器,通过小波分解、交叉注意力和自适应特征融合来增强空间-频率表示。我们引入了一种基于物理感知的残差去雾模块,将大气模型重新构建成一个可学习的残差校正路径。在合成和真实世界基准数据集上的广泛实验证明了我们方法的有效性和泛化能力。