DLUIE:一种双分支轻量级水下图像增强算法,可实现纹理与颜色的解耦

《Optics & Laser Technology》:DLUIE: Dual-branch lightweight underwater image enhancement with texture-color decoupling

【字体: 时间:2026年04月28日 来源:Optics & Laser Technology 4.6

编辑推荐:

  周立群|李龙环|何瑞香|梁继深|杨涛 重庆邮电大学通信与信息工程学院,重庆,400065,中国 **摘要** 水下图像增强旨在解决由光吸收和散射引起的色彩偏移和细节退化问题。然而,在效率和效果之间取得平衡仍然具有挑战性。高性能模型通常依赖于复杂的架构和大量的参数,而

  周立群|李龙环|何瑞香|梁继深|杨涛 重庆邮电大学通信与信息工程学院,重庆,400065,中国 **摘要** 水下图像增强旨在解决由光吸收和散射引起的色彩偏移和细节退化问题。然而,在效率和效果之间取得平衡仍然具有挑战性。高性能模型通常依赖于复杂的架构和大量的参数,而轻量级方法在复杂的水下退化条件下往往缺乏鲁棒性。为了解决这个问题,我们对退化图像和参考图像之间的差异进行了统计分析,发现纹理结构相对稳定,而颜色分布则表现出显著的变异性。受到这种明显差异的启发,我们提出了一个双分支轻量级水下图像增强(DLUIE)框架,该框架将纹理保持和颜色校正分离。首先,我们设计了一个受统计约束的可学习Gabor滤波器来构建一个稳定的特征提取分支,该分支能够增强对水下退化不敏感的纹理细节。其次,我们开发了一个基于提示的颜色校正分支,通过抑制、对齐和增强步骤逐步纠正复杂的色彩偏移。最后,我们引入了一个残差双门融合模块,根据特征一致性自适应地调节两个分支之间的信息交互。广泛的定性和定量实验表明,DLUIE在模型大小、增强性能和计算效率之间实现了出色的平衡。它在多种水下场景中始终能够生成视觉上令人满意的结果。 **引言** 光学图像是感知水下世界的重要媒介。然而,水下成像受到悬浮颗粒引起的波长依赖性光吸收和散射的 fundamental 制约。这些物理因素共同导致了复杂的非线性退化,表现为严重的色彩偏移、低对比度和模糊的细节 [1],[2]。这种失真不仅降低了视觉保真度,还阻碍了包括环境监测、资源探索、海洋考古学以及自主水下航行在内的关键下游任务 [3],[4]。因此,开发出能够恢复清晰视觉感知的鲁棒图像增强技术对于在多样化的水下环境中实现可靠的操作至关重要。 早期的水下图像增强(UIE)研究主要集中在无学习方法上。这些方法依赖于物理成像定律和传统的数字图像处理技术,并通过将先验或约束引入退化模型来反转过程并恢复清晰图像 [5],[6]。这些方法具有可解释性的优势,且不需要训练。然而,它们手工制定的规则缺乏在多样化和复杂的水下场景中泛化的灵活性。 随着深度学习的进步和水下数据集的扩展,研究人员转向了端到端模型。这些模型直接从退化输入学习到清晰图像的映射。卷积神经网络(CNNs)通过局部卷积和多尺度特征聚合有效地模拟了水下退化。然而,CNNs 的有限感受野难以捕捉长距离依赖性 [7],[8]。为了解决这一限制,视觉变换器(ViTs)利用自注意力机制,显著增强了全局结构和跨区域相关性的建模,从而在复杂场景中提高了鲁棒性。然而,变换器的高计算成本和大量参数通常会降低实际部署中的效率 [9],[10]。在缺乏配对训练数据的场景中,生成对抗网络(GANs)利用跨域映射来缓解数据稀缺问题。然而,它们固有的训练不稳定性可能导致图像生成质量的波动 [11],[12]。最近,扩散模型在通过迭代去噪进行细节恢复方面表现出了优越的性能。然而,对大量反向采样步骤的需求导致了高推理延迟 [13],[14]。 尽管取得了这些进展,现有方法在复杂的水下退化条件下仍然面临一个共同的挑战:在保持表示能力和计算成本之间的平衡。这种退化通常涉及色彩失真、对比度减弱和细节丢失,这要求模型在恢复局部结构的同时保持全局色彩一致性。然而,实现这一能力通常需要更复杂的建模或增加模型容量,这不可避免地会导致更高的计算开销。因此,在实际场景中同时实现高性能和效率仍然具有挑战性。 为了缓解这一问题,现有研究尝试通过特征压缩、重用和分割策略来构建轻量级模型 [15],[16]。尽管这些方法显著减少了参数数量和计算负担,但它们不可避免地导致表示能力的下降。在处理水下特殊场景时,这种表示能力的不足尤为明显。由于缺乏足够的退化解耦和鲁棒的特征建模,轻量级模型难以提取关键的增强线索,从而导致性能显著下降。因此,开发同时实现效率和鲁棒性的水下图像增强模型仍然是一个关键挑战。 为了解决上述问题,我们首先对 UIEB [17]、EUVP [18] 和 LSUI [19] 水下数据集的场景分布进行了基于聚类的统计分析。为了确保统计分析的有效性,我们量化了三个主要的退化特征:(1)色彩偏移的程度,通过 RGB 通道均值的标准差来衡量;(2)色彩偏移的类型,通过最大通道间均值差异的方向来表征;(3)模糊的程度,使用拉普拉斯方差与Sobel梯度的平均幅度相结合来量化。基于这些指标,我们对三个数据集进行了聚类,聚类数量在2到10的范围内自适应选择。聚类结果进一步使用 t-SNE 投影到二维空间中进行可视化。如图1所示,结果表明这些数据集表现出多样的退化模式,涵盖了广泛的色彩偏移程度、色彩偏移类型和模糊程度,从而为后续的统计分析提供了丰富且具有代表性的样本集。 基于上述统计结果,我们从两个互补的角度分析了退化图像和参考图像之间的特征差异:纹理和颜色 [20]。图2展示了三个数据集在不同阈值下的颜色变化统计结果。可以观察到,对于严重衰减的R通道,颜色IoU保持在0.5左右。即使对于衰减较小的蓝色和绿色通道,颜色一致性也不超过0.7。此外,我们汇总了不同阈值下的颜色相似性,并将其与纹理相似性一起绘制在图3中。不同颜色的曲线代表不同数据集的结果。水平轴上的R、G、B和RGB表示单个通道及其组合的直方图IoU和平均IoU。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号