《AI》:Improving Object Detection Performance by Preprocessing Dehazing with a DCP-Based Lightweight U-Net
编辑推荐:
大气散射(atmospheric scattering)引起的雾降会 degrade 图像质量并显著降低计算机视觉系统的可靠性。现有去雾研究主要使用峰值信噪比(PSNR)和结构相似性指数(SSIM)等像素级指标评估去雾性能,但这些指标无法充分反映去雾对下游目标
大气散射(atmospheric scattering)引起的雾降会 degrade 图像质量并显著降低计算机视觉系统的可靠性。现有去雾研究主要使用峰值信噪比(PSNR)和结构相似性指数(SSIM)等像素级指标评估去雾性能,但这些指标无法充分反映去雾对下游目标检测性能的实际影响。因此,本研究将图像去雾视为雾天环境中目标检测的预处理步骤,并使用标准目标检测评估指标分析其效果。实验结果表明,在三种雾浓度条件下,即大气衰减系数(atmospheric attenuation coefficient)??=0.005、0.010和0.020,经基于DL-U-Net的去雾方法处理的图像均取得了比相应原始有雾图像更高的平均精度均值(mAP@0.5),相对提升分别为+0.39%、+6.60%和+13.37%。此外,在??=0.020的浓雾条件下,召回率(Recall)的提升比精确率(Precision)更为显著。这些结果表明,随着雾浓度增加,去雾预处理在恢复物体结构信息、减少漏检和增强下游目标检测性能方面变得更加有效。
**研究背景与问题**
近年来,人工智能(AI)的进步使基于深度学习(deep learning)的图像识别技术取得了显著成功,广泛应用于自动驾驶、智能监控和无人机(UAV)遥感等实际场景。然而,这些系统的性能根本上取决于输入图像的质量。复杂环境中由雾、霾或烟引起的大气散射会显著降低可见度和对比度,从而削弱检测的稳定性和准确性。大气中悬浮的细颗粒通过散射和吸收作用降质图像,导致对比度降低、颜色失真和细节丢失,这不仅降低了视觉质量,还损害了检测、跟踪和语义分割等高级视觉任务中深度学习模型的性能。
现有去雾技术主要聚焦于PSNR和SSIM等低层指标,尽管视觉清晰度有所提升,但检测等高层视觉任务的性能改善常被忽视。部分研究仍以主观清晰度作为关键指标,对于去雾预处理对精确率、召回率和假阴性(FN)等复杂场景指标影响的系统分析仍然不足。在雾天目标检测任务中,图像视觉质量的提升并不必然带来检测性能的改善——去雾预处理虽能增强图像对比度并恢复部分物体结构信息,但也可能引入局部伪影并影响检测器对物体特征的判断。因此,仅评估视觉特征恢复的指标不足以充分解释去雾预处理在下游目标检测任务中的实际作用。
**研究设计与核心结论**
针对上述问题,研究人员将图像去雾作为雾天环境中目标检测的预处理步骤,使用标准目标检测评估指标分析去雾前后检测性能的变化。实验基于Foggy Cityscapes数据集开展,该数据集通过对真实城市场景图像施加基于物理模型的合成雾效构建,雾浓度由大气衰减系数??控制。本研究采用??=0.005、0.010和0.020三种设置,分别对应轻雾、中雾和浓雾场景。
实验结果表明,去雾图像在所有三种雾浓度条件下的mAP@0.5均高于原始有雾图像,说明去雾预处理通过缓解雾致遮挡和对比度降质,改善了物体-背景清晰度并使物体更易于检测。对于mAP@0.75,在轻雾或中雾条件下未观察到一致的性能力提升,这表明去雾过程中产生的伪影可能影响了边界框定位;而在浓雾条件下,物体结构信息的恢复更加明显,mAP@0.75得以改善。在聚合IoU指标mAP@0.5:0.95方面,去雾图像在所有雾浓度条件下也表现出更优的检测性能。
**关键技术方法**
本研究采用双路径对比框架评估去雾预处理效果。路径A为基线直接路径,原始有雾图像直接输入YOLO26n目标检测器;路径B为提出的处理路径,相同有雾图像先经DL-U-Net去雾模块处理,再输入同一YOLO26n检测器。两条路径使用相同的输入流程、雾浓度设置、目标检测器和评估标准,通过比较检测性能差异来评估去雾预处理的效果。
DL-U-Net是一种基于U-Net的轻量级去雾模型,其编码器-解码器架构通过编码器提取多尺度退化特征,解码器逐步恢复图像细节,跳跃连接部分保留浅层纹理和边界信息。与DehazeFormer等更重型的模型相比,DL-U-Net结构简单、推理成本低,适合作为目标检测系统的预处理模块。研究还使用了AOD-Net和DehazeFormer作为对比去雾前端模型,以验证评估框架的通用性。
为排除检测器训练的干扰,YOLO26n始终使用MS COCO预训练权重,未在Foggy Cityscapes数据集上进行额外训练或微调。评估指标包括精确率、召回率、F1分数、mAP@0.5、mAP@0.75和mAP@0.5:0.95,通过IoU阈值匹配预测框与真实框后计算得出。
**研究结果**
**各雾浓度条件下的检测性能变化:** 研究首先验证了DL-U-Net去雾前端对固定下游检测器YOLO26n的实际增益。检测性能增益与雾浓度正相关,且增益幅度随雾浓度升高呈非线性增长。mAP@0.5的相对改善在??=0.005、0.010、0.020时分别为+0.39%、+6.60%和+13.37%,增速远高于??的算术增长。类似非线性趋势在mAP@0.5:0.95和召回率中也一致出现。这表明检测器对输入质量变化呈非线性响应:在已保留充分检测信号的区域,额外信号恢复的边际效益有限;而在信号退化至临界水平以下的区域,同等程度的恢复可能决定物体是否可被检测。
去雾对精确率和召回率的影响不对称。在??=0.020时,召回率提升(+9.96%)约为精确率提升(+2.72%)的3.7倍。这是因为去雾前端通过结构恢复将被雾致降质抑制在置信度阈值以下的候选检测提升至阈值以上,表明去雾主要贡献于恢复漏检而非抑制假阳性(FP)。精确率在??=0.010时达到峰值,随后在??=0.020时降至+2.72%,显示浓雾条件下残留伪影引入了部分假阳性,部分抵消了精确率的提升。
按IoU阈值考察,mAP@0.5在所有雾浓度条件下均持续改善;而反映更严格定位精度的mAP@0.75在??=0.005和??=0.010时几乎无改善或略有下降,仅在??=0.020时有+1.44%的小幅提升。这是因为去雾产生相互竞争的效果:虽恢复物体可见度和置信度响应从而改善分类相关性能,但可能通过引入细微伪影和像素平滑部分损害精确的边界框回归。雾浓度低时,回归干扰效应比分类改善更显著;浓雾条件下,轮廓恢复效应超过伪影的负面影响。mAP@0.5:0.95在10个IoU阈值上的平均值保持稳定改善,说明特定阈值的轻微下降未在聚合指标层面显现。
**各类别的检测结果:** 按类别评估显示,在??=0.005轻雾条件下,去雾前后总体变化较小,自行车、汽车、火车和卡车有小幅提升,行人、摩托车和公交车出现小幅下降。这表明轻雾条件下原始图像中物体轮廓、纹理和局部对比度信息仍保存较好,限制了DL-U-Net预处理的额外检测增益。在??=0.010条件下,除卡车外多数类别 mAP@0.5 提升,特别是汽车、火车、摩托车和自行车呈现正向变化,归因于DL-U-Net在中雾条件下部分恢复了检测所需的结构信息。在??=0.020浓雾条件下,该趋势更加明显,除公交车外所有类别 mAP@0.5 均提升,汽车类别增幅最大,表明车辆轮廓和局部对比度经DL-U-Net处理后部分恢复,增强了YOLO26n的检测响应。
相比之下,mAP@0.75呈现更保守趋势。在??=0.005和??=0.010条件下,部分类别 mAP@0.75 下降,表明去虽有助于判断物体存在或提升检测置信度,但不一定改善精确边界框定位。即使物体轮廓和对比度通过DL-U-Net处理得到增强,某些区域的平滑或细微纹理变化仍可能对边界框回归造成负担。仅在??=0.020条件下,行人、自行车、汽车、火车和卡车的 mAP@0.75 提升,其中汽车和卡车在 mAP@0.5 和 mAP@0.75 上均呈正向变化,证实浓雾条件下DL-U-Net的轮廓恢复效应不仅能提升物体可检测性,还能增强特定类别的定位稳定性。
**框架级对比实验:** 为验证评估框架对不同去雾前端的通用性,研究以相同配置测试了AOD-Net和DehazeFormer。结果显示,相同雾条件下检测性能因去雾前端类型而显著不同。在??=0.005时,DehazeFormer实现mAP@0.5 +1.25%的提升,DL-U-Net为+0.39%,AOD-Net则出现-1.18%的性能下降。随雾浓度增加,性能差距收窄:在??=0.020时,三者的mAP@0.5提升分别为+14.29%、+13.37%和+9.88%。这是因为浓雾条件下大量结构信息丢失,一定水平以上的信号恢复无论采用何种方法均对检测有所贡献;而轻雾条件下原始图像已保存充分检测相关信息,恢复方法的副作用在检测结果中相对更加明显。
DL-U-Net与DehazeFormer的mAP@0.5差距在??=0.005时为0.86%,??=0.010时为0.48%,??=0.020时仅0.92%,表明随雾浓度增加差距迅速收窄。浓雾条件下两者检测性能几乎相同(mAP@0.5分别为21.35%和22.27%),说明尽管DehazeFormer因更深更重的架构在视觉恢复质量上占优,但轻量化的DL-U-Net在恢复检测有用结构信息方面也能提供足够效果。AOD-Net结果一致性较低,在??=0.005时精确率略高于参考值但召回率大幅下降至40.69%,??=0.020时mAP@0.5虽提升9.88%但精确率仍低于参考值,表明其去雾输出引入的色彩偏差和局部失真部分损害了检测器需利用的细节信息。
**检测结果可视化对比:** 代表性样本的可视化分析直观验证了去雾预处理的效果。原始有雾图像中,检测器频繁出现漏检、低置信度分数和边界框位置偏差,对远处小物体或复杂背景中的交通物体尤为明显,且随雾浓度增加而加剧。??=0.005时去雾前后检测差异几乎无法区分,??=0.020时去雾后物体轮廓明显更清晰,此前遗漏的物体被重新检测,与检测性能改善随雾浓度非线性放大的结论一致。三种模型的视觉恢复特性并未导致检测结果的一致差异:AOD-Net处理图像虽在某些场景增强对比度,但也存在亮度偏差和局部纹理失真,导致边界框位置不稳定或目标遗漏;DL-U-Net在浓雾条件下稳定恢复车辆和行人等主要交通物体的轮廓和局部结构,使检测框更清晰、响应更稳定;DehazeFormer整体清晰度最高,但浓雾条件下与DL-U-Net的检测结果差异边际化,定量上两者mAP@0.5差距仅0.92%。
**计算成本与统计显著性:** 纯推理时间比较显示,AOD-Net平均推理时间5.74 ms(174.28 FPS)最快,DL-U-Net为11.90 ms(84.07 FPS),DehazeFormer为46.30 ms(21.60 FPS)。DL-U-Net虽慢于AOD-Net,但单幅图像推理时间约12 ms,仍足以满足实时处理需求,且比DehazeFormer快约3.89倍,在检测性能提升与计算成本间取得相对平衡。
统计显著性分析表明,去雾预处理在所有三种雾浓度条件下均提升了召回率和F1分数,对应95%置信区间均不包含0。??=0.005时召回率和F1分数提升相对较小(+0.73%和+0.51%);随雾浓度增加提升幅度增大,??=0.010时分别为+4.36%和+3.32%,??=0.020时为+9.96%和+7.90%。
**讨论与结论**
本研究通过分析DL-U-Net去雾预处理对下游目标检测的影响,解决了雾天环境中目标检测性能退化的问题。实验结果表明,去雾对检测性能的贡献不限于单一指标,主要改善体现在召回率上,说明去雾减少了雾致遮挡和对比度降质引起的漏检。浓雾条件下召回率改善比精确率更显著,表明去雾预处理在帮助检测器识别先前难以检测的物体方面作用更大,而非仅减少假阳性。虽然mAP@0.5在所有雾浓度条件下均有提升,但mAP@0.75仅在浓雾条件下有清楚改善,表明去雾虽能持续改进物体可检测性,但其对精确边界框定位的贡献取决于雾浓度和恢复过程中产生的伪影。
研究仍存在局限性:当前采用的去雾模型与检测器分离的串行架构,阻碍了两者的端到端联合优化,导致去雾模块恢复的视觉信息可能与检测器分类和定位所需的特征需求不完全对齐。未来研究将致力于开发通过检测损失直接约束去雾过程的端到端网络,以实现更适合目标识别和边界框回归的图像表示学习,并探索面向FPGA和NPU等硬件平台的轻量化模型设计与部署优化。