《Computational Visual Media》:PE Loss: Perception-Enhanced Distortion-Oriented Loss for Image Restoration
编辑推荐:
图像复原旨在从退化图像中恢复高质量图像,涵盖超分辨率、去噪、去模糊等逆问题。现有方法以最小化网络输出与真实值之间的损失函数误差为目标,其中失真导向损失是基础且常用的类型,但这类损失将所有像素视为同等重要,无法区分锐利与模糊边缘区域,与人类视觉感知特性不匹配,易
图像复原旨在从退化图像中恢复高质量图像,涵盖超分辨率、去噪、去模糊等逆问题。现有方法以最小化网络输出与真实值之间的损失函数误差为目标,其中失真导向损失是基础且常用的类型,但这类损失将所有像素视为同等重要,无法区分锐利与模糊边缘区域,与人类视觉感知特性不匹配,易导致恢复结果虽数值准确却存在边缘模糊的问题。为解决该问题并获得兼具准确性与感知满意度的结果,研究人员受Mach带效应启发,提出了一种用于图像复原的新型感知增强失真导向损失(Perception-Enhanced Distortion-Oriented Loss,PE Loss)。该效应表明人类视觉系统会感知锐利边缘比模糊边缘质量更高。该方法设计了模糊因子图以检测模糊像素,并通过放大其误差对其进行惩罚。PE Loss是一种简单有效的即插即用方法,研究人员将其应用于多个先进网络中。大量定量与定性实验结果表明,该方法可恢复出边缘锐利、感知质量高的图像。
《Computational Visual Media》刊载的该研究针对图像复原任务中传统失真导向损失的感知局限性展开探索。图像复原作为从退化观测中重建高质量图像的经典逆问题,近年在神经网络驱动下取得显著进展,但损失函数设计仍是制约恢复质量的核心瓶颈。传统失真导向损失如L1、L2损失仅基于像素级数值差异优化,未考虑人类视觉系统(Human Visual System,HVS)对边缘结构的敏感性——Mach带效应已证实视网膜存在固有边缘增强机制,锐利边缘会被感知为更优质量,而传统损失对所有像素平等加权,导致模型倾向于生成数值指标高但边缘模糊的结果;感知导向损失如感知损失、对抗损失虽能提升纹理真实性,却易引入非自然伪影,且常与失真损失结合使用以平衡指标与观感。在此背景下,研究人员提出感知增强失真导向损失(PE Loss),通过差异化加权模糊像素误差,实现失真优化与感知特性的对齐,为图像复原提供更符合人眼视觉的评价准则。
研究人员开展研究采用的核心关键技术方法包括:一是基于Mach带效应的模糊像素检测机制,通过分析高分辨率图像二阶梯度图与重建图像-高分辨率图像像素差的符号一致性,构建模糊因子图以定位模糊区域;二是动态权重分配策略,以基础权重1为基准,对模糊因子图标注的模糊像素叠加与二阶梯度幅值正相关的惩罚系数α,形成自适应权重矩阵;三是多任务验证框架,选取超分辨率、去噪、去blur三类任务的12种主流骨干网络(如EDSR、NLSN、Restormer等),在DIV2K、GoPro等公开数据集上开展对照实验,采用PSNR、结构相似性(Structural Similarity,SSIM)、学习感知图像块相似度(Learned Perceptual Image Patch Similarity,LPIPS)、自然图像质量评估器(Natural Image Quality Evaluator,NIQE)四类指标综合评价,并通过23人用户研究验证主观感知增益。
研究结果部分的主要内容如下:
3.1 方法与实验设置
研究人员首先通过参数敏感性实验确定惩罚因子α的最优取值为2.0,以保证跨任务公平性。实验覆盖三类图像复原任务:超分辨率任务采用Set5、Set14、B100、Urban100测试集;去噪任务采用σ=25、50、75的高斯噪声合成数据及DIV2K、KODAK24、CBSD68测试集;去模糊任务采用GoPro、HIDE、RealBlur测试集。所有网络均沿用原始训练配置,仅在损失函数层面替换为PE Loss或与原感知损失联合使用。
3.2 PE Loss与图像超分辨率
定量结果显示,在EDSR、RRDBNet等失真导向方法中,PE Loss使LPIPS平均降低0.012、NIQE平均降低0.18,SSIM平均提升0.003,证明其在保持像素精度的同时显著改善感知质量;在SRGAN、ESRGAN等感知导向方法中,PE Loss使PSNR平均提升0.21dB、SSIM平均提升0.005,同时LPIPS与NIQE进一步优化,解决了感知损失易导致的结构扭曲问题。定性对比可见,PE Loss恢复的建筑纹理、文字边缘更锐利,无过度平滑现象。
3.3 PE Loss与图像去噪
在FFDNet、NBNet等去噪网络中,PE Loss使LPIPS平均降低0.008、NIQE平均降低0.15,SSIM与原始L1损失相当,仅在PSNR上平均低0.12dB(因L1直接优化PSNR)。视觉对比显示,PE Loss能更好保留织物纹理、建筑轮廓等细节,避免去噪过程中的边缘模糊。
3.4 PE Loss与图像去模糊
在MPRNet、Restormer等去模糊网络中,PE Loss使LPIPS平均降低0.009、NIQE平均降低0.12,运动模糊区域的车牌字符、建筑线条清晰度显著提升。用户研究显示,PE Loss在所有任务中获得的偏好投票均高于原始方法,尤其在超分辨率与去模糊任务中优势更明显。
3.5 讨论与结论
研究人员指出,PE Loss的核心创新在于将HVS的边缘感知特性转化为可微的损失权重机制,无需修改网络结构即可即插即用。实验证实其对不同架构、不同任务的通用性,既弥补了失真损失忽视感知的缺陷,又缓解了感知损失的结构失真问题。该损失函数为图像复原领域提供了兼顾数值精度与主观质量的优化范式,未来可进一步探索其与自监督学习的结合路径。研究结论明确,PE Loss通过模糊像素的定向惩罚,有效提升了重建图像的边缘锐度与感知真实性,为图像复原的损失函数设计提供了新的生物学启发视角。