基于RRMSE的焦点度量算子鲁棒性研究 苗伟英(Weiying Piao), 王春雪(Chunxue Wang), 韩永奇(Yongqi Han)

《Sensors》:Research on the Robustness of Focus Measure Operators Based on RRMSE Weiying Piao, Chunxue Wang and Yongqi Han

【字体: 时间:2026年04月30日 来源:Sensors 3.5

编辑推荐:

  摘要 本文在加性白高斯噪声模型下建立了相对均方根误差(RRMSE)与噪声参数之间的定量关系模型。根据运算结构的不同,焦点测量算子被分为两类:平方型和绝对值型。理论推导表明,平方型算子的RRMSE与噪声方差σ2成正比;而对于绝对值型算子,在噪声方差较大时,其

  摘要 本文在加性白高斯噪声模型下建立了相对均方根误差(RRMSE)与噪声参数之间的定量关系模型。根据运算结构的不同,焦点测量算子被分为两类:平方型和绝对值型。理论推导表明,平方型算子的RRMSE与噪声方差σ2成正比;而对于绝对值型算子,在噪声方差较大时,其RRMSE大致与噪声标准差σ成正比。在此基础上,提出了一种新的定量指标——噪声响应斜率,用于表征算子对噪声扰动的鲁棒性。对于平方型算子,可以准确得出噪声响应斜率的值;而对于绝对值型算子,只能近似得出其值。实验选择了五种平方型算子和五种绝对值型算子,并通过线性回归拟合得到实验斜率。实验结果表明,对于平方型算子,决定系数超过0.999;除了正弦图像序列外,理论斜率与实验斜率之间的相对误差小于2%,而对于正弦图像序列,误差小于10%,这是因为正弦图像中有大量像素的灰度值接近0或255。对于绝对值型算子,决定系数超过0.98;理论斜率与实验斜率之间存在显著差异,但它们的Spearman相关系数为1,双尾检验显著性水平为0.05。所提出的模型无需对图像序列添加噪声即可估计算子的鲁棒性,为焦点测量算子的鲁棒性评估和设计提供了一种有效的分析方法。

1. 引言
焦点测量算子是量化图像清晰度的重要工具,其性能直接影响自动对焦系统、显微成像和基于焦点的形状识别[1,2,3,4,5]的准确性和稳定性。在实际成像中,图像不可避免地会受到噪声的干扰,因此焦点测量算子在噪声条件下的稳定性已成为限制系统性能的关键因素。因此,如何客观定量地评估焦点测量算子的噪声鲁棒性一直是相关研究中的关键问题。为了比较不同焦点测量算子的性能,文献中提出了定性和定量评估指标,性能评估通常从两个方面进行:焦点曲线的形状及其数值特征[6,7,8,9]。定性指标常用于描述焦点曲线的宏观属性,如单峰性、对称性、陡峭度和无偏性。尽管这些指标可以直观反映曲线的理想形状,但它们缺乏严格的数值标准,使得算子之间的客观比较变得困难。为了建立可量化的比较框架,早期研究如Firestone等人引入了准确性、单调范围和错误最大值数量等基本指标,但这些指标仍不足以完全描述算子的行为[10]。为了进一步提高可比性,Pertuz等人提出了一系列指标,如灵敏度、峰值对比度和噪声鲁棒性,这些指标从多个维度评估算子的响应强度和抗干扰能力;然而,在强噪声或复杂真实世界场景中,它们的稳定性仍然有限[11]。随后,Zhai等人引入了陡峭区域宽度和局部极值因子来数学上表征曲线结构的完整性和错误峰值的抑制能力,为算子选择提供了更精细的评估手段[12]。Yu和Lu提出了一种基于高斯拟合的性能分析方法,该方法将不同焦平面的焦点测量值拟合到高斯曲线上,并使用峰值宽度和峰值变化率等参数来量化算子的峰值搜索能力和稳定性,适用于没有参考图像时的性能评估[13]。为了加强噪声条件下的性能评估,Piao等人进一步提出了陡峭区域宽度(Ws)、陡峭度与平缓度比(Rsg)、峰值曲率(Cp)和相对均方根误差(RRMSE),形成了一个更全面的定量评估系统[14]。其中,RRMSE通过比较添加噪声前后的焦点值,直接反映了算子对噪声扰动的敏感性,为鲁棒性量化提供了一种新方法。然而,现有的鲁棒性评估方法,包括当前的RRMSE研究,主要基于实验现象,还有几个问题需要进一步探讨。首先,RRMSE的计算通常依赖于人为设定的噪声强度,而实际成像系统中的噪声水平往往是未知的,并且会随环境变化,这使得RRMSE值难以直接用于不同场景下的鲁棒性比较。其次,不同的焦点评估算子在噪声作用下的表现存在显著差异,但目前缺乏RRMSE与噪声统计参数之间关系的系统理论分析,这在一定程度上限制了RRMSE作为鲁棒性指标的可解释性和指导意义。为了解决上述问题,本文从噪声统计特性的角度研究了焦点测量算子在加性白高斯噪声(AWGN)下的响应行为,重点分析了RRMSE与噪声参数之间的定量关系。由于算子的噪声响应特性取决于其运算结构,因此首先根据运算结构对算子进行分类。然后建立了RRMSE与噪声统计参数之间的关系模型。基于该模型,探索并设计了一种新的算子鲁棒性指标。选择常用的典型焦点测量算子进行实验,以验证所提模型的准确性和鲁棒性指标的可靠性。本文旨在为焦点测量算子的鲁棒性分析和比较提供更清晰的理论基础。

2. 方法论
2.1. 噪声对图像焦点的影晌
焦点评估算子的核心任务是通过特定的数学运算来量化图像的局部或全局清晰度。然而,在实际成像过程中,图像信号不可避免地会受到噪声的影响,导致焦点评估结果的偏差。为了分析噪声对焦点评估算子的影响,本文采用向图像序列添加噪声的方法,然后通过分析噪声图像与原始图像的焦点评估值之间的差异来评估焦点算子的鲁棒性。AWGN是图像处理领域中的一种典型噪声类型,它具有零均值、可控方差和独立同分布等特性,能够有效模拟真实环境中的传感器热噪声。因此,本文使用AWGN模型向图像添加噪声。加性噪声模型表示如下:
(1)
其中Ix,y表示原始图像信号,εx,y~N(0,σ2)表示均值为0、方差为σ2的白高斯噪声,zx,y表示噪声图像信号。

2.2. RRMSE与噪声参数之间的关系
不同评估算子的焦点值差异很大。为了量化噪声的影响,需要设计一个能够反映噪声干扰程度的误差指标。相对均方根误差(RRMSE)满足了这一要求。通过归一化均方根误差(RMSE),使误差指标不受焦点值绝对规模的影响,消除了不同算子之间数值规模的影响,从而实现了算子之间的可比性。在焦点评估中,RRMSE通过比较噪声焦点值Fn(k)与原始焦点值F(k)之间的偏差来计算,使用原始焦点值的平均值μ作为归一化基准。计算公式如下:
(2)
其中k表示图像编号,K表示图像总数。RRMSE值反映了噪声对焦点评估算子的相对干扰程度。较小的RRMSE表明噪声引起的焦点值变化相对较小,算子对噪声不敏感,具有很强的抗噪声鲁棒性;较大的RRMSE表明由于噪声导致焦点值发生显著变化,稳定性较弱。然而,直接使用RRMSE值作为鲁棒性指标存在局限性:它高度依赖于当前的噪声强度(σ2或σ)。由于实际环境中的噪声方差通常是未知且动态变化的,因此难以将其作为固有鲁棒性的客观标准。为了解决这个问题,本文通过研究RRMSE随噪声参数变化的规律,提取了一个与噪声强度无关的特征量作为新的鲁棒性评估指标。根据算子的计算结构,本文将它们分为平方型和绝对值型。从信号处理的角度来看,这两种类型的噪声响应机制有根本的不同:
平方型:平方运算会放大噪声能量;噪声能量线性地加到结果中。因此推断RRMSE与噪声方差σ2有关。
绝对值型:绝对值运算在低噪声和高噪声区域表现出不同的行为。在高噪声区域,输出主要由噪声幅度决定。因此推断RRMSE与噪声标准差σ有关。基于这一理论假设,本文提出使用RRMSE与相应噪声参数的比值来量化算子的鲁棒性。由于这个比值仅由算子的结构参数和图像内容特征决定,且与具体的噪声强度水平无关,因此它有可能作为一个客观的评估指标。这意味着,通过根据图像序列的内容特征计算理论比值,我们可以在不预先知道噪声方差或进行额外噪声添加实验的情况下,直接预测和估计焦点算子的鲁棒性。

2.3. 平方型算子的推导
根据计算结构,平方型算子进一步分为邻域差分平方型和卷积平方型。
2.3.1. 邻域差分平方型算子
如果算子使用中心像素与其相邻像素之间的差值的平方来测量焦点,则图像的焦点测量值可以简化为:
(3)
其中Ω表示点(x,y)的邻域,M,N分别是图像的高度和宽度。由于图像尺寸通常较大,求和可以通过期望值进行统计近似:
(4)
添加白高斯噪声后,值Fn变为:
(5)
因为噪声在空间上是独立的且均值为零,两个噪声项(εx,y?εi,j)之间的差异仍然遵循均值为零的高斯分布,方差为2σ2。在期望值中,信号和噪声之间的交叉项为零,因此噪声对焦点测量的影响主要来自噪声差异的平方项:
(6)
将此代入RRMSE的定义中得到:
(7)
因此,对于邻域差分平方型算子,RRMSE大致与噪声方差σ2成正比。σ2前的系数定量反映了RRMSE随噪声方差的增长率;我们将其称为噪声响应斜率。其值主要取决于n/μ的比值。需要注意的是,噪声响应斜率不是一个固定常数:随着参与邻域点数n的增加,焦点测量的期望值μ也会相应增加。因此,噪声响应斜率是由算子结构参数n和图像特征μ共同决定的固有属性。

2.3.2. 卷积平方型算子
如果算子将图像与掩模进行卷积,然后对卷积结果进行平方来测量焦点,则焦点测量值F可以简化为:
(8)
其中H表示掩模,?表示卷积。在AWGN下,由于卷积是线性运算,卷积后的噪声仍然遵循均值为零的高斯分布,方差由噪声方差和掩模系数决定。然后,噪声下的焦点度量Fn为:(9) 由于(H?ε)x,y的均值为零,平方展开中的交叉项的期望值为零,因此误差主要由噪声卷积项的平方决定:(10) 将此代入RRMSE的定义中,得到:(11) 因此,对于卷积平方型算子,RRMSE也与噪声方差σ2成正比;只有噪声响应斜率的表达式与邻域差分平方型算子不同。决定噪声响应斜率的关键因素不仅包括图像均值μ,还包括卷积核系数的平方和(即滤波器的能量)。这意味着在设计算子时,通过合理优化掩模系数的能量分布,可以理论上预测噪声鲁棒性。根据上述推导,邻域差分型和卷积平方型算子的RRMSE都与σ2成正比;因此,它们可以被统一归类为平方型算子。

2.4. 绝对值型算子推导
基于计算结构,绝对值型算子进一步分为邻域差分绝对值型和卷积绝对值型。

2.4.1. 邻域差分绝对值型算子
如果算子使用中心像素与其相邻像素之间的差的绝对值来测量焦点,那么焦点度量F可以简化为:(12) Fn表示加入噪声后的焦点度量:(13) 任何图像都可以划分为灰度平坦区域、灰度变化区域和灰度过渡区域。如果某个区域的灰度方差远小于噪声方差,则该区域属于灰度平坦区域;如果灰度方差远大于噪声方差,则该区域属于灰度变化明显的区域;如果灰度方差接近噪声方差,则该区域属于灰度过渡区域。本文主要讨论灰度平坦区域和灰度变化区域对焦点度量算子输出的影响。对于灰度过渡区域,本文不讨论其产生的误差,这将在后面的实验中解释。
设F′为原始图像中平坦区域的焦点度量,F′n为加入噪声后平坦区域的焦点度量,P为平坦区域中的像素数量。当噪声方差较大时,可以假设Ix,y?Ii,j << εx,y?εi,j;因此,(14) (15) 注意,sgn(Ix,y?Ii,j) ≥ 0和sgn(Ix,y?Ii,j) < 0的概率大致相等,所以有(16) 对于灰度变化显著的区域,可以假设Ix,y?Ii,j >> εx,y?εi,j。设F″为原始图像中这些区域的焦点度量,F″n为加入噪声后的焦点度量,Q为这些区域中的像素数量。那么,(17) (18) 考虑到sgn(εx,y?εi,j) ≥ 0和sgn(εx,y?εi,j) < 0的概率大致相等;因此,对于图像灰度变化显著的区域,可以认为F″n ≈ 0。对于任何图像,如果不考虑灰度过渡区域,可以得到上述两种情况:(19) (20) 从方程(20)可以看出,在灰度平坦区域面积恒定的条件下,邻域差分绝对值型算子的RRMSE与噪声标准差σ成正比。在实际应用中,灰度平坦区域的大小与σ2相关,并且随着其大小的增加而增加。当灰度平坦区域的面积没有显著变化时,RRMSE可以近似地认为与噪声标准差σ成正比,噪声响应斜率可以用来表示算子的鲁棒性。C反映了线性关系的截距,它总是负的。实验结果表明,C的值通常很小,对鲁棒性评估的影响很小;因此,在实际应用中可以忽略C的影响。由于图像中灰度平坦区域的面积通常是未知的,绝对值型算子的实际噪声响应斜率难以准确获得。为了估计噪声响应斜率,我们可以设置P/MN = 1,即灰度平坦区域的面积等于整个图像面积。在这种条件下获得的噪声响应斜率在本文中称为理论斜率。显然,理论斜率总是大于实际噪声响应斜率的值,可以视为实际值的理论上限。

2.4.2. 卷积绝对值型算子
如果算子将图像与掩模进行卷积,然后取卷积结果的绝对值,焦点度量F可以简化为:(21) 噪声图像的焦点度量Fn为:(22) 同样,我们将图像分为平坦区域和变化显著的区域。对于平坦区域,可以假设(H?I)x,y << (H?ε)x,y;因此,(23) 此时,(24) 设C = E[∣(H?I)x,y∣],考虑到sgn(H?I)x,y ≥ 0和sgn(H?I)x,y < 0的概率大致相等,所以(25) 对于变化显著的区域,可以假设(H?I)x,y >> (H?ε)x,y;因此,F″ ≈ 0。结合这两种情况,得到:(26) 我们知道(27) 得到(28) 方程(28)表明,卷积绝对值型算子的RRMSE与σ之间的关系与邻域差分绝对值型算子相似。因此,它们的鲁棒性仍然可以使用噪声响应斜率来量化。

2.5. 总结
结合第2.3节和第2.4节的理论推导,尽管平方型和绝对值型算子在计算形式上有所不同,但它们在加性高斯白噪声(AWGN)下的噪声响应行为可以在统计意义上统一为一个线性模型。唯一的区别是线性模型的自变量,它由算子结构决定:平方型算子对应于噪声方差σ2,而绝对值型算子对应于噪声标准差σ。基于这种统一的描述,我们引入了噪声响应斜率(ktheory)来表征焦点度量算子对噪声扰动的固有敏感性。它定义为RRMSE与相应噪声参数的比率,即RRMSE-噪声关系曲线的理论斜率,如方程(29)所示。这个参数将算子的结构参数、图像统计信息和噪声传播行为整合为一个单一的标量指标,为比较不同算子的鲁棒性提供了统一的定量标准。(29) 其中Ψnoise表示与算子类型匹配的噪声统计参数(平方型为σ2,绝对值型为σ)。表1列出了不同算子类型的ktheory表达式。这种统一的噪声响应模型的建立明确了ktheory的物理意义,并为通过拟合后续实验中的RRMSE-噪声曲线斜率来验证理论分析提供了直接的基础。

3. 焦点度量算子
为了验证平方型算子和绝对值型算子在噪声响应上的理论差异[15,16,17],本节介绍了实验中选用的典型算子。

3.1. 平方型焦点算子
Brenner算子通过计算水平间距为2的两个像素之间的灰度差的平方来测量图像细节强度。其定义为:(30)
2.EOGEnergy算子使用水平和垂直方向上相邻像素之间灰度差的平方和作为清晰度度量。(31)
3.Roberts算子采用四个相邻像素的灰度值交叉减法的平方和作为每个像素的梯度值。然后将所有像素的梯度值相加得到度量。(32)
4.Tenengrad算子基于Sobel算子。它计算每个像素的水平和垂直梯度响应的平方和,以表示图像的整体梯度能量。(33) (34) Gx和Gy分别是Sobel算子在水平和垂直方向上的层响应。
5.EOLaplacian算子使用Laplacian算子响应的平方和。Laplacian算子对细节和边缘更敏感,能更好地捕捉局部变化。(35) 在这五个算子中,Brenner、EOG和Roberts属于邻域差分平方型,而Tenengrad和EOL属于卷积平方型。

3.2. 绝对值型算子
SMD算子计算相邻像素之间绝对灰度差的和,以反映灰度变化的强度。它的计算成本低且实时性能良好。(36)
2.Improved Brenner算子在传统的Brenner算法中增加了垂直梯度计算,并使用绝对值求和而不是平方,使其更能适应复杂图像,同时保持计算效率[18]。
3.RobertsAbs算子是Roberts算子的另一种形式,直接使用从Roberts交叉算子得到的两个梯度分量的绝对值之和。实际上,许多FM算子都有绝对值和平方两种版本。(38)
4.SML算子累积水平和垂直二阶差的绝对值,突出细节的同时相对鲁棒。(39)
5.Prewitt算子使用Prewitt算子计算水平和垂直梯度的绝对值之和。(40) (41) Px和Py分别是Prewitt算子在水平和垂直方向上的层响应。在这五个算子中,SMD、Improved Brenner和RobertsAbs属于邻域差分绝对值型,而SML和Prewitt属于卷积绝对值型。

4. 实验
4.1. 实验设置
为了全面评估所提出理论模型的准确性和适用性,实验设计了涵盖从理想模拟到复杂现实场景的各种测试数据。实验研究主要包含两部分:首先,验证噪声响应模型的线性假设;其次,验证理论敏感性系数作为鲁棒性指标的有效性。

4.1.1. 实验数据集
选择了两种代表性的图像序列进行实验,以系统地评估所提出理论模型在受控条件和现实场景下的有效性和适用性。每个序列涵盖了不同焦深的多个图像。部分示例如图1所示,序列参数列在表2中。图1. 图像序列示例:(a–c) 圆锥;(d–f) 正弦波;(g–i) 硬币;(j–l) 铅笔。表2. 图像序列的参数。第一类包括根据[19]中的散焦成像模型生成的模拟序列,包括两种典型的表面地形:圆锥和正弦曲线表面。这类数据具有精确可控的焦平面变化和结构参数,有效地排除了实际成像中存在的复杂干扰因素,从而验证了理论模型的正确性和基本机制。其中,圆锥和正弦曲线表面分别代表单调和周期性结构。第二类包括来自公共数据集的真实序列,包括硬币表面和铅笔图像序列。这类数据展示了复杂的纹理分布和丰富的光谱成分,可以用来评估模型在实际成像条件下的性能,从而验证其泛化能力和工程适用性。实验通过添加零均值AWGN来模拟噪声环境。对于平方型算子,噪声方差σ2设置在[0,100]范围内;对于绝对值型算子,噪声标准差σ设置在[0,10]范围内。为了模拟真实成像系统的动态范围限制并评估其影响,实验建立了两种灰度处理条件进行比较:受限灰度范围:将噪声嵌入图像的灰度值限制在0–255范围内,以近似实际应用中的噪声约束;不受限制的灰度范围:允许噪声叠加的灰度值超出0–255范围,以保持噪声的理想统计分布。在上述每种条件下,为了消除随机噪声的影响并提高统计可靠性,对每种噪声强度进行了多次独立的重复实验。在每次实验中,随机生成高斯白噪声并添加到原始图像序列中。对于每个操作符,在每个噪声水平下重复实验5次,并计算相应的RRMSE–噪声关系曲线及其线性拟合结果。4.1.2 评估指标为了定量评估所建立的理论模型的有效性,本文选择线性拟合优度和相对误差作为核心评估指标。这一选择基于理论模型的结构特征和验证目标,具体如下:线性拟合优度本文理论模型的核心假设是RRMSE与噪声参数(σ2或σ)之间存在线性关系。因此,验证模型的主要问题是确定实验数据是否符合线性趋势。线性拟合优度R2可以全面衡量实验数据与理论线性模型之间的一致性。当R2接近1时,表明实验结果在统计上支持所提出的线性关系。因此,使用这一指标来验证模型结构假设的合理性。R2的定义如方程(42)所示:(42)其中表示实验观测值,表示线性拟合值,表示观测值的平均值,N表示数据点的数量。2.相对误差在确认线性关系的有效性后,还需要进一步评估噪声响应斜率的可靠性作为鲁棒性指标。为此,引入了理论斜率ktheory与实验回归斜率kexp之间的相对误差,以衡量理论噪声响应斜率值相对于实际值的预测准确性。这个相对误差用Re表示,其定义如方程(43)所示。实验是在Microsoft Windows 11(微软公司,美国华盛顿州雷德蒙德)上进行的,使用的是Intel Core i5-1035G1处理器(英特尔公司,美国加利福尼亚州圣克拉拉)和8 GB内存。软件平台使用的是MATLAB R2017(MathWorks公司,美国马萨诸塞州纳蒂克)。4.2 噪声响应模型的线性验证本节重点验证第2节中推导出的统一噪声响应模型。具体来说,对于平方型操作符,RRMSE与噪声方差σ2成正比;对于绝对值型操作符,在噪声主导区域内,RRMSE与噪声标准差σ成正比。4.2.1 平方型操作的线性验证图2、图3、图4和图5展示了第3章中介绍的五种平方型操作符在不同图像序列下的RRMSE与σ2的单次实验值及其拟合线。图2. Cone序列下的RRMSE–σ2实验值及其拟合线。图3. Sine序列下的RRMSE–σ2实验值及其拟合线。图4. Coin序列下的RRMSE–σ2实验值及其拟合线。图5. Pencil序列下的RRMSE–σ2实验值及其拟合线。如图2、图3、图4和图5所示,对于所有四种图像序列,每种平方型焦点测量操作符的RRMSE都显示出与噪声方差σ2大致呈线性增长的趋势。为了定量评估这种线性关系的可靠性,表3展示了每种操作符在每种图像序列上的决定系数R2。表3. 不同序列上平方型操作的线性拟合优度。实验结果表明,无论是模拟图像序列(Cone和Sine)还是真实图像序列(Coin和Pencil),所有平方型操作符的R2值都保持在0.999以上,表明在考虑的噪声范围内RRMSE与σ2之间存在强线性相关性。尽管不同图像序列之间的R2值存在轻微差异,但所有值都处于非常高的水平,表明这种线性关系非常稳定。这一观察结果与第2节中提出的平方型操作符的理论分析一致,即在加性高斯噪声下,平方型操作符的RRMSE与噪声方差呈线性关系。表4、表5、表6和表7展示了五种平方型操作符在不同图像序列上的理论斜率ktheory,以及在两种灰度处理条件下通过重复实验获得的实验斜率kexp1(受限灰度范围)和kexp2(不受限灰度范围)的平均值,以及相应的相对误差Re1和Re2的平均值和标准差。由于实验过程中kexp1和kexp2的变化很小,导致标准差也较小,因此本研究仅展示了Re1和Re2的标准差S1和S2。表中的数字表示基于斜率的操作符鲁棒性排名(按鲁棒性降序排列)。表4. Cone序列上平方型操作的斜率比较。表5. Sine序列上平方型操作的斜率比较。表6. Coin序列上平方型操作的斜率比较。表7. Pencil序列上平方型操作的斜率比较。4.2.2 平方型操作符的实验结果分析从实验结果可以看出,对于相同的图像序列,不同操作符的噪声响应斜率存在显著差异,但它们的数值仍然相当。对于不同的图像序列,同一操作符的噪声响应斜率变化明显,表明噪声响应斜率随图像内容而变化,但操作符的鲁棒性排名保持不变。对于所有图像序列,理论斜率与实验斜率之间的Spearman相关系数为1,精确概率为p = 0.017(双尾),在0.05水平上显著。此外,重复实验的结果表明,每个操作符的Re的标准差远小于其平均值,表明随机噪声对整体结论的影响有限,所提出的模型表现出良好的稳定性和重复性。除了正弦图像序列外,其他图像序列中理论斜率与实验斜率之间的相对误差保持较低,最大相对误差不超过2%。对于正弦图像序列,ktheory和kexp1的值之间存在明显差异(小于10%),但ktheory和kexp2之间的差异非常小(小于2%),不同操作符的Re1值基本相同。这表明误差主要是由图像本身引起的,与焦点测量操作符的计算结构关系不大。正弦图像包含大量灰度值接近极端值(0或255)的像素。灰度截断显著影响噪声分布,导致kexp1值出现较大偏差。比较两种灰度处理条件下的实验数据可以看出,本文提出的噪声响应模型受灰度截断的影响主要取决于图像的灰度分布。如果图像包含许多灰度值接近极端的像素,则会出现显著偏差;如果大多数像素的灰度值处于中间水平,则灰度截断没有显著影响。在实际应用中,大多数图像的灰度分布处于中间水平,在这种条件下,所提出的噪声响应模型对由有限动态范围引起的统计分布偏差具有很强的鲁棒性。对于正弦图像序列,尽管ktheory和kexp1之间存在明显差异,但基于kexp1值的操作符鲁棒性排名与基于ktheory和kexp2值的排名相同。总体而言,基于噪声能量叠加假设建立的理论模型能够准确描述噪声下的误差传播行为,因此可以使用ktheory作为评估操作符鲁棒性的指标。4.2.3 绝对值型操作的线性验证图6、图7、图8和图9展示了第3章中介绍的五种绝对值型操作符在不同图像序列下的RRMSE与σ的单次实验值及其拟合线。图6. Cone序列下的RRMSE–σ实验值及其拟合线。图7. Sine序列下的RRMSE–σ实验值及其拟合线。图8. Coin序列下的RRMSE–σ实验值及其拟合线。图9. Pencil序列下的RRMSE–σ实验值及其拟合线。从图6、图7、图8和图9可以看出,对于所有序列,每种绝对值型操作符的RRMSE通常随σ单调增加。与平方型操作符不同,RRMSE–σ曲线在低噪声区域表现出一些非线性偏差,但随着噪声强度的增加逐渐趋于线性。拟合线显示负截距,这与理论模型一致。为了定量分析绝对值型操作符的整体噪声响应特性,计算了整个噪声范围内的线性拟合优度(R2),如表8所示。可以看出,不同图像序列下每种操作符的线性拟合优度整体上保持在较高水平,R2值都大于0.98,表明RRMSE与噪声标准差sigma之间的关系可以用线性模型近似表示。表8. 不同序列上绝对值型操作的线性拟合优度。实验结果表明,当噪声方差较小时,RRMSE-σ曲线的斜率随噪声方差的变化而显著变化;然而,当噪声方差较大时,斜率几乎保持不变。显然,当噪声方差足够小时,灰度平坦区域的面积接近零,而灰度变化区域的面积接近整个图像面积。如前所述,在这些条件下RRMSE输出接近零。随着噪声方差的增加,灰度平坦区域的面积逐渐扩大,而灰度变化区域的面积减小——导致p值逐渐增加。这导致RRMSE-σ曲线的斜率逐渐上升,表明其梯度发生了明显变化。当噪声方差达到某个阈值时,噪声方差的进一步增加不再显著改变灰度平坦区域的面积或p值;因此,RRMSE-σ曲线的斜率基本保持不变,近似为一条直线。因此,在噪声主导的高噪声区域,绝对值型操作符的RRMSE与噪声标准差σ大致成正比,使得噪声响应斜率可以作为其鲁棒性的指标。方程(20)和(28)客观描述了这一现象。在实际应用中,我们建议在噪声标准差超过1时使用噪声响应斜率来估计绝对值型操作符的鲁棒性。不同序列之间的拟合结果差异与图像内容的结构复杂性有关,但它们不改变基本的线性趋势。这表明所提出的噪声响应模型适用于不同类型的图像序列。表9、表10、表11和表12展示了五种绝对值型操作符在不同图像序列上的理论斜率ktheory,以及在两种灰度处理条件下通过重复实验获得的实验斜率kexp1(受限灰度范围)和kexp2(不受限灰度范围)的平均值,以及相应的相对误差Re1和Re2的平均值和标准差。表9. Cone序列上绝对值型操作的斜率比较。表10. Sine序列上绝对值型操作的斜率比较。表11. Coin序列上绝对值型操作的斜率比较。表12. Pencil序列上绝对值型操作的斜率比较。4.2.4 绝对值型操作的实验结果分析从实验结果可以看出,对于相同的图像序列,不同操作符的噪声响应斜率存在显著差异,但它们的数值仍然相当。对于不同的图像序列,同一操作符的噪声响应斜率变化明显,表明噪声响应斜率随图像内容而变化,但操作符的鲁棒性排名保持不变。对于所有图像序列,理论斜率与实验斜率之间的Spearman相关系数为1,精确概率为p = 0.017(双尾),在0.05水平上显著。此外,重复实验的结果表明,每个操作符的Re的标准差远小于其平均值,表明随机噪声对整体结论的影响有限,所提出的模型表现出良好的稳定性和重复性。除了正弦图像序列外,其他图像序列中理论斜率与实验斜率之间的相对误差保持较低,最大相对误差不超过2%。对于正弦图像序列,ktheory和kexp1的值之间存在明显差异(小于10%),但ktheory和kexp2之间的差异非常小(小于2%),不同操作符的Re1值基本相同。这表明误差主要是由图像本身引起的,与焦点测量操作符的计算结构关系不大。正弦图像包含大量灰度值接近极端值(0或255)的像素。灰度截断显著影响噪声分布,导致kexp1值出现较大偏差。比较两种灰度处理条件下的实验数据可以看出,本文提出的噪声响应模型受图像灰度分布的影响主要取决于图像的灰度分布。如果图像包含许多灰度值接近极端的像素,则会出现显著偏差;如果大多数像素的灰度值处于中间水平,则灰度截断没有显著影响。在实际应用中,大多数图像的灰度分布处于中间水平,在这种条件下,所提出的噪声响应模型对由有限动态范围引起的统计分布偏差具有很强的鲁棒性。对于正弦图像序列,尽管ktheory和kexp1之间存在明显差异,但基于kexp1值的操作符鲁棒性排名与基于ktheory和kexp2值的排名相同。总体而言,基于噪声能量叠加假设建立的理论模型能够准确描述噪声下的误差传播行为,因此可以使用ktheory作为评估操作符鲁棒性的指标。4.2.3 绝对值型操作的线性验证图6、图7、图8和图9展示了第3章中介绍的五种绝对值型操作符在不同图像序列下的RRMSE与σ的单次实验值及其拟合线。图6. Cone序列下的RRMSE–σ实验值及其拟合线。图7. Sine序列下的RRMSE–σ实验值及其拟合线。图8. Coin序列下的RRMSE–σ实验值及其拟合线。图9. Pencil序列下的RRMSE–σ实验值及其拟合线。从图6、图7、图8和图9可以看出,对于所有序列,每种绝对值型操作符的RRMSE通常随σ单调增加。与平方型操作符不同,RRMSE–σ曲线在低噪声区域表现出一些非线性偏差,随着噪声强度的增加逐渐接近线性。拟合线显示负截距,这与理论模型一致。为了定量分析绝对值型操作符的整体噪声响应特性,计算了整个噪声范围内的线性拟合优度(R2),如表8所示。可以看出,不同图像序列下每种操作符的线性拟合优度整体上保持在较高水平,R2值都大于0.98,表明RRMSE与噪声标准差sigma之间的关系可以用线性模型近似表示。表8. 不同序列上绝对值型操作的线性拟合优度。实验结果表明,当噪声方差较小时,RRMSE-σ曲线的斜率随噪声方差的变化而显著变化;然而,当噪声方差较大时,斜率几乎保持不变。显然,当噪声方差足够小时,灰度平坦区域的面积接近零,而灰度变化区域的面积接近整个图像面积。如前所述,在这些条件下RRMSE输出接近零。随着噪声方差的增加,灰度平坦区域的面积逐渐扩大,而灰度变化区域的面积减小——导致p值逐渐增加。这导致RRMSE-σ曲线的斜率逐渐上升,表明其梯度发生了明显变化。当噪声方差达到某个阈值时,噪声方差的进一步增加不再显著改变灰度平坦区域的面积或p值;因此,RRMSE-σ曲线的斜率基本保持不变,近似为一条直线。因此,在噪声主导的高噪声区域,绝对值型操作符的RRMSE与噪声标准差σ大致成正比,使得噪声响应斜率可以作为其鲁棒性的指标。方程(20)和(28)客观描述了这一现象。在实际应用中,我们建议在噪声标准差超过1时使用噪声响应斜率来估计绝对值型操作符的鲁棒性。不同序列之间的拟合结果差异与图像内容的结构复杂性有关,但它们不改变基本的线性趋势。这表明所提出的噪声响应模型适用于不同类型的图像序列。表9、表10、表11和表12展示了五种绝对值型操作符在不同图像序列上的理论斜率ktheory,以及在两种灰度处理条件下通过重复实验获得的实验斜率kexp1(受限灰度范围)和kexp2(不受限灰度范围)的平均值,以及相应的相对误差Re1和Re2的平均值和标准差。表9. Cone序列上绝对值型操作的斜率比较。表10. Sine序列上绝对值型操作的斜率比较。表11. Coin序列上绝对值型操作的斜率比较。表12. Pencil序列上绝对值型操作的斜率比较。4.2.4 绝对值型操作的实验结果分析从实验结果可以看出,绝对值操作符的ktheory和kexp之间的偏差较大。总体而言,模拟图像序列上的偏差相对较大,而真实图像序列上的偏差相对较小。从前面的文本中可以看出,除了灰度平坦区域和灰度明显变化区域外,图像中还存在灰度过渡区域。本文的理论模型忽略了灰度过渡区域,因此存在误差。尽管两者之间存在差异,但ktheory始终大于kexp,这与本文的假设是一致的。对于相同的图像序列,不同绝对值运算器的ktheory和kexp的相对误差是不同的,主要是因为不同运算器的噪声鲁棒性不同,这导致运算器对图像的灰度平坦区、灰度过渡区和灰度明显区的划分不同。也就是说,一个运算器认为属于灰度平坦区的区域,另一个运算器可能认为是灰度明显区或灰度过渡区。因此,图像灰度区域的划分并不是固定的,而是与运算器的鲁棒性有关。从实验结果可以看出,运算器的鲁棒性越强,相对误差越大;运算器的鲁棒性越弱,相对误差越小。同时,实验结果还表明,同一绝对值运算器在不同图像序列上的相对误差也有所不同。例如,Prewitt运算器在圆锥图像序列上的相对误差为42.08%,而在铅笔图像序列上的相对误差仅为18.98%,这表明相对误差也与图像内容的结构复杂性密切相关。因此,对于绝对值运算器而言,ktheory和kexp的相对误差与图像内容和运算器的操作结构都有关。为了在实际应用中更准确地估计噪声响应斜率的真实值,我们建议将理论斜率乘以一个系数。该系数是根据平均Re值适当估算得出的:对于合成图像序列,系数为0.7;对于真实图像序列,系数为0.85。

与平方型运算器类似,灰度截断对正弦图像序列的实验值有显著影响(kexp1的值明显大于kexp2的值),而对其他图像序列的影响较小。这进一步验证了我们的推断——即偏差是由正弦图像序列中灰度极端处的像素数量较多造成的,与运算器的计算结构无关。对于绝对值聚焦评估运算器,尽管ktheory和kexp之间总是存在一定的差异,但这种差异有一定的规律性,即所有运算器的相对误差会同步变化。例如,对于所有运算器而言,铅笔图像序列的相对误差始终最小,而圆锥图像序列的相对误差始终最大,在正弦图像序列和硬币图像序列上也表现出类似的规律。此外,我们还在其他图像序列上进行了实验,所有结果都显示出类似的规律性,这说明相对误差的变化规律主要由图像内容决定。因此,尽管ktheory和kexp之间存在差异,但不同图像序列下运算器鲁棒性的顺序是完全相同的。对于所有图像序列,理论斜率与实验斜率之间的Spearman相关系数为1,显著性概率为p = 0.017(双尾),在0.05的水平上具有显著性。进行运算器鲁棒性分析的主要目的是比较不同运算器的鲁棒性,并为运算器选择提供参考。从这个角度来看,ktheory可以作为噪声响应斜率真实值的上限估计,并作为评估绝对值运算器鲁棒性的参考指标。

结合平方型和绝对值型运算器的结果,理论灵敏度系数ktheory在数值上能够很好地近似kexp,从而捕捉到噪声下RRMSE增长率的基本特征。这意味着在实际应用中,可以利用图像统计和运算器结构参数来估计运算器的噪声灵敏度,而无需进行多次加噪声实验。与在特定噪声水平下计算RRMSE相比,噪声响应斜率作为一个描述噪声下误差趋势的参数,不依赖于噪声强度的选择,更能直观地反映运算器的整体噪声灵敏度。因此,噪声响应斜率为选择和优化聚焦测量运算器提供了一个更为简洁的分析工具。

5. 结论

本文从理论推导和实验验证两个方面系统地分析了聚焦测量运算器的噪声鲁棒性,并建立了RRMSE与噪声参数之间的定量关系模型。在此基础上,提出了一种新的鲁棒性度量指标——噪声响应斜率,为评估运算器的鲁棒性提供了定量参考。研究揭示了不同类型运算器在加性高斯白噪声(AWGN)下误差增长机制的本质差异。理论分析和实验结果表明:

对于平方型运算器,RRMSE与噪声方差σ2在所有测试序列中都高度线性相关。当图像灰度分布处于中间范围时,理论斜率与平均实验回归斜率高度一致;当图像包含大量处于极端灰度范围的像素时,理论斜率与平均实验回归斜率之间存在偏差,这种偏差通常小于10%,且不会改变运算器的鲁棒性排名。

对于绝对值型运算器,RRMSE与噪声标准差σ在整个噪声范围内大致呈线性相关,但在噪声方差较小时存在一定的非线性偏差,这与“大噪声方差”的理论假设一致。尽管理论斜率与实验斜率之间存在数值差异,但它们对运算器鲁棒性的排名是一致的。所提出的“噪声响应斜率”描述了RRMSE作为噪声强度函数的全局趋势。这一度量指标可以通过理论公式直接计算,而无需实际向图像序列中添加噪声。总体而言,这一指标可以揭示运算器对噪声的固有敏感性,并为鲁棒性评估提供理论基准。本文提出的理论模型为聚焦测量运算器的性能评估提供了一个更为简洁和有效的理论分析工具,甚至有助于新运算器的设计,在工程应用中具有很好的潜力。对于绝对值型运算器,理论值与实验值之间仍然存在明显的偏差,理论模型需要进一步优化。未来的工作可以将模型扩展到其他噪声类型(例如,泊松-高斯混合噪声),并引入更精细的灰度过渡区域建模,以减少绝对值型运算器的理论偏差,从而提高其在实际聚焦测量和3D表面重建系统中的适用性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号