一个包含合成地震数据和真实海浪噪声的开放基准数据集，用于评估深度学习去噪模型

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Artificial Intelligence in Geosciences》：An open benchmark dataset of synthetic seismic data and real swell noise for evaluating deep learning denoising models

【字体：大中小】 时间：2026年04月27日 来源：Artificial Intelligence in Geosciences 4.2

编辑推荐：

　　Pablo M. Barros | Roosevelt de L. Sardinha | Giovanny A.M. Arboleda | Lessandro de S.S. Valente | Isabelle R.V. de Melo | Albino Aveleda | André Bulc?o | Sergio L. Netto | Alexandre G. Evsukoff
COPPE，里约热内卢联邦大学，里约热内卢，21941-859，巴西

**摘要**
近期深度学习（DL）的进步得益于开放式的基准数据集，这些数据集使得模型的评估能够实现可重复性和系统性。尽管深度学习方法在地球物理学中的应用日益增加，但公开的基准数据集仍然稀缺，尤其是在涉及真实海浪噪声的地震去噪领域。在本文中，我们提出了一个开放的基准数据集和一个可重复的实验协议，用于评估基于深度学习的地震去噪方法。该数据集包含四个合成地震数据文件，并结合了两个不同信噪比水平的真实海浪噪声文件。所提出的评估协议包括32种独立的训练和测试配置，确保训练数据和测试数据之间的严格分离，且训练数据中的任何特征都不会在测试数据中重复使用。我们还引入了一种评估指标，以更好地量化信号去除效果。使用知名深度学习模型获得的结果为未来的比较研究提供了基准。实验结果表明，去噪性能在很大程度上取决于采集特性和噪声水平，这凸显了在地震去噪研究中建立标准化基准和评估标准的必要性。

**1. 引言**
地震数据处理是地球科学中的核心活动；它需要大量的人力和计算资源，同时还需要采集、存储和处理大型数据库。海上地震反射数据不可避免地会受到多种噪声的污染，这些噪声来源于海浪、地震电缆的湍流、风以及仪器本身。噪声会降低地震数据处理的质量，从而阻碍地质特征的进一步解读，而在勘探和水库管理场景中，这可能会导致重要的决策后果。因此，噪声衰减和去除对于地震数据处理的质量和解释策略至关重要。通常，噪声衰减方法基于滤波技术，但这需要预先了解噪声特性。当特定的频谱噪声特征可以与观测信号轻松分离时，滤波是一种高效的方法。然而，滤波参数的调整往往需要由领域专家手动完成，且耗时较长。

去噪的目标是尽可能恢复原始信号，消除噪声影响并提高信噪比（SNR）。图像去噪是信号处理中的一个经典问题（Goyal等人，2020年）。最近，深度学习（DL）方法取得了良好的成果（Tian等人，2020年）。在地震数据去噪中，很难区分信号和噪声，去噪过程后信号可能会丢失一些重要的细节和特征。一些基于DL的方法使用加性高斯白噪声（AWGN）进行受控实验（Anjom等人，2024年），而真实的地震噪声具有更复杂的特性（Liu等人，2022年，2020年）。AWGN假设并不适用于地震去噪，因为地震数据的噪声来源多种多样（Yu等人，2019年）。有些作者使用无源环境噪声进行地震去噪（Dong等人，2022a年；Lan等人，2023年），但这些相关的噪声文件通常不可用，这使得复制实验变得困难，从而激发了创建真实基准数据集以评估DL模型的需求。

深度学习在计算机视觉领域的最新发展为开放基准数据集的创建提供了动力，这些数据集可以用来测试和比较不同的算法。然而，石油和天然气行业仍然不愿公开真实数据，可用于评估去噪问题的DL模型的真实地震基准数据集非常少。本文介绍了一个由合成地震数据和经过滤波处理后的真实噪声组成的基准地震去噪数据集，旨在加速新型去噪解决方案的发展。该基准数据集被用于评估知名的DL架构，作为未来比较研究的基准。本文还引入了一种可以量化去噪过程中信号去除程度的评估指标。

**2. 相关工作**
Anjom等人（2024年）最近针对地震数据处理的机器学习和DL应用进行了全面调查，包括去噪。作者报告称去噪是DL在地震数据处理中最常见的应用之一（Anjom等人，2024年）。文献中报道了多种用于地震数据去噪的DL模型，这些模型通常基于图像去噪方法。对使用DL方法进行地震数据去噪的系统文献回顾超出了本文的范围。本节介绍了部分相关工作，以展示DL模型在地震数据去噪中的主要方法。讨论重点在于用于评估DL模型的地震数据和噪声类型。本节主要介绍那些拥有干净（无噪声）数据进行训练的监督学习方法，正如本文所引入的开放基准数据集一样。

卷积神经网络（CNN）已被广泛用于地震数据去噪，通常使用不同的模型拓扑结构，并通过合成地震数据和随机噪声进行评估（Yu等人，2019年；Zhang等人，2017年；Ji和Wang，2022年）。Mandelli等人（2019年）提出了一个基于U-Net模型的卷积自动编码器（CAE），该模型在带有加性（高斯和尖峰）随机噪声的合成地震数据上进行训练，重点在于噪声衰减和缺失预堆叠数据迹线的插值。Jin等人（2018年）提出了一个在受AWGN污染的合成数据上训练的残差神经网络（ResNet），他们也使用合成数据集进行评估。Song等人（2020年）提出了一种CAE，并将其与经典的小波和f-X反卷积方法进行了比较，以去除合成地震数据中的随机噪声。

去噪CNN（DnCNN）是一种著名的图像去噪方法，该模型被训练来再现噪声而非干净数据。通过从含噪声数据中减去预测的噪声来获得干净数据的预测值（Zhang等人，2017年）。DnCNN及其以U-Net模型为基础的变体（称为DUDnCNN）被用于Kaggle盐体分割竞赛中的后堆叠地震数据，其中包含高斯噪声（Li和Ma，2021年）。作者报告称DUDnCNN模型的性能优于DnCNN模型。Lan等人（2023年）提出了结合残差神经网络的离散小波变换（DWT-ResNet）模型，该模型用于去噪受合成和真实单通道（1D）地震数据中的合成和真实噪声。DWT-ResNet模型在信噪比高的数据上表现良好，但随着噪声水平的增加性能会下降。Li等人（2022年）评估了多尺度扩缩卷积网络（MDCN）拓扑结构。他们在无源条件下模拟了一个在沙漠地区（塔利木盆地）记录的合成地震数据集，该模型与带通滤波器、f-X滤波器和DnCNN模型进行了比较，表现更好。

生成对抗网络（GANs）（Goodfellow等人，2014年）也被用于地震去噪。Ganssle（2018年）提出了一个使用合成地震数据和AWGN的pix2pix模型，并将数据和代码托管在GitHub上。Li等人（2023年）提出了多尺度残差密度GAN（MSRD-GAN）模型，用于合成和真实地震数据的去噪，将其与经典方法（如小波变换和DL技术，包括标准的GAN和DnCNN）进行了比较，结果显示MSRD-GAN在不同噪声水平上表现更好。SeisGAN（Lin等人，2024年）模型同时对受AWGN污染的合成地震数据进行去噪和超分辨率处理。Dong等人（2022b年）提出了一个称为渐进式去噪网络（PDN）的模型，用于随机和相干地震数据的去噪。PDN模型通过应用子网络逐层进行去噪和特征提取，处理的是在无源条件下记录的随机被动噪声数据集和模拟的相干噪声。与传统方法（如DnCNN及其GAN变体DnGAN、带通滤波器和鲁棒主成分分析RPCA）相比，该模型表现良好。Dong等人（2022a年）提出了一个具有渐进式去噪策略的扩展CNN模型（D-CNN），用于去噪受真实被动环境噪声污染的合成地震数据。该模型结合了Wasserstein GAN（WGAN）来生成具有相似概率分布的合成噪声数据，并与DnCNN和集成经验模态分解（EEMD）进行了比较。

最近，Ding等人（2024年）提出了结合U-Net模型的Swin Transformer等新拓扑结构，用于去噪受AWGN污染的真实和合成地震数据。基于扩散的方法成为数据去噪的一个重要研究方向。Liu等人（2025年）提出了一个基于条件扩散概率模型的零样本去噪框架，用于分布式声学感知（DAS）数据，其在合成和真实数据上的表现均优于其他方法。由于难以获得用于训练监督学习模型的干净地震数据，一些自监督方法被改编用于地震数据去噪。这些方法不需要干净数据来进行训练。自监督去噪的主要方法之一是生成噪声数据的不同表示，以便在训练阶段使用（Pang等人，2021年；Shao等人，2022年；Zhao等人，2023年；Li等人，2024年）。有些方法将去噪视为修复问题，即模型被训练来从遮蔽的输入中预测地震信号（Huang等人，2021年；Meng等人，2022年；Pereira Pinheiro等人，2024年）。在这种方法中，模型无法再现非相干噪声，因此只能估计出干净信号。虽然自监督学习方法的性能通常不如监督学习方法，但它是一个充满前景且活跃的研究方向。

**表1**总结了选定相关工作，其中大多数论文使用合成地震数据和AWGN（或未指定的随机噪声）来评估不同的DL模型。表1中的大多数相关工作未公开其数据，且实验协议不可重复。

本文提出了一个用于DL模型评估的开放基准数据集。该数据集包含四个合成地震文件，分别与两个不同水平的真实海浪噪声文件组合。数据集的详细信息将在下一节中说明。

**3. 数据集描述**
合成地震数据是通过使用弹性波方程和参考速度模型通过数值模拟生成的，以表示干净（无噪声）数据。为了模拟真实数据，通过添加真实噪声来生成含噪声数据，具体方法如下：
x = y + ?，
其中x表示含噪声数据，y表示干净数据，?表示加性真实噪声。每个地震数据集都以一组炮集的形式呈现，每个炮集都是一个二维数组，行代表时间，列代表迹线（参见表2）。每条迹线表示相应水听器在一次射击后记录的地下反射。shot gather的行数取决于采样频率和总采集时间。在这项工作中，对两个开源结构模型的地震响应进行了两次数值模拟，以生成四个合成地震数据，如表2所示。使用MARMOSI结构模型获得的数据在模拟参数上有所不同，而使用SEAM模型获得的数据则在3D模型的一条测线和一个交叉线上进行了模拟。这些合成地震数据被用作深度学习（DL）模型训练的干净数据。每个文件中的一个地震图在经过数据重缩放后（参见第4节）显示在图1中。海洋地震采集中的涌浪噪声与海面运动和接收机的机械耦合有关。本工作中使用的涌浪噪声数据是通过从原始地震数据中减去处理后的数据得到的（表3）。噪声提取过程旨在完全保留地震信号，确保残留物中只包含噪声。调整了处理参数以防止信号泄漏，即使噪声清除不完全。应用了质量控制来验证残留物主要是否代表噪声。涌浪噪声的频谱特征是在5-6 Hz附近有一个明确的峰值，并且随着频率的升高而迅速衰减。它在接收机阵列上具有高空间相干性，在f-k域中具有低视速度。噪声文件的频谱（FFT）和f-k频谱分别显示在图A.5和图A.6中。噪声文件中未发现信号频率范围内的显著幅度（噪声频率之外）。由于没有可用的真实地震数据，因此无法进行进一步的定量检查。

由于噪声数据来自不同的来源，它们的尺度与合成数据不同，需要在添加到合成数据中以计算含噪声数据之前进行重缩放，如公式（1）所示。为了获得含噪声数据的所需信噪比（SNR），进行了噪声重缩放。例如，假设含噪声数据的所需SNR与真实数据的SNRe相同，表示为：（2）SNRe = RMS(yR) / RMS(eR)，其中yR是原始尺度下的真实干净数据，eR是真实噪声，RMS是信号的均方根，代表信号能量。

表2. 合成地震数据。
| 文件 | 结构模型 | Shot Gather | 总迹线数 | 采样周期 | 样本数 | 迹线间隔 |
| --- | --- | --- | --- | --- | --- |
| SEISMIC A | MARMOSI | 1440 | 933 | 3,120 | 2 ms | 400 | 18 s |
| SEISMIC B | SEAM | 1200 | 931 | 2,000 | 2 ms | 400 | 18 s |
| SEISMIC C | SEAM | 1200 | 931 | 2,000 | 2 ms | 400 | 18 s |
| SEISMIC D | MARMOSI | 420 | 252 | 2,000 | 2 ms | 250 | 15 s |

表3. 通过从原始地震数据中减去处理后的数据得到的噪声数据。
| 文件 | Shot Gather | 总迹线数 | 采样周期 | 样本数 | 迹线间隔 |
| --- | --- | --- | --- | --- | --- |
| NOISE 1 | 190 | 46,168,956 | 2 ms | 420 | 18.4 s |
| NOISE 2 | 167 | 29,630,720 | 2 ms | 326 | 7.6 s |

下载：下载高分辨率图像（742KB）
下载：下载全尺寸图像

图1. 干净的地震数据：(a) Seismic A, (b) Seismic B, (c) Seismic C, 和 (d) Seismic D。

归一化的噪声数据计算如下：（3）e?R = eR / RMS(eR)，使得RMS(eR) = 1。要添加到干净合成数据中的噪声是归一化的真实噪声，经过缩放以使合成含噪声数据保持原来的SNR：（4）? = e?R / RMS(y) / SNRe，其中y代表干净的合成数据（参见公式（1）。

可以通过计算含噪声数据的SNR来验证尺度校正效果：（5）SNR = RMS(y) / (RMS(y) / RMS(e?R)) = RMS(y) / SNRe。

在这项工作中，将根据公式（1）将两个真实涌浪噪声文件（NOISE 1和NOISE 2）（在不同采集条件下记录）添加到四个合成地震数据集中（参见表2）。根据含噪声数据的所需SNR（参见公式（4）），噪声文件在四个不同的级别进行了重缩放：L1对应SNR=1；L2对应SNR=2；L5对应SNR=5；L10对应SNR=10。图A.1显示了用NOISE 1文件在四个不同级别下污染的四个合成地震数据地震图（列）。图A.2以相同方式显示了用NOISE 2文件污染的地震数据。这些数据的f-k频谱分别显示在图A.3和图A.4中。

合成数据的迹线间隔不同（参见表2），但在与NOISE 1文件结合时保持不变。然而，NOISE 2文件较短，因此在与SEISMIC A、SEISMIC B和SEISMIC C的合成数据结合时，含噪声数据必须被截断到大约6秒，以直接匹配噪声文件的长度，从而避免重新采样。

4. 方法
在地震数据去噪的监督学习方法中，含噪声数据x作为输入呈现给模型，而干净数据y用作目标。模型被训练来估计目标：（6）y? = f(x, θ)，其中y?是模型对干净地震数据的估计，x是由公式（1）计算出的含噪声数据，θ表示模型参数。

每个shot gather都具有拓扑邻域和纹理特性，这些特性可以被DL模型中的卷积操作符利用。在这项工作中，应用了DL图像去噪方法来识别输入（含噪声）数据和目标（干净）数据之间的相干信息。地震数据在尺度上可能相差很大，因此在模型处理之前应该进行重缩放。在这项工作中，对输入地震数据的每个shot gather应用了线性缩放，形式为z分数的修改版本：（7）x? = x ? μ / σ，其中μ是地震数据中所有值的平均值，σ是标准差。在这种缩放中，如果数据来自高斯分布，99%的缩放后的变量x?属于[-1, 1]区间。

在重缩放后，每个shot gather的输入和输出数据被裁剪成256 × 64大小的输入-输出对，然后用于训练模型。使用了不同大小的裁剪进行了初步测试，但没有发现显著差异。训练集的大小由记录总数确定，每条记录都是在相同位置裁剪的输入-输出对。对于每个shot gather，随机选择相关裁剪，直到达到训练集所需的记录数。此外，裁剪选择受到限制，以采样包含shot gather的地震反射的区域；换句话说，是直接波以下的区域。

所有模型都是全卷积的，因此在推理阶段将整个shot gather呈现给每个模型。在接下来的部分中，将介绍在这项工作中使用的DL模型。

4.1. FCNN
全卷积网络（FCNN）是一种对输入应用一系列卷积层的CNN类型（Long等人，2015年）。FCNN的一个主要特点是模型独立于输入大小，输出的大小仅取决于输入的大小。当处理可能具有不同大小的输入时，这是一个有用的特性。

在这项工作中使用的5层FCNN模型（FCNN-5）显示在图2中，其中只使用了卷积层块，所有层的大小都与输入的大小相同。训练阶段的模型输入是裁剪后的数据，而在推理阶段将整个shot gather呈现给模型。由于其简单性，网络训练时间通常比更复杂的架构短。

FCNN-5模型的参数使用L1损失进行了调整，在初步测试中取得了更好的结果，定义如下：（8）L1 = 1 / (N * m * ∑t ∈ ci | y(t) ? y?(t)|，其中y(t)是目标值，y?(t)是每个裁剪ci获得的模型预测，m=16,384是每个256 × 64裁剪中的值数量，N是训练数据集中包含的裁剪总数。

下载：下载高分辨率图像（252KB）
下载：下载全尺寸图像

图2. 具有5层的FCNN模型。

FCNN-5的拓扑细节显示在表4中，第一列代表层；第二列表示核大小；第三列表示输出格式，即[通道数、裁剪高度、裁剪宽度]；最后一列是层中的参数数量。所有卷积层使用参数化的修正线性单元（PReLU）激活函数，其中函数的线性部分的斜率可以通过参数进行调整。输出层使用64个1 × 1滤波器和线性激活函数。该模型共有1,332,678个可训练参数，并在PyTorch框架中的Python 3中实现。

FCNN模型使用4,000,000条记录（裁剪）作为训练数据，批量大小为2048条记录。优化器是随机梯度下降（SGD），初始学习率为0.01。评估了其他优化器，但没有显著的性能差异。提前停止标准是在50个周期时实施的。如果达到最大周期数（500）或处理时间超过10天，训练过程将中断。然而，在所有实验中，通过提前停止标准实现了收敛。图A.7显示了FCNN模型的一个实验的收敛曲线。可以看出，模型在110个周期后达到了平台期且没有过拟合。

表4. FCNN-5模型拓扑。
| 层（类型） | 过滤器 | 输出形状 | 参数 |
| --- | --- | --- | --- |
| Conv2d-1 | 9 × 9 | [64, 256, 64] | 5248 |
| PReLU-2 | – | [64, 256, 64] | 1 |
| Conv2d-3 | 9 × 9 | [64, 256, 64] | 331,840 |
| PReLU-4 | – | [64, 256, 64] | 1 |
| Conv2d-5 | 9 × 9 | [64, 256, 64] | 331,840 |
| PReLU-6 | – | [64, 256, 64] | 1 |
| Conv2d-7 | 9 × 9 | [64, 256, 64] | 331,840 |
| PReLU-8 | – | [64, 256, 64] | 1 |
| Conv2d-9 | 9 × 9 | [64, 256, 64] | 331,840 |
| PReLU-10 | – | [64, 256, 64] | 1 |
| Conv2d-11 | 1 × 1 | [1, 256, 64] | 654 |

4.2. SRGAN
顾名思义，超分辨率GAN（SRGAN）是一种用于执行图像超分辨率的GAN架构（Ledig等人，2017年）。生成器模型的拓扑是一系列残差块，每个残差块由一个卷积层、一个批量归一化层和一个PReLU激活函数组成，接着是另一个卷积层、另一个批量归一化层和一个求和层，然后添加残差。在原始文章（Ledig等人，2017年）中使用了16个残差块，但根据实现的不同，残差块的数量可以变化。生成器网络是一个能够处理任何输入图像大小的全卷积网络。判别器网络模型也由残差块组成，但在其卷积块的末端使用了leaky ReLU激活函数和密集层，从而能够区分真实图像和生成器创建的合成图像。

SRGAN架构的生成器模型使用称为感知损失的损失函数进行训练，该损失函数使用两个术语计算：内容损失和对抗损失：（9）L = L2? + 10^-3LG。

下载：下载高分辨率图像（337KB）
下载：下载全尺寸图像

图3. SRGAN架构的生成器模型（SRGAN）。

改编自Ledig等人（2017年）。

生成器损失LG与原始GAN中提出的损失函数相同（Goodfellow等人，2014年）。内容损失L2?是在特征图上计算的均方误差（MSE）。在原始文章（Ledig等人，2017年）中，作者建议基于VGG19神经网络（Simonyan和Zisserman，2014年）生成的特征图来计算L2。判别器模型被训练来最大化原始GAN的判别器损失（Goodfellow等人，2014年）。

SRGAN模型可以适应去噪问题。在这种情况下，生成器的输入是一个含噪声的图像，模型被训练生成一个去噪图像，使得判别器无法区分图像是干净的还是被模型清理过的。必须移除上采样层，因为干净的输出图像必须与含噪声的输入图像大小相同。

SRGAN的对抗训练复杂，收敛困难，需要大量的计算资源。初步测试表明，仅使用生成器模型就可以调整去噪模型。图3) 的设计与SRGAN相同，但它是通过标准的监督学习方法用L2损失函数进行训练的：(10)L2=1/Nm∑t=1N∑t∈ci(y(t)?y?(t))2，其中y(t)是目标值，y?(t)是针对每个 crops ci 计算出的模型预测值，m=16,384是每个256 × 64Crop中的值数量，N是训练数据集中包含的Crop总数。因此，该模型将被称为SRGEN模型。在这项工作中评估了两个SRGEN模型，一个具有4个残差块，另一个具有16个残差块（分别称为SRGEN-4和SRGEN-16）。SRGEN-4的详细信息如表5所示，列与表4相同。输出层进行了适应性调整，以适应去噪应用，使用了64个1 × 1滤波器和线性激活函数，类似于FCNN-5模型。SRGEN-4模型共有1,098,369个可训练参数，而SRGEN-16模型共有1,969,089个可训练参数。这两个模型都是在使用Python 3和PyTorch框架实现的。SRGEN模型使用4,000,000个256 × 64的Crop作为训练数据，批量大小为256条记录。优化器采用自适应矩估计（ADAM），初始学习率为10^-5。ADAM优化器的选择与原始论文（Ledig等人，2017年）中的相同。提前停止标准是在达到最大训练周期数（500个周期）或处理时间超过10天时启动的。然而，在所有实验中，提前停止标准都实现了收敛。图A.7显示了SRGEN-4模型一个实验的收敛曲线。可以看出，该模型在大约第175个周期时达到了收敛值，且没有过拟合。

表5. SRGEN-4模型拓扑结构
层次（类型）过滤器输出形状参数数量
Conv2d-1 9 × 9[64, 256, 64] 524
PReLU-2 [64, 256, 64] 64
RESIDUAL BLOCK 1 Conv2d-3 3 × 3[64, 256, 64] 36,928
BatchNorm2d-4 [64, 256, 64] 128
PReLU-5 [64, 256, 64] 64
Conv2d-6 3 × 3[64, 256, 64] 36,928
BatchNorm2d-7 [64, 256, 64] 128
PReLU-8 [64, 256, 64] 64
Residual sum [64, 256, 64] -
RESIDUAL BLOCK 2 Conv2d-9 3 × 3[64, 256, 64] 36,928
BatchNorm2d-10 [64, 256, 64] 128
PReLU-11 [64, 256, 64] 64
Conv2d-12 3 × 3[64, 256, 64] 36,928
BatchNorm2d-13 [64, 256, 64] 128
PReLU-14 [64, 256, 64] 64
Residual sum [64, 256, 64] -
RESIDUAL BLOCK 3 Conv2d-15 3 × 3[64, 256, 64] 36,928
BatchNorm2d-16 [64, 256, 64] 128
PReLU-17 [64, 256, 64] 64
Conv2d-18 3 × 3[64, 256, 64] 36,928
BatchNorm2d-19 [64, 256, 64] 128
PReLU-20 [64, 256, 64] 64
Residual sum [64, 256, 64] -
RESIDUAL BLOCK 4 Conv2d-21 3 × 3[64, 256, 64] 36,928
BatchNorm2d-22 [64, 256, 64] 128
PReLU-23 [64, 256, 64] 64
Conv2d-24 3 × 3[64, 256, 64] 36,928
BatchNorm2d-25 [64, 256, 64] 128
PReLU-26 [64, 256, 64] 64
Residual sum [64, 256, 64] -
Conv2d-27 3 × 3[64, 256, 64] 36,928
BatchNorm2d-28 [64, 256, 64] 128
Residual sum [64, 256, 64] -
Conv2d-29 3 × 3[256, 256, 64] 147,712
PReLU-30 [256, 256, 64] 256
Conv2d-31 9 × 9[256, 256, 64] 590,080
PReLU-32 [256, 256, 64] 256
Conv2d-33 1 × 1[1, 256, 64] 20,737

4. 实验协议
实验协议旨在评估模型的泛化能力。每个实验都是使用不同的结构模型、噪声文件和噪声水平组合来生成训练和测试数据，且训练数据中的任何特征都不会在测试数据中重复使用。例如，如果使用了MARMOSI（SEAM）结构模型文件进行训练，那么测试也会使用MARMOSI（SEAM）结构模型文件。同样地，如果使用了NOISE 1（NOISE 2）文件进行训练，那么测试也会使用NOISE 2（NOISE 1）文件。此外，对于相同的结构模型和噪声文件组合，训练和测试会使用不同的噪声水平。例如，如果使用L1进行测试，那么模型会分别用L2、L5和L10水平进行训练，以确保训练数据和测试数据中永远不会同时出现相同的噪声水平。以这种方式生成的所有可能的训练和测试集组合共有32个实验，如表6所示。每个深度学习模型都在所有32个实验中进行了评估，其结果将在下一节中讨论。

表6. 模型评估的训练和测试集
地震噪声水平地震噪声水平训练集测试集
SEISMIC ANOISE 1 L2 L5 L10 SEISMIC BNOISE 2 L1
SEISMIC ANOISE 2 L2 L5 L10 SEISMIC BNOISE 1 L1
SEISMIC BNOISE 1 L2 L5 L10 SEISMIC CNOISE 1 L1
SEISMIC ANOISE 2 L2 L5 L10 SEISMIC DNOISE 1 L1
SEISMIC CNOISE 2 L2 L5 L10 SEISMIC DNOISE 1 L1
SEISMIC CNOISE 2 L2 L5 L10 SEISMIC DNOISE 2 L1
SEISMIC CNOISE 2 L2 L5 L10 SEISMIC DNOISE 1 L1
SEISMIC CNOISE 2 L2 L5 L10 SEISMIC DNOISE 2 L1

5. 结果
在这项工作中，评估了FCNN-5、SRGEN-4和SRGEN-16模型，为未来的比较研究提供了基准。所有实验都在Petrobras Gaia超级计算机上进行了，每个计算节点拥有1TB的主内存和4个NVIDIA A100 GPU，每个GPU拥有80GB内存。

5.1. 评估指标
峰值信噪比（PSNR）是常用的图像去噪评估指标，定义为：(11)PSNR=10log10(R^2/MSE)，其中R是一个表示信号在图像表示中可以达到的最大值的尺度因子，MSE是均方误差，如公式(10)所计算。在文献中，模型通常在8位图像上进行评估，因此R=256。在更一般的设置中，R=2^n，其中n是表示中的位数。对于地震数据，炮集由实数（浮点数）表示，因此在表示中的最大值对PSNR计算没有意义。在这项工作中，所有实验都使用了固定的尺度因子R=2，因为数据是根据修改后的z分数方法（参见公式(7)）进行缩放的。
PSNR在评估地震数据去噪的DL模型时表现有限，因为它对信号去除不敏感。本文提出了一种新的评估指标：SNR相对比（SNR2），计算方法是模型预测的信号与原始（含噪）信号的SNR之比，即：(12)SNR2=1?(SNR(y?)/SNR(y)=1?(RMS(eM))/RMS(eR)，其中eM是模型残差，eR是含噪数据中的噪声。SNR2的解释类似于决定系数R2，表示残差能量与原始噪声能量之间的关系。SNR2的值始终小于1.0，值越高越好。SNR2指标可以是负数，当例如从信号中移除的能量大于原始噪声的能量时就会出现这种情况，例如在低噪声水平的情况下。

5.2. 模型结果
本节展示了三个基准DL模型的结果：FCNN-5、SRGEN-4和SRGEN-16。还包括了一个截止频率为6 Hz的高通滤波器的结果作为参考。该滤波器设计得较为保守，旨在优先去除噪声而不显著改变有用信号。
所有32个实验的计算评估指标分别显示在表A.1（FCNN-5）、表A.2（SRGEN-4）和表A.3（SRGEN-16）中。结果对应于每个实验中所有炮集的平均值和标准差。表中的L1–L10列表示测试集中使用的噪声水平，这些噪声水平没有在训练集中使用（参见表6）。图4直观地展示了模型的结果，包括高通滤波器的计算结果。每个条形代表相应实验中所有炮集的平均指标值。可以看出，尽管拓扑结构不同，DL模型在所有实验中获得了相似的性能。SRGEN模型的拓扑结构比FCNN更复杂，包括了一些改进，如批量归一化和残差连接。SRGEN-4模型的可训练参数数量几乎与FCNN-5模型相同，但SRGEN-16模型的参数数量几乎是FCNN-5和SRGEN-4的两倍。根据SNR2指标，DL模型的性能优于高通滤波器，但在最低噪声水平下除外。根据PSNR指标，滤波器在某些情况下表现更好。图4还显示，在较低噪声水平下，模型获得了较高的PSNR值，但SNR2值较低甚至为负，表明模型移除的信号能量大于原始噪声的能量。

下载：下载高分辨率图像（1MB）
下载：下载全尺寸图像
图4. 所有实验中所有炮集的PSNR和SNR2平均值。
图5展示了所有实验中所有炮集的PSNR和SNR2指标的交叉图。颜色代表噪声水平，形状代表模型类型。可以看出，PSNR对噪声水平非常敏感，在较低噪声强度时可以达到高值，这一点在图4中也可以观察到。
对DL模型获得的地震图的定性评估揭示了一些指标未捕捉到的视觉差异，这将在下一节中讨论。

下载：下载高分辨率图像（212KB）
下载：下载全尺寸图像
图5. PSNR和SNR2指标的交叉图。

5.3. 讨论
图6展示了SEISMIC A合成数据的一个炮集在四种噪声水平下与NOISE 1文件结合后的地震图以及FCNN-5模型的结果。每个子图从左到右依次显示四个地震图：含噪数据、干净数据、模型预测值以及残差（计算为干净数据与模型预测值之间的差异）。此外，每个子图的第二行放大了红色方框表示的区域。图6中的颜色调色板对所有地震图是相同的，定义为干净数据百分位数P2和P98之间的范围。数据仓库的补充材料中提供了所有实验及其DL模型结果的类似可视化文件（见数据可用性部分）。
FCNN-5模型在噪声较强（L1和L2）时成功减弱了噪声，在噪声较弱（L5和L10）时几乎消除了噪声。每个子图的放大版本显示，即使对于较强的噪声水平，去噪后的信号质量也很好。
FCNN-5模型在去噪过程中也移除了信号，噪声水平越强，移除的信号越多。然而，对于高噪声水平，移除信号的能量远小于噪声的能量，因此SNR2指标的值较高。在低噪声水平的情况下，移除信号的能量与噪声的能量相当，SNR2指标的值较低，尽管PSNR值仍然较高（参见表7）。
图7展示了SRGEN-4模型对图6中相同炮集的结果，子图的排列方式与图6相同。从视觉上看，即使在较强的噪声水平下，SRGEN-4模型在去除噪声方面似乎也比FCNN-5更成功。然而，SNR2值相似。
图6和图7中展示的炮集的SNR2和PSNR值分别显示在表7中。请注意，这些结果与表A.1和表A.2中显示的结果不同，因为表7仅展示了图6和图7中特定炮集的指标值，而表A.1和表A.2则展示了所有炮集的平均结果。图6和图7中的地震图在视觉上似乎略有不同，SRGEN-4模型的性能更好。然而，SNR2指标值相似，除了测试集中使用L10噪声水平的实验外，在这些实验中FCNN-5模型的表现更佳。在图6(d)和图7(d)中，通过视觉很难辨别FCNN-5和SRGEN-4模型之间的差异，但SNR2指标能够测量这种差异。在所有噪声水平下，两种模型的PSNR值相似，并且都受到噪声水平的影响。尽管指标对于模型比较和参考是有用的，但在实践中专家对地震图的定性视觉评估仍然是必不可少的。结果表明，SNR2对去噪过程中去除的信号量非常敏感。当去除的信号能量与噪声能量相当时，即使地震图显示几乎干净的图像，SNR2值也会变得非常低。此外，一些反射波（如直达波）具有非常高的振幅，这些反射波没有被模型有效地重建，可能会导致误差占主导地位。因此，为了获得更高的SNR2值，模型必须在去除噪声的同时不损失信号。这对于深度学习模型在地震数据去噪中的应用仍然是一个具有挑战性的问题。

表7. 图6和图7中所示地震图的SNR2和PSNR结果。
| 噪声水平 | FCNN-5 | SNR2 | PSNR2 |
|--------|------|------|------|
| L1 | 0.57 | 0.67 | 4.46 |
| L2 | 0.57 | 0.67 | 4.17 |
| L5 | 0.22 | 0.87 | 3.02 |
| L10 | 0.57 | 0.50 | 3.42 |
| SRGEN-4 | 0.56 | 0.65 | 3.52 |

下载：下载高分辨率图片（3MB）
下载：下载全尺寸图片

图6. FCNN-5在SEISMIC A和NOISE 1下的结果：(a) L1, (b) L2, (c) L5, (d) L10

下载：下载高分辨率图片（3MB）
下载：下载全尺寸图片

图7. SRGEN-4在SEISMIC A和NOISE 1下的结果：(a) L1, (b) L2, (c) L5, (d) L10

6. 结论
本研究提出了一个地震去噪基准数据集，该数据集包含了通过过滤过程从真实数据中提取的真实膨胀噪声污染的合成地震数据。这个数据集旨在支持更广泛和更全面的基准测试工作，并促进新的深度学习模型的开发，以用于地震数据去噪。合成地震数据文件是通过两个不同的开源结构模型的地震响应的数值模拟生成的，用作干净地震数据。这些合成数据集与四个不同噪声水平的真实膨胀噪声文件结合使用。所提出的实验方案包括32个不同的实验，涵盖了所有可能的地震数据、噪声文件和噪声水平的组合，以确保同一实验的训练数据和测试数据中不会出现相同的特征。该实验方案是可复制的，可用于评估新的深度学习模型。噪声文件也可以与其他地震数据结合，生成新的含噪声地震数据。

在所提出的实验方案中测试了三种深度学习模型，其结果可以作为评估新模型的基准：一种全卷积神经网络（FCNN-5）以及两种更复杂的拓扑结构SRGEN-4和SRGEN-16，后者是基于SRGAN架构衍生出来的。所有模型都采用了监督学习方法进行训练，以干净数据为目标，并使用L1（FCNN-5）或L2损失（SRGEN）。这些模型能够即使在高噪声水平下也能进行去噪。在所有实验中，所有模型通过SNR2指标评估时都表现出了相似的性能。SRGEN-4模型是一种更复杂的拓扑结构，包含了一些改进措施，如批量归一化和残差连接，尽管它的可训练参数数量与FCNN-5模型大致相同。结果显示，PSNR指标受到噪声水平的影响，而提出的SNR2指标对去噪过程中的信号损失非常敏感。要获得更高的SNR2值，需要在不减少信号的情况下消除噪声，这对于深度学习模型在地震数据去噪中仍然是一个重大挑战。

本研究提出的基准数据集旨在促进新型深度学习方法的发展和比较。

CRediT作者贡献声明：
Pablo M. Barros：写作 - 审稿与编辑、资源整理、形式分析、数据管理
Roosevelt de L. Sardinha：写作 - 审稿与编辑、验证、软件开发、方法论研究、形式分析、数据管理
Giovanny A.M. Arboleda：写作 - 审稿与编辑、验证、软件开发、方法论研究、形式分析、数据管理
Lessandro de S.S. Valente：写作 - 审稿与编辑、可视化处理、数据管理
Isabelle R.V. de Melo：写作 - 审稿与编辑、可视化处理、验证、软件开发
Albino Aveleda：写作 - 审稿与编辑
André Bulc?o：写作 - 审稿与编辑、资源整理、形式分析、数据管理
Sergio L. Netto：写作 - 审稿与编辑、方法论研究
Alexandre G. Evsukoff：写作 - 原始草稿撰写、项目监督、方法论研究、概念化

联系信箱：

粤ICP备09063491号

热点排行