《Applied Computing and Geosciences》:An end-to-end deep learning approach for epicentral distance and magnitude determination from single station waveforms
编辑推荐:
摘要:传统的单台站地震参数估计高度依赖精确的P波和S波到时拾取,而这种依赖在实时场景中常常削弱速度与鲁棒性。为克服这些局限,研究人员提出了一种深度全卷积编码器-解码器网络,用于直接从三分量波形时间序列中同步估计震级和震中距。针对神经网络输入归一化与震级标度所需
摘要:传统的单台站地震参数估计高度依赖精确的P波和S波到时拾取,而这种依赖在实时场景中常常削弱速度与鲁棒性。为克服这些局限,研究人员提出了一种深度全卷积编码器-解码器网络,用于直接从三分量波形时间序列中同步估计震级和震中距。针对神经网络输入归一化与震级标度所需振幅信息丢失之间的冲突,研究人员引入了伪归一化策略。该方法在对输入波形进行归一化以促进训练的同时,保留归一化因子,使网络能够将波形形态特征与振幅标度解耦,从而实现高精度震级恢复。归一化后的波形被用作神经网络输入,以预测不包含绝对振幅的震中距和震级贡献。该架构采用堆叠卷积层与池化层自动提取波形特征,并在末端使用概率输出层,将预测建模为一维高斯分布(Gaussian Distribution),从而量化估计不确定性。模型在来自意大利的综合INSTANCE数据集上完成训练,并采用多时间窗策略模拟实时数据流。这使系统能够在台站触发后立即生成初始估计,并随着波形演化持续优化预测结果。在测试集上的评估结果表明,震级预测的平均绝对误差(Mean Absolute Error, MAE)为0.1977,震中距预测的MAE为1.67 km。上述结果表明,该端到端框架无需辅助震相拾取即可实现快速、可靠的参数估计,在提升地震预警(Earthquake Early Warning, EEW)系统能力方面具有显著潜力。
该论文发表于《Applied Computing and Geosciences》,聚焦于单台站地震预警场景下震级与震中距的快速联合反演问题。研究背景在于,地震具有突发性与不可预测性,地震预警(EEW)系统需要在破坏性S波到达前,利用最初数秒的波形信息尽快给出震源参数,为减灾决策争取提前量。与依赖多台站联合反演的区域型预警系统相比,单台站现场型系统在台站稀疏区、偏远地区以及网络解尚未形成的“盲区”具有不可替代的价值。然而,传统单台站参数估计高度依赖P波、S波到时拾取、仪器响应校正、场地修正以及经验衰减关系,计算流程复杂,且对数据质量敏感,在实时应用中往往面临速度与鲁棒性不足的问题。
近年来,深度学习在地震学中的快速发展,为从单台站波形中直接提取震源信息提供了新路径。卷积神经网络(CNN)已广泛用于地震检测与震相拾取,并逐步拓展到震中距估计与预警任务中。但对于震级预测而言,仍存在关键困难:神经网络训练通常需要对输入数据进行归一化处理,以加快收敛并稳定优化;然而震级本质上与绝对振幅密切相关,常规归一化会抹去刻画地震能量等级所必需的振幅尺度信息。因此,如何在保持端到端学习框架简洁性的同时保留震级判别所需的物理量,成为该方向的重要瓶颈。基于这一问题,研究人员提出了伪归一化策略,并将“相对震级”思想扩展至更具挑战性的单台站监测任务中,构建能够同步预测震中距与震级的深度全卷积编码器-解码器模型。
研究人员使用意大利国家地球物理与火山研究所(INGV)发布的INSTANCE数据集开展研究。该数据集覆盖2005—2020年意大利及周边地区地震事件,包含大规模三分量波形与完备元数据。为契合快速现场预警需求,研究人员仅保留宽频带地震仪记录、震中距为0–120 km的样本,并剔除存在明显缺口、不连续或异常振幅尖峰的记录,最终构建约30万条高质量地震波形样本。所有波形统一采样率后,经1.0–10.0 Hz带通滤波、降采样至40 Hz,并截取P波到时前2 s至后20 s的固定时间窗。论文的核心创新在于伪归一化处理:对每个三分量样本计算全局峰值绝对振幅,并以该峰值对原始波形进行归一化,使输入落入统一数值区间;同时保留峰值振幅的对数形式作为额外物理约束。这样一来,归一化波形主要保留形态、频率与相对时序信息,用于学习传播路径、P-S时差及衰减特征,而归一化因子则保留地震事件绝对能量尺度信息,用于震级恢复。研究人员并未将该因子直接注入网络结构,而是在标签层面引入“相对震级”概念,使网络学习不含绝对振幅的震级贡献,最终在后处理阶段将网络输出与对数振幅因子相加,以恢复物理震级。
研究采用的主要关键技术方法包括:基于INSTANCE数据集构建事件级划分的训练集与测试集,避免同一地震事件在不同台站记录间造成数据泄漏;使用伪归一化与相对震级标签解耦策略,在保持网络训练稳定性的同时保留震级估计所需振幅物理约束;建立深度全卷积编码器-解码器(FCN)架构,通过多层卷积、池化与上采样实现三分量波形到震中距和震级概率分布的端到端映射;采用一维高斯概率密度函数(PDF)对连续标签进行软编码,并以最大后验(MAP)方式解码;设计多时间窗实验,模拟台站触发后的实时数据流,评估不同预警时延下模型精度变化。
在网络结构方面,研究人员构建了一个对称的“U形”深度全卷积编码器-解码器架构。输入层接收标准化后的三分量时间序列,维度为1024×3。编码器由4个下采样阶段组成,每个阶段包含两层连续卷积与一层最大池化,逐步压缩时间维并提升特征通道数,将原始序列映射到长度为32的高维特征表示。瓶颈层设置10层连续卷积,在不引入额外池化的条件下进行深层非线性特征融合,以扩大感受野并捕获波形中的长程依赖与跨尺度信息。解码器则通过上采样与卷积恢复时间分辨率,最终输出两个通道的一维序列,分别对应震级与震中距的概率分布表示。输出层采用Sigmoid激活函数,将输出限制在0到1区间,用于描述归一化尺度上的概率密度。模型训练使用Adam优化器,并引入早停策略防止过拟合。
结果部分显示,该模型在独立测试集上取得了较高精度。研究结果:Magnitude Prediction。研究人员在10,000个独立测试样本上评估模型,得到震级预测MAE为0.1977。散点图显示预测值与真实值总体沿1:1对角线分布,说明模型能够较稳定地恢复地震能量等级。论文指出,多数样本的预测误差控制在
±0.2量级,符合EEW和实时监测常用精度要求。输出的概率分布通常呈清晰单峰形态,且在较大震级事件上分布更尖锐,表明模型对强事件能量特征的提取具有较高置信度。
研究结果:Epicentral Distance Prediction。对于震中距预测,模型实现了1.6730 km左右的MAE。在0–120 km监测范围内,该误差水平表明模型能够较精确地完成相对于台站的震源距离估计。散点分布紧贴对角线,说明一维卷积结构成功提取了与P-S差时及传播衰减相关的判别特征,并建立了其与震中距之间的非线性映射关系。
研究结果:Analysis of magnitude and epicentral distance prediction errors as a function of Signal-to-Noise Ratio (SNR)。研究人员进一步分析了信噪比(SNR)对预测误差的影响。结果表明,随着SNR升高,震级与震中距预测误差的离散程度均明显减小,并逐渐向零收敛。在高SNR条件下,模型可稳定提取清晰波形中的振幅与震相信息;在低SNR条件下,误差虽然上升,但并未出现性能崩溃。论文据此认为,伪归一化保留的绝对能量信息以及FCN本身的滤波能力,共同提高了模型对噪声的耐受性。对于震中距而言,低SNR环境下S波初至更易被背景噪声和P波尾波掩盖,因此距离误差相较震级对噪声更加敏感。
研究结果:Comparison of typical waveform inputs and model-predicted probability distributions under different Signal-to-Noise Ratio (SNR) conditions。通过高、低SNR代表性样本的对比,研究人员展示了模型输出概率分布对数据质量变化的响应机制。在高SNR样本中,震级和距离预测的概率密度函数(PDF)峰值尖锐且与真实值高度重合;在低SNR样本中,尽管模型仍能给出接近真实值的预测,但输出分布显著变宽、变平,反映出模型通过概率宽度表达了由噪声引入的不确定性。这说明该方法不仅提供点估计,还能为EEW系统提供更丰富的风险判据。
研究结果:Comparison of prediction performance based on different post-P-wave time window lengths (16s–6s)。为检验不同响应时延下的实用性能,研究人员对16 s、14 s、12 s、10 s、8 s和6 s多个P波后时间窗进行了重训练与测试。结果显示,随着输入窗口缩短,震级与震中距误差总体增大。其中14 s窗口表现最佳,震级MAE为0.2121,震中距MAE为1.7564 km;当窗口短于10 s时,误差增长更明显;在极端6 s条件下,震级MAE升至0.4659,震中距MAE升至4.4865 km。尽管如此,模型仍能提供具有预警意义的初步估计,说明即便高度截断的初始波形中仍包含可用于快速判别的重要约束信息。
研究结果:Truncation Effect。论文重点讨论了短时间窗下震中距预测的“截断效应”。对于近距离事件,由于S波紧随P波到达,即使在6 s窗口内也可能包含S波能量,因此模型仍可利用S-P差时进行准确估计;而对于远距离事件,S-P差时随距离增加而显著变长,在6 s或8 s窗口中输入常只含P波与部分尾波,完全缺失S波到达信息。此时模型只能依赖P波频散与衰减特征进行粗略推断,从而导致远距离预测出现饱和或截断现象。通过同一事件在14 s与6 s窗口下的概率分布对比,研究人员直观展示了这一点:长窗口下距离PDF收敛准确,而短窗口下因S波缺失而出现分布发散甚至多峰,表明模型在信息不足时会以更低置信度输出估计结果。
讨论部分主要围绕方法优势、物理机制与局限性展开。首先,该研究突破了传统单台站方法对人工特征提取、震相拾取和外部辅助参数的依赖,实现了从三分量波形到震级与震中距的端到端直接映射。其次,伪归一化策略有效缓解了深度学习训练稳定性与震级振幅物理约束之间的矛盾,使模型能够同时利用波形“形状”信息与“尺度”信息开展联合反演。再次,概率分布形式的输出增强了模型对不确定性的表达能力,更契合实际预警业务中风险分级与阈值判定的需求。论文也指出了现实限制:数据集中大震样本稀缺,且真实标签混合使用局地震级与矩震级,这可能在大震情形下引发标度饱和与低估风险。尽管卷积网络可通过持续时间与频谱特征部分缓解仅依赖峰值振幅的问题,但该模型对大地震的泛化能力尚未得到充分实证。未来研究将考虑引入基于物理模拟的合成波形、迁移学习、注意力机制(Attention Mechanism)、Transformer以及图神经网络(Graph Neural Network, GNN)等,以提升对大震与跨区域场景的适应性。
结论部分可译为:地震预警(EEW)的核心挑战在于,尤其在单台站监测约束下,如何在波到后的关键数秒内准确估计震源参数。该研究针对震级与震中距的快速联合预测问题提出了一套系统性解决方案。通过构建深度全卷积编码器-解码器网络,研究人员摆脱了传统方法对人工特征提取与辅助参数(如震源深度)的依赖,建立了从三分量波形时间序列到震源参数的直接映射。这种不依赖多台站约束的特性,使所提模型在火山区、偏远边境地区等台站稀疏区域具有特别重要的应用价值,即使仅有单个传感器触发,也能够支持可靠的灾害评估。该研究的关键创新在于伪归一化策略,有效解决了神经网络稳定训练与物理振幅信息保留之间的内在冲突。通过将对数变换后的归一化因子整合进特征空间,该方法使模型能够“感知”原始信号的绝对能量水平,从而显著提升震级预测精度。基于大规模INSTANCE数据集的验证结果表明,该模型在震级预测上实现了0.1977的平均绝对误差(MAE),在震中距预测上实现了1.67 km的MAE,证明其具备服务于高精度实时EEW应用的可行性。