基于华北地震活动的机器学习地震事件分类

《Earthquake Science》：Seismic event classification in North China based on machine learning

【字体：大中小】 时间：2026年06月01日 来源：Earthquake Science 4.1

编辑推荐：

　　地震事件的自动化分类对于地震监测与爆炸检测至关重要，特别是在华北此类构造活跃且地震(earthquake)与爆炸(explosion)波形特征高度相似的地区。本研究比较了基于特征机器学习(ML)与基于图像深度学习(DL)方法在事件级(event-level)与

地震事件的自动化分类对于地震监测与爆炸检测至关重要，特别是在华北此类构造活跃且地震(earthquake)与爆炸(explosion)波形特征高度相似的地区。本研究比较了基于特征机器学习(ML)与基于图像深度学习(DL)方法在事件级(event-level)与台站级(station-level)分类框架下的表现。数据集包含1,847个事件及超过43,000条垂直分量波形，分别以40维特征向量输入ML模型和谱图(spectrogram)图像输入DL模型。结果表明事件级模型一致优于台站级模型，准确率(Accuracy)超过98%；台站级模型表现亦高于94%。在测试集上ML与DL模型表现相当；然而ML模型展现出更好的泛化能力与更低的计算需求，而DL模型需较少人工干预。误分类分析揭示了不同模型类型具有差异化的错误模式，表明二者存在互补性。这些发现强调了依据输入类型、数据粒度及泛化需求选择模型的重要性。尽管DL模型适用于自动化处理，ML方法为实际部署提供了更稳健高效的解决方案。

《Seismic event classification in North China based on machine learning》论文解读——发表于《Earthquake Science》

一、研究背景与意义

传统地震事件（构造地震与爆炸、矿震等人为事件）分类依赖人工分析P波与S波振幅比、频率成分等波形特征，但在华北地区中小震级或复杂地质背景下，二者波形特征重叠严重，且现代地震台网产出海量数据使人工及基于规则的方法不再适用。虽然深度学习(Deep Learning, DL)如卷积神经网络(Convolutional Neural Network, CNN)可自动提取特征，但其存在"黑箱"、泛化能力受限、计算成本高等问题；而基于特征的机器学习(Machine Learning, ML)方法（如XGBoost）在可解释性与计算效率上有优势。目前缺乏在同一华北数据集上对两类方法进行系统对比（含事件级与台站级框架）。因此，研究人员开展了此项对比研究，旨在明确不同输入形式（特征向量vs谱图）、不同数据划分策略下ML与DL模型的性能、泛化能力及误分类特点，为地震监测系统的模型选型提供依据。

二、主要关键技术方法

研究人员使用中国地震台网中心(China Earthquake Networks Center, CENC)获取的华北地区1,847个事件（1,022个构造地震tectonic earthquake标记为类别0，825个爆炸explosion标记为类别1）共43,029条垂向(Vertical, Z)分量波形记录（震中距20–400 km，信噪比Signal-to-Noise Ratio, SNR 2–400）。预处理包括去均值、去趋势、最大幅值归一化、1–20 Hz带通滤波及P波到时对齐开窗。按事件整体分配（防数据泄露）划分为事件级(event-based)训练集(80%)与测试集(20%)；台站级(station-based)则随机划分单条波形。构建两类数据集：(1)基于广义S变换(Generalized S-transform, GST, λ=1.2, p=0.6)生成512×512 RGB谱图输入EfficientNet-B0（加载ImageNet预训练权重，Adam优化器，余弦退火学习率，类别交叉熵损失）；(2)提取40维统计与时频谱特征（含拐角频率corner frequency、P/S最大振幅比、过零率zero-crossing rate、谱比spectral ratio等）输入XGBoost（网格搜索与交叉验证调参，正则化目标函数）。评估指标含精确率(Precision)、召回率(Recall)、F1值、准确率及混淆矩阵，并在独立时空外推测试集（2021–2022年数据）上检验泛化能力。

三、研究结果

5.1. Classification results（分类结果）

事件级模型（Model 1: XGBoost特征驱动；Model 2: EfficientNet谱图驱动）总体准确率分别达98%与99%，F1值均为0.98与0.99；台站级模型（Model 3: XGBoost；Model 4: EfficientNet）准确率分别为95%与94%。XGBoost训练与推理时间（约770 s / 0.02 s）远短于EfficientNet（约190,373 s / 880 s）。事件级优于台站级归因于多台站多数投票(majority voting)降低单台噪声影响。结论：特征基ML模型在计算效率和准确率间取得最佳平衡，适合业务部署；图像基DL模型免去人工特征工程但计算代价高昂。

5.2. Misclassification analysis（误分类分析）

事件级上XGBoost误分5个地震与1个爆炸，EfficientNet误分2个地震与2个爆炸，且重叠于XGBoost的误分样本中。台站级两类模型对各类的误分类重叠率均低于20%（地震类83/437≈18.86%，爆炸类65/346≈18.79%），表明ML与DL捕捉的是波形不同方面信息——ML对模糊物理统计特征敏感，DL对异常时频模式敏感，具互补性。误分类多发生于近台站距(0–40 km)、低SNR([0,20])及微震级(M_L1.0–1.5)，XGBoost在远场（280–400 km）表现略优。结论：两模型错误模式独立，支持混合或集成策略提升分类性能。

5.3. Model generalization ability analysis（模型泛化能力分析）

在独立测试集（182个地震+160个爆炸，7,477条波形）上，事件级XGBoost保持97%准确率（地震F1=0.98，爆炸F1=0.97），推理仅0.03 s；EfficientNet降至90%且地震Recall降至0.81，推理667.79 s。台站级XGBoost准确率91%，EfficientNet降至87%（地震Recall=0.80）。结论：特征基ML模型在分布偏移下泛化更稳定，适合资源受限的实时监测；DL模型泛化下降可能与训练数据规模及区域多样性不足有关。

四、讨论与结论（翻译结论部分）

本研究利用华北地区构造地震与爆炸事件的地震波形记录构建了基于特征与基于图像的数据集，在台站级与事件级框架下分别采用XGBoost与EfficientNet对机器学习与深度学习方法在地震事件分类中的有效性进行了综合评价。原始测试集结果显示，XGBoost在特征数据集上达到95%的总体准确率，EfficientNet使用谱图表示达到94%，二者表现相当。但在计算效率与实现复杂度上存在显著差异：XGBoost在各类别间提供均衡的预测能力及更优的可解释性，尽管需适度的人工特征提取干预；相比之下，EfficientNet以最小的人工操作处理波形衍生谱图，但代价是显著更长的训练与推理时间，可能限制其在实时监测中的应用。事件级分类模型得益于减轻单台站误分的多数投票机制，在准确率与鲁棒性上均优于台站级模型。台站级模型（模型3与模型4）虽达94%以上准确率，但事件级模型（模型1与模型2）性能更高，超98%。此外，事件级误分类分析显示更一致的F1值平衡与更小的类间偏差，尤其对爆炸事件检测。为评估泛化性能，模型在2021–2022年独立数据集上测试：XGBoost保持高准确率（91%）与稳定类平衡，而EfficientNet准确率降至87%，且对爆炸事件（类别1）的召回率显著降低。此差异凸显ML方法更强的泛化能力，表明基于特征的模型在真实数据分布偏移下可能提供更强的鲁棒性。此外，误分类分析揭示两模型误差样本重叠极小，说明ML与DL方法捕获了地震波形数据的互补信息，为开发混合分类框架（如XGBoost快速初筛+EfficientNet精细分类）提供了理论支撑。综上，基于特征的模型特别是事件级范式下，在当前数据集条件下展现了更强泛化能力、更好类平衡及更高计算效率，更适合地震监测系统业务化部署。DL模型虽在自动化与离线准确率上有优势，但在泛化与计算成本上的局限需进一步改进方可可靠用于实时应用。这些结论基于有限规模与区域多样性的数据集，新地理区域的泛化性能可能不同，模型选择应慎重考虑分类结构、数据表征及目标事件预期变异性，需在扩大与多样化数据集上进一步评估自动化地震事件分类系统的业务可靠性。

热点排行