通过局部选择性组合并行自编码器识别地球化学异常:整合自编码器、变分自编码器及AE-1SVM以实现精准的金属勘探定位

《Applied Geochemistry》:Recognizing geochemical anomalies by locally selective combination of parallel autoencoders: Integrating AE, VAE, and AE-1SVM for robust metal exploration targeting

【字体: 时间:2026年06月19日 来源:Applied Geochemistry 3.4

编辑推荐:

  泽伊娜布·索尔塔尼|侯赛因·哈萨尼|阿尔德希尔·赫扎尔卡尼|赛义德·埃斯马埃洛格利 伊朗德黑兰阿米尔卡比尔理工大学矿业工程系 **摘要** 深度学习模型已成为识别与矿化相关的地球化学异常的主要技术,因为它们能够从非线性地球系统及复杂的统计分布中提取多元素地球化学数据

  泽伊娜布·索尔塔尼|侯赛因·哈萨尼|阿尔德希尔·赫扎尔卡尼|赛义德·埃斯马埃洛格利
伊朗德黑兰阿米尔卡比尔理工大学矿业工程系

**摘要**
深度学习模型已成为识别与矿化相关的地球化学异常的主要技术,因为它们能够从非线性地球系统及复杂的统计分布中提取多元素地球化学数据的深层特征表示。在各类深度学习技术中,自编码器骨干模型因能以无监督方式运行,从而规避了需要标记训练数据集的监督策略所带来的实际限制,因此在地球化学勘探中尤为适用。然而,在地球化学异常检测中存在一个关键挑战:不同的基于自编码器的检测器在不同的地质结构及高度复杂的频率分布下可能产生不一致的异常模式。当仅依据单一模型生成的异常图来划定目标区域时,这可能会误导金属勘探的方向。为解决这一由模型本身带来的不确定性问题,本研究提出了局部选择性并行自编码器组合方法(LSCPAE),该方法通过局部选择性并行异常体集成策略,整合了三种基于自编码器的异常检测器——自编码器、变分自编码器以及基于自编码器的一类支持向量机。该流程被应用于伊朗东北部费扎巴德地区的河流沉积物地球化学数据,通过对比自编码器、变分自编码器、AE-1SVM以及LSCPAE模型生成的异常值,进而确定有利于金铜矿勘探的空间区域。成功率曲线分析表明,LSCPAE生成的异常图在目标定位方面的性能优于单独使用自编码器骨干模型或软投票法(作为一种全局集成策略)。研究结果表明,LSCPAE模型能有效降低模型不确定性,为后续金属勘探提供风险更低的依据。

**引言**
深度学习模型近年来已成为地球化学勘探中的主流技术,因为它们能够自动识别具有复杂非线性特征的地球系统中各地球化学元素之间的抽象模式与复杂关联(Xu等人,2025b;Zuo等人,2019;Zuo和Xiong,2020)。在区域尺度的地球化学勘探中,元素浓度数据往往呈现高度偏态的概率分布(Reimann和Filzmoser,2000)、混合的地球化学背景群体(Zhao等人,2024),以及与乘积级联地质过程相关的非线性地质模式(Agterberg,2007)。这些特性使得传统的基于阈值的方法、线性分解方法或手工设计的特征提取方法难以有效建模与矿化相关的多元素异常模式。相比之下,深度学习技术能够学习多元素数据的更高层次表征,从而即便面对高度复杂的频率分布,也能对非线性地球系统产生的复杂地球化学模式进行建模(Wang和Chen,2025;Xiong和Zuo,2016;Zhang和Zuo,2021)。这一能力在区域尺度勘探中尤为重要,因为在这些领域中,地球化学元素通常具有复杂的概率分布和非线性关系(Zuo等人,2019;Zuo和Xiong,2018)。

随着深度学习技术的不断发展,多种架构已被成功应用于地球化学异常识别与矿床远景预测(Yang等人,2024;Zuo等人,2019及相关文献)。深度学习在地球化学异常检测中的应用始于2016年左右,主要是通过深度自编码网络来识别复杂的多元素异常模式(Xiong和Zuo,2016)。卷积神经网络(如Li等人,2020;Wu等人,2022;Zhang等人,2021;Zuo和Xu,2024)以及循环神经网络(如Xu等人,2025a、2024;Zuo等人,2021)也在建模区域尺度地球化学数据的空间关联与序列依赖性方面展现出优异性能。近期,生成对抗网络(如Luo等人,2021;Luo和Zuo,2025;Zhang和Zuo,2021)以及图神经网络(如Guan等人,2022;Yang和Chen,2025;Zhao等人,2022)也被引入,用于提升复杂地球化学系统中的特征提取与异常识别能力。然而,在各类深度学习架构中,自编码器骨干技术已成为无监督识别与矿化相关的地球化学异常的主流算法(如Xiong和Zuo,2016;Zuo和Xiong,2018;Chen等人,2019;Zhang等人,2019;Luo等人,2020、2023;Wang等人,2020;Yin等人,2021;Xiong等人,2022;Feng等人,2022;Esmaeiloghli等人,2023;Zhao等人,2023;Esmaeiloghli等人,2024;Soltani等人,2024;Luo和Zuo,2025)。经过良好训练的自编码器网络可以通过将原始输入信号压缩到低维潜在空间,再从这些压缩特征中重建原始元素浓度数据,从而学习地球化学特征表示(Xiong和Zuo,2016)。在这一机制中,重建出的地球化学信号反映了非线性地球系统的典型特征,即由不同地质过程形成的地球化学背景群体的多元素特征(Hoseinzade等人,2026;Soltani等人,2024)。因此,重建误差可被用来量化地球化学异常值,因为那些重建出的多元素信号质量较差的地球化学样本可被视为偏离了背景结构(Esmaeiloghli等人,2023;Xiong和Zuo,2016)。深度自编码器(又称堆叠自编码器,AE;Hinton和Salakhutdinov,2006)与变分自编码器(VAE;Kingma和Welling,2013)等变体则进一步提升了特征学习的灵活性,有助于更准确地识别地球化学异常。

尽管各种基于自编码器的技术具有诸多优势,但仅依赖单一模型仍可能在异常检测结果中引入模型不确定性。不同的基于深度学习的异常检测方法对地质环境、采样密度以及地球化学数据分布的反应可能存在差异,从而导致不一致的异常模式及勘探优先级(Feng等人,2022;Hoseinzade等人,2025;Mirzabozorg等人,2026;Soltani等人,2025)。这种不一致性可能在划定进一步金属勘探的目标区域时成为重要的不确定性来源,尤其是在缺乏或仅有少量真实参考数据的新兴勘探区域。近期研究强调了在地球化学异常检测中采用集成学习与不确定性感知的工作流程(Wang和Zuo,2024及相关文献)。这些研究表明,通过整合多个基础学习器的输出,集成学习方法能够提升地球化学调查数据中异常检测结果的稳健性(如Cao等人,2025;Chen和Chen,2023;Shahrestani等人,2025;Zheng等人,2025)。现有的策略大致可分为全局融合方法(如Wang和Zuo,2022;Zheng等人,2025)与局部选择性融合方法(如Shahrestani等人,2025)。全局融合方法,如平均法或投票法,采用固定规则整合所有检测器,实现简单,但可能忽视地球化学调查数据中的局部差异。相比之下,局部选择性组合策略能够根据局部数据结构自适应地选择适合每个测试样本的优质异常检测器,从而更好地适应空间上变化的异常模式。多项近期研究已证实,基于集成的组合策略在地球化学异常识别中具有显著优势。Chen等人(2021)指出,整合多个异常检测器可减少模型生成的地球化学异常模式之间的差异。Wang和Zuo(2022)进一步探讨了通过贝叶斯机制降低异常检测结果不稳定性的实用策略。Li等人(2024)与He和Chen(2025)则从模型组合的角度出发,说明整合不同类型的异常检测器能够提升预测能力,为复杂地球科学数据集中的勘探目标定位提供更可靠的依据。类似地,Zheng等人(2025)采用了基于隔离森林的异常检测器之间的软投票策略来降低模型稳定性。他们强调,在成矿系统中不同算法产生不一致的异常图时,必须考虑不确定性因素。此外,Shahrestani等人(2025)证明,局部自适应策略在构建集成异常检测模型方面优于全局组合规则。他们表明,局部自适应技术能够为每个测试实例附近选择合适的检测器,这在异常模式具有空间非稳定性且受多种成矿过程控制的情况下尤为重要。这些研究结果均表明,通过利用多个学习器提供的互补信息,可以有效降低单个异常检测器中的模型不确定性。

基于上述问题,本研究提出了一种集成学习框架,通过整合不同自编码器模型产生的异常模式,以解决前述的模型不确定性问题。该框架整合了三种基于自编码器的异常检测器,即自编码器、变分自编码器以及基于自编码器的一类支持向量机,并采用局部选择性并行异常体集成策略。所开发的局部选择性并行自编码器组合方法(LSCPAE)旨在通过选择局部最优的基础检测器而非依赖单一的全局融合规则,从而生成更为可靠的异常值。我们将该模型应用于伊朗东北部费扎巴德地区河流沉积物样本的多元素浓度数据,以识别与金铜矿化相关的地球化学异常。同时,我们还采用了软投票法作为传统的全局融合策略,以此作为基准,评估全局与局部集成规则在识别地球化学异常方面的有效性。通过成功率曲线对LSCPAE、软投票法以及各类独立基于自编码器的模型的性能进行了对比,从而判断每种模型在缩小下一轮金属勘探目标范围方面的有效性。

**方法部分节选**
**方法论**
LSCPAE框架是基于自编码器、变分自编码器以及AE-1SVM模型之间的局部选择性组合而开发的,用于多元素异常检测。该方法的整体工作流程如图1所示。框架的主要组成部分将在以下小节中详细阐述。

**地质背景**
费扎巴德地区位于伊朗东北部,面积约为940平方公里。根据St?cklin(1968)定义的地质构造格局,该地区属于伊朗中部地带,处于卢特构造带的上段。研究区域的整体地貌为第三纪火山岩与火山碎屑岩,覆盖在侏罗纪和白垩纪的沉积岩层之上。第三纪火山岩及火山-沉积岩在該地区有出露……

**执行工具与编程**
本研究开发了一套结构清晰、端到端的程序代码,采用Python编程语言(版本3.8.8)及PyOD库(Zhao等人,2019b)进行编写与实现,旨在简化并加速LSCPAE的计算过程。所使用的Python解释器与集成开发环境分别为Anaconda(conda版本4.12.0)和Jupyter Notebook。该程序在一台配备第11代Intel(R) Core(TM) i5 @ 2.40 GHz处理器、四核八线程的笔记本电脑上运行。

**结论**
本研究提出了LSCPAE这一局部选择性并行自编码器组合方法,用以降低识别与矿化相关的地球化学异常时的模型不确定性,从而为金属勘探目标定位提供有力支持。通过利用费扎巴德地区的多元素地球化学数据,我们对三种基于自编码器的异常检测器——自编码器、变分自编码器以及AE-1SVM进行了训练,使其能够学习地球化学调查数据的深层特征表示并生成异常值。随后,这些异常值通过某种融合方法被整合起来……

**CRediT作者贡献声明**
泽伊娜布·索尔塔尼:形式分析、研究设计、方法论、软件实现、验证、可视化、论文撰写——初稿完成。
侯赛因·哈萨尼:指导监督、论文撰写——审阅与修改。
阿尔德希尔·赫扎尔卡尼:指导监督、论文撰写——审阅与修改。
赛义德·埃斯马埃洛格利:概念构思、软件实现、指导监督、论文撰写——审阅与修改。

**利益冲突声明**
作者声明不存在任何可能影响本文研究工作的已知财务利益或个人关系。

**致谢**
作者衷心感谢主编Elisa Sacchi博士、副编辑以及两位匿名审稿人提出的宝贵意见与建设性反馈,这些意见极大地提升了本文的质量。本研究中所使用的河流沉积物地球化学数据与地质资料均由伊朗地质调查局收集,作者对此表示诚挚的感谢。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号