综述：机器学习在岩石/岩性识别与工程岩体特性分析中的应用前景：综述

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《TUNNELLING AND UNDERGROUND SPACE TECHNOLOGY》：Application prospect of machine learning bridging rock/lithology identification and engineering rock mass characterization: A review

【字体：大中小】 时间：2026年04月24日 来源：TUNNELLING AND UNDERGROUND SPACE TECHNOLOGY 7.4

编辑推荐：

　　机器学习在岩石识别与工程岩体表征中的应用研究，系统分析248篇文献，揭示中国占主导（60%以上），技术聚焦日志分析（31%）、岩石分类（28%）及深度学习（25%），新兴方向为transformers（12%）和可解释性ML（8%），但存在多模态数据整合（43%）、计算成本（37%）及实际鲁棒性（29%）挑战，需开放数据（18%）、轻量模型（22%）及物理原则结合（15%）。

曾勇|周雄|杨宇游|刘晓阳|杨江波

中国地质大学（北京）工程技术学院，北京100083，中华人民共和国

摘要

机器学习（ML）越来越多地应用于岩石/岩性识别（RI/LI）和工程岩体特性分析（RMC），但现有研究往往缺乏系统的整合和跨领域泛化能力，这限制了其在工程实践中的应用。本文通过问题驱动的文献计量学和全面的内容分析方法，系统地分析了从Web of Science Core Collection数据库中检索到的248篇核心出版物。主要研究发现表明，自2018年以来，相关研究产出呈指数级增长，其中中国贡献了超过60%的出版物。主题关键词分析显示，研究重点集中在测井数据、岩性分类和深度学习上，同时对变换器（transformers）和可解释的ML模型也给予了关注。尽管多模态数据整合（如岩心图像、测井数据、遥感数据、隧道参数）显著提高了模型准确性，但在数据对齐、计算成本和实际应用鲁棒性方面仍存在关键挑战。研究强调，未来的发展需要开放的数据存储库、轻量级的可解释模型以及物理原理的更深入整合，从而实现更可靠的ML解决方案，以应对地质和工程挑战。

引言

准确的岩石/岩性识别（RI/LI）和工程岩体特性分析（RMC）对于关键基础设施项目（如深隧道施工、边坡稳定和资源开采）的地质技术安全性和经济效益至关重要（Bressan等人，2020年；Xu等人，2024a）。传统方法依赖于人工记录、专家解释和标准化分类系统（Gong等人，2025年；Yu等人，2025年），但这些方法已越来越难以满足现代工程需求。这些方法存在三个主要局限性：1）地质参数评分的主观性（例如节理间距、岩石质量判定），导致稳定性评估结果不一致（Wu等人，2023a；Zheng等人，2018年）；2）无法大规模处理多源数据，因为深部地下项目会产生大量来自TBM监测、高分辨率岩心成像和多传感器钻孔记录的数据（Wang等人，2024b；Yu等人，2025年）；3）对复杂地质条件的适应性差，传统经验模型无法捕捉岩性、不连续性和力学行为之间的非线性关系（Chen等人，2020b；Tao等人，2019年；Zhang等人，2025b）。因此，项目面临成本超支、进度延误和安全事故的风险增加，尤其是在地质不确定性较大的深部挖掘中。因此，迫切需要自动化、数据驱动的框架来提高工程决策的一致性、可扩展性和预测准确性。

机器学习（ML）作为一种变革性技术，为多模态数据融合、非线性关系建模和跨领域知识转移提供了强大的能力（Bosquez等人，2022年；Hansen和Aarset，2024年）。虽然已有大量关于ML在岩性识别、测井数据解释（Ayawah等人，2022年）、岩心图像分类（Koeshidayatullah等人，2023年）和基于遥感的地图绘制（Zhu等人，2024年）应用的文献，但在将这些技术系统地应用于工程RMC方面仍存在空白。尽管一些综述（Jin等人，2025年；Osarogiagbon等人，2021年；Zhu等人，2024年）已经整理了ML算法在RI/LI中的应用，但这些研究大多将其视为地质勘探的孤立环节，未系统地探讨如何将RI/LI结果转化为岩体质量指标。然而，RMC需要整合地质属性、结构不连续性和原位应力条件来预测力学行为和稳定性（Gifford和Agah，2010年；Xie等人，2021年）。这种脱节导致RI/LI仅能识别岩石类型，而RMC却无法确定其在工程载荷下的行为。如果不解决这一差距，ML在地质设计中的潜力将无法充分发挥。

两个趋势的结合进一步凸显了这一桥梁的必要性：首先，RI/LI不仅用于识别岩石类型，还用于确认地质模型是否符合实际条件，防止过度保守的支护设计，并识别局部薄弱区域或偏离“连续良好岩石”假设的断层。随着传感器技术的发展（例如，隧道掘进机（TBM）监测系统生成实时岩体响应数据（Wu等人，2021b）；高分辨率3D裂缝数据（Luo等人，2024年）；多传感器钻孔记录（Zhang & Wang，2023年），数据量大幅增加。此外，ML架构已从传统模型演进为能够处理异构数据流和复杂地质关系的深度学习框架（Jing等人，2025a；Lu等人，2025年）。尽管ML在岩性识别方面表现出高准确性（Chen等人，2025a），但其应用于RMC仍处于起步阶段且零散。主要挑战包括：1）将岩性标签转化为工程属性（例如，将“花岗岩”转化为可量化的强度参数）；2）将稀疏的地质测量数据（例如节理方向调查）与密集的地质数据整合；3）在数据稀缺和区域差异条件下确保模型鲁棒性（Dawson等人，2023年；He等人，2023年）。这些挑战不仅仅是技术上的，它们直接影响边坡稳定性预测和隧道支护设计的可靠性。

本文系统地评估了为RI/LI开发的ML技术如何适应、定制和扩展到工程RMC，填补了这一关键空白。与以往将两者视为独立领域的综述不同，我们明确关注数据、模型和工作流程的转化路径：如何重新设计RI/LI的数据、模型和工作流程以解决RMC特定问题（例如，从岩心图像或TBM数据预测RMR分数）。我们定义的差距不仅仅是RMC应用的缺乏，更是缺乏将RI/LI输出（岩石类型）转化为RMC输入（力学参数）的工作流程。我们的分析基于三个工程目标：

(1) 优先考虑减少对专家依赖性的方法，并与现场工作流程集成，以提高实际部署能力（例如，实时TBM数据处理（Yu等人，2025年）；

(2) 确保输出直接为设计参数提供信息（例如，岩体强度、变形模量）；

(3) 提高安全关键决策的不确定性量化能力（Zhuang等人，2024年）。

通过综合过去二十五年的研究，我们追踪了ML从RI/LI到RMC的演变路径，强调了技术的成功之处以及需要改进的地方。典型例子包括使用卷积神经网络（CNN）进行岩心图像不连续性检测（Tse等人，2025年），以及将地质物理原理纳入RI/LI或RMC的损失函数中（Markus等人，2025年；Song等人，2025年；Zhang等人，2024a）。我们认为，最有前景的RMC路径是结合CNN进行空间特征提取和图神经网络（GNN）来建模不连续性网络（Sun等人，2025d），或将变换器与特定领域约束结合进行稳定性预测（Hou等人，2024年；Tse等人，2025年；Xie等人，2024年；Zhang和Wang，2023年）。这些方法超越了“黑箱”分类，提供了可操作的工程洞察，直接解决了传统方法在复杂项目中的局限性。

为了组织这一分析，本文按照图1所示的系统框架进行。第2节首先总结了地质分类和识别系统之间的联系和差异。第3节详细介绍了研究方法，包括关键研究问题、系统文献回顾协议和识别该跨学科领域趋势和知识差距的文献计量分析。第4节探讨了两个领域的当前ML应用，从共享数据源和预处理方法开始，然后比较了通用建模方法及其特定领域的适应性。第5节阐述了从RI/LI到工程RMC的过渡框架，并提供了一个简单示例。第6节指出了连接RI/LI和RMC的关键挑战，包括多模态数据整合和注释复杂性、模型架构设计的演变趋势，以及鲁棒不确定性量化和模型可解释性的必要性。第7节提出了旨在提高ML驱动解决方案工程适用性的未来研究方向。

节选内容

地质分类和识别系统

准确分类和识别地质材料是地质科学研究和地质工程实践的基石（Bressan等人，2020年；Xu等人，2024a）。建立一套 robust 且系统的框架来表征岩石和岩体对于从资源勘探和地层对比到边坡稳定性和隧道设计等各种应用至关重要（Liu等人，2024年；Luo等人，2024年；Wu等人，2021a）。

研究问题

本文围绕一组关键研究问题展开，这些问题指导了对ML在RI/LI和工程RMC中应用的系统分析。这些问题基于第1节所述的背景和要求提出，旨在评估当前ML方法的技术能力和实际局限性。研究问题分为两个主题组（更多分组细节见图1）。RQ1和RQ2在第4节中进行了讨论。

数据来源和处理

明确数据来源和处理方法是ML应用的基本准备步骤。图6示意性地展示了基于数据的ML应用的基本流程，强调了数据类型、来源和预处理策略之间的关键相互作用。

将RI/LI与工程RMC连接起来

虽然已有大量研究将ML应用于RI/LI，形成了成熟的测井数据解释、岩心图像分类和基于遥感的地图绘制方法，但对这些数据驱动框架的系统扩展和适应工程RMC的关注相对较少。这种适应并非易事，因为工程RMC需要整合地质属性、原位应力条件和结构不连续性。

机会、挑战和未来方向

为了直观地总结讨论的挑战及其解决方案路径，提出了一个概念框架（图11）。该框架展示了从多模态数据源出发，经过数据、模型和系统层面的关键挑战，到实现稳健且实用工程应用所需的关键未来研究方向的演变过程。

结论

本文系统地探讨了ML在RI/LI和工程RMC中的应用前景，特别关注这两个领域的连接。与以往分别讨论这些领域的综述不同，本文指出了整合RI/LI方法到工程RMC应用的关键路径和障碍。基于对248篇核心出版物和新兴研究趋势的全面分析，得出了以下结论。

(1) 本文的主要贡献

CRediT作者贡献声明

曾勇：撰写 – 审稿与编辑、初稿撰写、可视化、软件开发、方法论设计、数据整理、概念化。周雄：撰写 – 审稿与编辑、验证、项目管理、调查、资金获取、概念化。杨宇游：验证、资源协调、项目管理、资金获取、正式分析。刘晓阳：撰写 – 审稿与编辑、方法论设计、调查、正式分析。杨江波：撰写 – 审稿与编辑。

利益冲突声明

作者声明没有已知的财务利益或个人关系可能影响本文的研究结果。

致谢

作者感谢所有审稿人的建设性意见和帮助。作者感谢国家自然科学基金（项目编号42577205）和中国中央高校基本科研业务费（项目编号2-9-2022-017）的支持。

联系信箱：

粤ICP备09063491号

摘要

引言