准确的岩石/岩性识别(RI/LI)和工程岩体特性分析(RMC)对于关键基础设施项目(如深隧道施工、边坡稳定和资源开采)的地质技术安全性和经济效益至关重要(Bressan等人,2020年;Xu等人,2024a)。传统方法依赖于人工记录、专家解释和标准化分类系统(Gong等人,2025年;Yu等人,2025年),但这些方法已越来越难以满足现代工程需求。这些方法存在三个主要局限性:1)地质参数评分的主观性(例如节理间距、岩石质量判定),导致稳定性评估结果不一致(Wu等人,2023a;Zheng等人,2018年);2)无法大规模处理多源数据,因为深部地下项目会产生大量来自TBM监测、高分辨率岩心成像和多传感器钻孔记录的数据(Wang等人,2024b;Yu等人,2025年);3)对复杂地质条件的适应性差,传统经验模型无法捕捉岩性、不连续性和力学行为之间的非线性关系(Chen等人,2020b;Tao等人,2019年;Zhang等人,2025b)。因此,项目面临成本超支、进度延误和安全事故的风险增加,尤其是在地质不确定性较大的深部挖掘中。因此,迫切需要自动化、数据驱动的框架来提高工程决策的一致性、可扩展性和预测准确性。
机器学习(ML)作为一种变革性技术,为多模态数据融合、非线性关系建模和跨领域知识转移提供了强大的能力(Bosquez等人,2022年;Hansen和Aarset,2024年)。虽然已有大量关于ML在岩性识别、测井数据解释(Ayawah等人,2022年)、岩心图像分类(Koeshidayatullah等人,2023年)和基于遥感的地图绘制(Zhu等人,2024年)应用的文献,但在将这些技术系统地应用于工程RMC方面仍存在空白。尽管一些综述(Jin等人,2025年;Osarogiagbon等人,2021年;Zhu等人,2024年)已经整理了ML算法在RI/LI中的应用,但这些研究大多将其视为地质勘探的孤立环节,未系统地探讨如何将RI/LI结果转化为岩体质量指标。然而,RMC需要整合地质属性、结构不连续性和原位应力条件来预测力学行为和稳定性(Gifford和Agah,2010年;Xie等人,2021年)。这种脱节导致RI/LI仅能识别岩石类型,而RMC却无法确定其在工程载荷下的行为。如果不解决这一差距,ML在地质设计中的潜力将无法充分发挥。
两个趋势的结合进一步凸显了这一桥梁的必要性:首先,RI/LI不仅用于识别岩石类型,还用于确认地质模型是否符合实际条件,防止过度保守的支护设计,并识别局部薄弱区域或偏离“连续良好岩石”假设的断层。随着传感器技术的发展(例如,隧道掘进机(TBM)监测系统生成实时岩体响应数据(Wu等人,2021b);高分辨率3D裂缝数据(Luo等人,2024年);多传感器钻孔记录(Zhang & Wang,2023年),数据量大幅增加。此外,ML架构已从传统模型演进为能够处理异构数据流和复杂地质关系的深度学习框架(Jing等人,2025a;Lu等人,2025年)。尽管ML在岩性识别方面表现出高准确性(Chen等人,2025a),但其应用于RMC仍处于起步阶段且零散。主要挑战包括:1)将岩性标签转化为工程属性(例如,将“花岗岩”转化为可量化的强度参数);2)将稀疏的地质测量数据(例如节理方向调查)与密集的地质数据整合;3)在数据稀缺和区域差异条件下确保模型鲁棒性(Dawson等人,2023年;He等人,2023年)。这些挑战不仅仅是技术上的,它们直接影响边坡稳定性预测和隧道支护设计的可靠性。
本文系统地评估了为RI/LI开发的ML技术如何适应、定制和扩展到工程RMC,填补了这一关键空白。与以往将两者视为独立领域的综述不同,我们明确关注数据、模型和工作流程的转化路径:如何重新设计RI/LI的数据、模型和工作流程以解决RMC特定问题(例如,从岩心图像或TBM数据预测RMR分数)。我们定义的差距不仅仅是RMC应用的缺乏,更是缺乏将RI/LI输出(岩石类型)转化为RMC输入(力学参数)的工作流程。我们的分析基于三个工程目标:
(1) 优先考虑减少对专家依赖性的方法,并与现场工作流程集成,以提高实际部署能力(例如,实时TBM数据处理(Yu等人,2025年);
(2) 确保输出直接为设计参数提供信息(例如,岩体强度、变形模量);
(3) 提高安全关键决策的不确定性量化能力(Zhuang等人,2024年)。
通过综合过去二十五年的研究,我们追踪了ML从RI/LI到RMC的演变路径,强调了技术的成功之处以及需要改进的地方。典型例子包括使用卷积神经网络(CNN)进行岩心图像不连续性检测(Tse等人,2025年),以及将地质物理原理纳入RI/LI或RMC的损失函数中(Markus等人,2025年;Song等人,2025年;Zhang等人,2024a)。我们认为,最有前景的RMC路径是结合CNN进行空间特征提取和图神经网络(GNN)来建模不连续性网络(Sun等人,2025d),或将变换器与特定领域约束结合进行稳定性预测(Hou等人,2024年;Tse等人,2025年;Xie等人,2024年;Zhang和Wang,2023年)。这些方法超越了“黑箱”分类,提供了可操作的工程洞察,直接解决了传统方法在复杂项目中的局限性。
为了组织这一分析,本文按照图1所示的系统框架进行。第2节首先总结了地质分类和识别系统之间的联系和差异。第3节详细介绍了研究方法,包括关键研究问题、系统文献回顾协议和识别该跨学科领域趋势和知识差距的文献计量分析。第4节探讨了两个领域的当前ML应用,从共享数据源和预处理方法开始,然后比较了通用建模方法及其特定领域的适应性。第5节阐述了从RI/LI到工程RMC的过渡框架,并提供了一个简单示例。第6节指出了连接RI/LI和RMC的关键挑战,包括多模态数据整合和注释复杂性、模型架构设计的演变趋势,以及鲁棒不确定性量化和模型可解释性的必要性。第7节提出了旨在提高ML驱动解决方案工程适用性的未来研究方向。