面向小样本高异质性条件下隧道涌水量预测的可解释混合智能方法:GAN(生成对抗网络)增广与群智能优化CatBoost(Categorical Boosting)

《Infrastructures》:Explainable Hybrid Intelligence for Predicting Tunnel Water Inrush Quantity Under Small-Sample, High-Heterogeneity Conditions: GAN Augmentation and Swarm-Optimized CatBoost

【字体: 时间:2026年06月10日 来源:Infrastructures 2.9

编辑推荐:

  摘要:本研究旨在探索一种考虑渗漏感知且可解释的机器学习框架,用于在样本量少且地质条件高度异质性的情况下预测隧道涌水量(Water Inrush Quantity, WWI或WIQ)。研究人员基于某项目级数据集,按每30 m开挖段固定空间粒度整合超前预报输出、掌

  
摘要:本研究旨在探索一种考虑渗漏感知且可解释的机器学习框架,用于在样本量少且地质条件高度异质性的情况下预测隧道涌水量(Water Inrush Quantity, WWI或WIQ)。研究人员基于某项目级数据集,按每30 m开挖段固定空间粒度整合超前预报输出、掌子面观测及地质报告,选取六个水文地质—构造指标预测涌水量(m3/h)。为克服数据稀缺并提升泛化能力,引入表格生成对抗网络(Tabular Generative Adversarial Network, GAN)对训练分布进行增广以保留边际统计量及变量间依赖性,并采用群智能优化器调优分类提升(Categorical Boosting, CatBoost)回归器以获得稳定性能。此外,在相同协议下对六种主流基于树的学习器进行基准测试,并通过结合SHapley加性解释(SHAP)归因、偏依赖图与个体条件期望(PDP/ICE)诊断及交互曲面的多级可解释性套件确保模型透明性。结果表明,在当前固定划分下,训练集增广改善了基线学习器的性能,所提混合模型取得了令人鼓舞的留出集精度。但由于数据集仅含55个真实样本且测试集仅含11个真实样本,报告性能应视为初步的项目特异性指示而非泛化可靠性的有力证据。可解释性分析进一步确定岩性及反射层相关因子为主导驱动因素,揭示了非线性响应模式及交互敏感的高危区域。总体而言,所提框架显示出提升该项目预测性能及工程可解释性的潜力,可为排水与加固方案规划提供参考,其在更广泛应用前尚需通过重复数据划分、增加样本及外部验证进一步确认。
论文解读:面向小样本高异质性的隧道涌水量预测——GAN增广与群智能优化CatBoost的可解释混合智能框架
一、研究背景与立项依据
隧道涌水突泥(Water Inrush)是地下工程建设中极具破坏性的灾害,可从渗流迅速演变为突水淹没,引发掌子面失稳、设备损毁及工期延误。传统评估手段包括地质勘察、超前预报(如TSP地震波、地质雷达)定性判识、经验半经验公式(如科斯加科夫公式等)及渗流—应力耦合数值模拟,但分别受限于分辨率与量化困难、场地校准局限、计算与输入负担大等问题。近年数据驱动人工智能(AI)方法虽能拟合水文地质—构造指标与涌水量(Water Inrush Quantity, WIQ)间的非线性映射,但仍存在三大瓶颈:(i)样本稀缺与采样偏倚致过拟合,常规增广(如简单加噪)破坏水文地质物理量相关性;(ii)超参数寻优多靠经验试错,未针对隧道数据非凸崎岖搜索空间系统验证;(iii)可解释性缺失或仅用单一方法(如仅SHAP),且与隧道涌水地质机制脱节。现有研究多只做单点技术改进(仅GAN、仅优化或仅简单可解释性),缺乏面向"小样本—高异质性"特征的端到端协同优化框架。为此,研究人员以福建浦延高速YA15段隧道群55组30 m段实测数据为依托,构建集成表格GAN(Tabular GAN)增广、非对称线性变加速粒子群优化(AsyLnCPSO)调优CatBoost及多级可解释性分析(SHAP、PDP/ICE、3D PDP)的混合智能预测与决策支持框架,并在《Infrastructures》期刊发表。
二、主要关键技术方法
研究人员选用福建浦延高速YA15段钻爆法隧道工程55个有效样本(每一样本对应30 m开挖段),融合超前地质预报、掌子面观测及地质勘察报告,以反射层分布系数(RDC)、地下水发育系数(GDC)、岩层产状(AR)、裂隙开度(FO)、地层岩性系数(SLC)及隧道埋深(TD)六指标为输入,实测涌水量WIQ(m3/h)为输出。整体流程为:(1)固定80/20划分训练集(44)/测试集(11),测试集全程隔离防泄漏;(2)对原始数据进行完整性、分布、Pearson相关系数与方差膨胀因子(VIF)诊断排除多重共线性;(3)六类基线树模型(Random Forest、Gradient Boosting、AdaBoost、XGBoost、LightGBM、CatBoost)于原始训练集默认参数建模验证过拟合;(4)仅在训练集上以联合特征—目标空间(X, y)训练表格GAN做20倍增广(44→880样本),检验边际分布、相关性结构保真度;(5)Critical Difference(CD)法统计排序选最优基线,CEC2022基准函数比选三种改进PSO变种(AsyLnCPSO、BreedPSO、CLSPSO)选最优优化器;(6)以最小化五折交叉验证均方误差(MSE)为目标,用AsyLnCPSO搜索CatBoost树深(1–10)、L2正则项(1–20)、学习率(0.01–0.30)得AsyLnCPSO–CatBoost混合模型;(7)对混合模型做SHAP全局/局部归因、单变量PDP/ICE曲线及SLC–RDC双变量三维PDP交互面多级可解释性分析。
三、研究结果
5.1. Performance of Baseline Models on the Original Dataset(原始数据集上基线模型性能)
六树种模型于原始44样本训练集R2近1(LightGBM最低为0.563),测试集性能剧降(AdaBoost最佳R2=0.797,XGBoost与LightGBM仅0.463/0.358),证实小样本致严重过拟合,原始55样本不足以支撑稳健WIQ预测模型,需训练集专用增广。
5.2. Effect of Training-Only Data Augmentation(仅训练集数据增广效果)
GAN于联合空间(X,y)生成合成样本使训练集扩至880例,各输入指标与WIQ边际分布、经验累积分布及相关系数矩阵均与原始训练集高度吻合,填充原稀疏区间且保留变量间物理耦合。增广比例敏感性分析显示:无增广→5×/10×/20×测试平均R2升至0.921,RMSE、MAE、MAPE下降;30×/40×性能回落。本数据集20倍为经验最优折衷(样本丰富度与统计保真度平衡),但属项目特异非普适最优。
5.3. Optimization Algorithm and Baseline Model Selection(优化算法与基线模型遴选)
三种PSO变种于六组CEC2022基准函数测试中AsyLnCPSO收敛速度与逃离局部最优能力最优。CD图(CD=3.37)显示CatBoost于六基线中统计排名最高、泛化最稳,选为基学习器。
5.4. Developing Hybrid Intelligence(混合智能模型构建)
AsyLnCPSO寻得CatBoost最优超参:树深=3,学习率=0.06,L2正则=1(五折CV-MSE=0.6309)。全量增广训练集重训后,训练集R2=0.9988、RMSE=0.1608 m3/h、MAE=0.1083 m3/h、MAPE=0.5381%;独立测试集R2=0.9774、RMSE=0.6736 m3/h、MAE=0.3779 m3/h、MAPE=1.9207%。因测试集仅11真实例且合成样本源于44训练例,高R2应视为本项目内初步潜力证据。
5.5. Comprehensive Comparison of Model Performance(模型性能综合比较)
增广后基线模型测试性能普遍改善(XGBoost R2=0.962最优,CatBoost R2=0.960紧随)。三种PSO–CatBoost混合模型中AsyLnCPSO–CatBoost测试表现最佳(较最优增广基线XGBoost R2提1.54%、RMSE降0.151 m3/h、MAE降0.097 m3/h),BreedPSO–CatBoost次之,CLSPSO–CatBoost稍弱,表明群智能超参调优有价值且AsyLnCPSO对该任务探索—开发平衡更优。
5.6. Interpretability Evaluation(可解释性评估)
SHAP全局重要性:SLC(岩性系数)占48.2%为首要驱动(破碎岩体裂隙网络主导导水通道),RDC(反射层分布系数)占15.7%呈负向(反射层均匀分布代表构造扰动弱、裂隙少),FO(裂隙开度)占14.2%正向(开度增→渗流阻力减),GDC(8.7%)、TD(隧道埋深,8.0%)、AR(岩层产状,4.7%)贡献较低,符合工点水文地质条件。PDP/ICE显示SLC与WIQ强单调正相关但具边际递减(裂隙网络发育饱和效应),FO呈阈值阶跃非负线性且ICE离散反映裂隙连通性差异,RDC缓降负向,AR/TD近水平低离散印证次要作用。SLC–RDC三维PDP交互面揭示:高SLC时岩性主控(即使RDC增大WIQ仍高),低SLC时构造(RDC)调节作用显著——符合碎裂岩体与完整岩体中水文地质控制层级关系,为分区防控提供依据。
四、讨论与结论翻译
讨论部分指出局限性:真实样本仅55例(测试11例),固定单次划分无法完全表征划片敏感性;GAN仅基于44训练例拟合且未做逐折重训练生成器,存合成样本依赖与罕见大涌水表征不足可能;五折CV仅用于超参调优而非重复划分/嵌套重采样/外部验证;当前为确定性点预测未给预测区间或分位数以应对风险决策;SHAP等为模型条件关联非因果证明。未来方向含多项目跨区外部验证与域适应、概率预测(分位数回归/CatBoost、 conformal prediction(保形预测)或贝叶斯集成)提供WIQ置信区间、条件GAN或物理约束增广保留尾部分布及逐折重训练协议、结合渗流/裂隙网络模拟的机制一致性可解释性深化。
结论翻译:本研究旨在开发可靠且可解释的混合智能框架,用于在样本少且地质高异质性条件下预测隧道涌水量(WIQ),将表格GAN数据增广、群智能优化及多级机器学习可解释性技术集成于统一流程,基于钻爆法隧道工程55样本项目级数据集开展基线测试、增广验证、优化器基准、混合建模及可解释性评估。(1) 55样本原始数据集显小样本特征致所有选定树基模型严重过拟合,训练集拟合优但测试集骤降,反映模型仅记忆有限模式未学水文地质—构造指标与涌水量内在关联。(2) 仅施于训练集的GAN增广拓展学习空间并缓解样本稀缺,增广大致保留原始数据统计分布与变量间耦合模式,测试集全程隔离降低信息泄露风险。(3) Critical Difference分析证CatBoost于六基模型中统计排名最优,选作后续混合模型基学习器。(4) 三种改进PSO变体中AsyLnCPSO基准表现最佳,选作CatBoost超参优化器。(5) 所提AsyLnCPSO–CatBoost混合模型于当前数据划分与项目数据集同类对比中数值性能最优;但因实测测试集仅11样本且未经多划分或跨项目外部验证,该结果视为潜在实用性初步证据而非泛化可靠性确证。(6) 集成SHAP、PDP与ICE曲线的多级可解释套件给出混合模型所学特征—响应关系的透明事后证据,识别主导驱动因子、非线性模式及关键交互效应,提升模型可解释性并为隧道工程提供项目级决策支持洞见。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号