面向小样本高异质性条件下隧道涌水量预测的可解释混合智能方法：GAN(生成对抗网络)增广与群智能优化CatBoost(Categorical Boosting)

《Infrastructures》：Explainable Hybrid Intelligence for Predicting Tunnel Water Inrush Quantity Under Small-Sample, High-Heterogeneity Conditions: GAN Augmentation and Swarm-Optimized CatBoost

【字体：大中小】 时间：2026年06月10日 来源：Infrastructures 2.9

编辑推荐：

　　摘要：本研究旨在探索一种考虑渗漏感知且可解释的机器学习框架，用于在样本量少且地质条件高度异质性的情况下预测隧道涌水量(Water Inrush Quantity, WWI或WIQ)。研究人员基于某项目级数据集，按每30 m开挖段固定空间粒度整合超前预报输出、掌

摘要：本研究旨在探索一种考虑渗漏感知且可解释的机器学习框架，用于在样本量少且地质条件高度异质性的情况下预测隧道涌水量(Water Inrush Quantity, WWI或WIQ)。研究人员基于某项目级数据集，按每30 m开挖段固定空间粒度整合超前预报输出、掌子面观测及地质报告，选取六个水文地质—构造指标预测涌水量(m3/h)。为克服数据稀缺并提升泛化能力，引入表格生成对抗网络(Tabular Generative Adversarial Network, GAN)对训练分布进行增广以保留边际统计量及变量间依赖性，并采用群智能优化器调优分类提升(Categorical Boosting, CatBoost)回归器以获得稳定性能。此外，在相同协议下对六种主流基于树的学习器进行基准测试，并通过结合SHapley加性解释(SHAP)归因、偏依赖图与个体条件期望(PDP/ICE)诊断及交互曲面的多级可解释性套件确保模型透明性。结果表明，在当前固定划分下，训练集增广改善了基线学习器的性能，所提混合模型取得了令人鼓舞的留出集精度。但由于数据集仅含55个真实样本且测试集仅含11个真实样本，报告性能应视为初步的项目特异性指示而非泛化可靠性的有力证据。可解释性分析进一步确定岩性及反射层相关因子为主导驱动因素，揭示了非线性响应模式及交互敏感的高危区域。总体而言，所提框架显示出提升该项目预测性能及工程可解释性的潜力，可为排水与加固方案规划提供参考，其在更广泛应用前尚需通过重复数据划分、增加样本及外部验证进一步确认。

论文解读：面向小样本高异质性的隧道涌水量预测——GAN增广与群智能优化CatBoost的可解释混合智能框架

一、研究背景与立项依据

隧道涌水突泥（Water Inrush）是地下工程建设中极具破坏性的灾害，可从渗流迅速演变为突水淹没，引发掌子面失稳、设备损毁及工期延误。传统评估手段包括地质勘察、超前预报（如TSP地震波、地质雷达）定性判识、经验半经验公式（如科斯加科夫公式等）及渗流—应力耦合数值模拟，但分别受限于分辨率与量化困难、场地校准局限、计算与输入负担大等问题。近年数据驱动人工智能（AI）方法虽能拟合水文地质—构造指标与涌水量（Water Inrush Quantity, WIQ）间的非线性映射，但仍存在三大瓶颈：（i）样本稀缺与采样偏倚致过拟合，常规增广（如简单加噪）破坏水文地质物理量相关性；（ii）超参数寻优多靠经验试错，未针对隧道数据非凸崎岖搜索空间系统验证；（iii）可解释性缺失或仅用单一方法（如仅SHAP），且与隧道涌水地质机制脱节。现有研究多只做单点技术改进（仅GAN、仅优化或仅简单可解释性），缺乏面向"小样本—高异质性"特征的端到端协同优化框架。为此，研究人员以福建浦延高速YA15段隧道群55组30 m段实测数据为依托，构建集成表格GAN(Tabular GAN)增广、非对称线性变加速粒子群优化（AsyLnCPSO）调优CatBoost及多级可解释性分析（SHAP、PDP/ICE、3D PDP）的混合智能预测与决策支持框架，并在《Infrastructures》期刊发表。

二、主要关键技术方法

研究人员选用福建浦延高速YA15段钻爆法隧道工程55个有效样本（每一样本对应30 m开挖段），融合超前地质预报、掌子面观测及地质勘察报告，以反射层分布系数(RDC)、地下水发育系数(GDC)、岩层产状(AR)、裂隙开度(FO)、地层岩性系数(SLC)及隧道埋深(TD)六指标为输入，实测涌水量WIQ(m³/h)为输出。整体流程为：(1)固定80/20划分训练集(44)/测试集(11)，测试集全程隔离防泄漏；(2)对原始数据进行完整性、分布、Pearson相关系数与方差膨胀因子(VIF)诊断排除多重共线性；(3)六类基线树模型（Random Forest、Gradient Boosting、AdaBoost、XGBoost、LightGBM、CatBoost）于原始训练集默认参数建模验证过拟合；(4)仅在训练集上以联合特征—目标空间(X, y)训练表格GAN做20倍增广（44→880样本），检验边际分布、相关性结构保真度；(5)Critical Difference(CD)法统计排序选最优基线，CEC2022基准函数比选三种改进PSO变种（AsyLnCPSO、BreedPSO、CLSPSO）选最优优化器；(6)以最小化五折交叉验证均方误差(MSE)为目标，用AsyLnCPSO搜索CatBoost树深(1–10)、L2正则项(1–20)、学习率(0.01–0.30)得AsyLnCPSO–CatBoost混合模型；(7)对混合模型做SHAP全局/局部归因、单变量PDP/ICE曲线及SLC–RDC双变量三维PDP交互面多级可解释性分析。

三、研究结果

5.1. Performance of Baseline Models on the Original Dataset（原始数据集上基线模型性能）

六树种模型于原始44样本训练集R²近1（LightGBM最低为0.563），测试集性能剧降（AdaBoost最佳R²=0.797，XGBoost与LightGBM仅0.463/0.358），证实小样本致严重过拟合，原始55样本不足以支撑稳健WIQ预测模型，需训练集专用增广。

5.2. Effect of Training-Only Data Augmentation（仅训练集数据增广效果）

GAN于联合空间(X,y)生成合成样本使训练集扩至880例，各输入指标与WIQ边际分布、经验累积分布及相关系数矩阵均与原始训练集高度吻合，填充原稀疏区间且保留变量间物理耦合。增广比例敏感性分析显示：无增广→5×/10×/20×测试平均R²升至0.921，RMSE、MAE、MAPE下降；30×/40×性能回落。本数据集20倍为经验最优折衷（样本丰富度与统计保真度平衡），但属项目特异非普适最优。

5.3. Optimization Algorithm and Baseline Model Selection（优化算法与基线模型遴选）

三种PSO变种于六组CEC2022基准函数测试中AsyLnCPSO收敛速度与逃离局部最优能力最优。CD图（CD=3.37）显示CatBoost于六基线中统计排名最高、泛化最稳，选为基学习器。

5.4. Developing Hybrid Intelligence（混合智能模型构建）

AsyLnCPSO寻得CatBoost最优超参：树深=3，学习率=0.06，L2正则=1（五折CV-MSE=0.6309）。全量增广训练集重训后，训练集R²=0.9988、RMSE=0.1608 m³/h、MAE=0.1083 m³/h、MAPE=0.5381%；独立测试集R²=0.9774、RMSE=0.6736 m³/h、MAE=0.3779 m³/h、MAPE=1.9207%。因测试集仅11真实例且合成样本源于44训练例，高R²应视为本项目内初步潜力证据。

5.5. Comprehensive Comparison of Model Performance（模型性能综合比较）

增广后基线模型测试性能普遍改善（XGBoost R²=0.962最优，CatBoost R²=0.960紧随）。三种PSO–CatBoost混合模型中AsyLnCPSO–CatBoost测试表现最佳（较最优增广基线XGBoost R²提1.54%、RMSE降0.151 m³/h、MAE降0.097 m³/h），BreedPSO–CatBoost次之，CLSPSO–CatBoost稍弱，表明群智能超参调优有价值且AsyLnCPSO对该任务探索—开发平衡更优。

5.6. Interpretability Evaluation（可解释性评估）

SHAP全局重要性：SLC(岩性系数)占48.2%为首要驱动（破碎岩体裂隙网络主导导水通道），RDC(反射层分布系数)占15.7%呈负向（反射层均匀分布代表构造扰动弱、裂隙少），FO(裂隙开度)占14.2%正向（开度增→渗流阻力减），GDC(8.7%)、TD(隧道埋深,8.0%)、AR(岩层产状,4.7%)贡献较低，符合工点水文地质条件。PDP/ICE显示SLC与WIQ强单调正相关但具边际递减（裂隙网络发育饱和效应），FO呈阈值阶跃非负线性且ICE离散反映裂隙连通性差异，RDC缓降负向，AR/TD近水平低离散印证次要作用。SLC–RDC三维PDP交互面揭示：高SLC时岩性主控（即使RDC增大WIQ仍高），低SLC时构造(RDC)调节作用显著——符合碎裂岩体与完整岩体中水文地质控制层级关系，为分区防控提供依据。

四、讨论与结论翻译

讨论部分指出局限性：真实样本仅55例(测试11例)，固定单次划分无法完全表征划片敏感性；GAN仅基于44训练例拟合且未做逐折重训练生成器，存合成样本依赖与罕见大涌水表征不足可能；五折CV仅用于超参调优而非重复划分/嵌套重采样/外部验证；当前为确定性点预测未给预测区间或分位数以应对风险决策；SHAP等为模型条件关联非因果证明。未来方向含多项目跨区外部验证与域适应、概率预测（分位数回归/CatBoost、 conformal prediction(保形预测)或贝叶斯集成）提供WIQ置信区间、条件GAN或物理约束增广保留尾部分布及逐折重训练协议、结合渗流/裂隙网络模拟的机制一致性可解释性深化。

结论翻译：本研究旨在开发可靠且可解释的混合智能框架，用于在样本少且地质高异质性条件下预测隧道涌水量(WIQ)，将表格GAN数据增广、群智能优化及多级机器学习可解释性技术集成于统一流程，基于钻爆法隧道工程55样本项目级数据集开展基线测试、增广验证、优化器基准、混合建模及可解释性评估。(1) 55样本原始数据集显小样本特征致所有选定树基模型严重过拟合，训练集拟合优但测试集骤降，反映模型仅记忆有限模式未学水文地质—构造指标与涌水量内在关联。(2) 仅施于训练集的GAN增广拓展学习空间并缓解样本稀缺，增广大致保留原始数据统计分布与变量间耦合模式，测试集全程隔离降低信息泄露风险。(3) Critical Difference分析证CatBoost于六基模型中统计排名最优，选作后续混合模型基学习器。(4) 三种改进PSO变体中AsyLnCPSO基准表现最佳，选作CatBoost超参优化器。(5) 所提AsyLnCPSO–CatBoost混合模型于当前数据划分与项目数据集同类对比中数值性能最优；但因实测测试集仅11样本且未经多划分或跨项目外部验证，该结果视为潜在实用性初步证据而非泛化可靠性确证。(6) 集成SHAP、PDP与ICE曲线的多级可解释套件给出混合模型所学特征—响应关系的透明事后证据，识别主导驱动因子、非线性模式及关键交互效应，提升模型可解释性并为隧道工程提供项目级决策支持洞见。

热点排行