《Computers and Geotechnics》:Intelligent inversion of soil mechanical parameters driven by impact penetration data: An explainable transfer learning method
编辑推荐:
获取黏聚力(c)、内摩擦角(φ)、密度(ρ)、杨氏模量(E)及泊松比(v)等关键土体力学参数是开展岩土力学基础研究与实施岩土工程的先决条件。本文提出一种可解释迁移学习(explainable transfer learning)方法,通过将大规模数值模拟所获知
获取黏聚力(c)、内摩擦角(φ)、密度(ρ)、杨氏模量(E)及泊松比(v)等关键土体力学参数是开展岩土力学基础研究与实施岩土工程的先决条件。本文提出一种可解释迁移学习(explainable transfer learning)方法,通过将大规模数值模拟所获知识迁移至稀疏试验实测数据,实现由冲击贯入数据反演土体力学参数。首先,研究人员采用耦合欧拉?拉格朗日(coupled Eulerian-Lagrangian, CEL)有限元法建立涵盖砂土与黏土广泛土性范围的数据集;其次,应用人工神经网络(artificial neural network, ANN)、一维卷积神经网络(one-dimensional convolutional neural network, 1D-CNN)及双向循环神经网络(bidirectional recurrent neural network, Bi-RNN)捕捉贯入仪动态响应(加速度与锥尖阻力)与土体力学参数间的映射关系;最后,该方法在模拟数据与试验数据存在域偏移(domain shift)情况下,实现对试验参数高效且精确的反演,显著优于传统基于遗传算法(genetic algorithm, GA)的方法。五个参数的最大平均绝对百分比误差(mean absolute percentage error, MAPE)低于15%,平均MAPE低于10%。试验数据集仅含134组砂土样本,通常不足以支撑机器学习建模,而迁移学习使小样本下的精确反演成为可能。此外,研究人员采用沙普利加性解释(Shapley Additive exPlanations, SHAP)方法解释了双输入间的贡献竞争机制:测试集上两输入绝对SHAP值总和基本一致,原始SHAP值呈沿对称线完全对称且互补性弱,表明二者承载知识不重叠且变化趋势相反。本研究为获取岩土参数提供了一种稳健高精度方法,易于扩展至原位贯入测试(in-situ penetration testing)。
发表于《Computers and Geotechnics》的该研究针对传统室内试验取样扰动大耗时长、原位贯入测试设备繁琐成本高且无法直接给出土体力学参数、现有物理模型简化假设多且优化算法计算昂贵、纯机器学习反演依赖大量试验数据难以获取等瓶颈,提出并验证了一种基于冲击贯入(impact penetration)动态响应数据、融合可解释迁移学习的土体五参数(黏聚力c、内摩擦角φ、密度ρ、杨氏模量E、泊松比v)智能反演方法,证实将大规模CEL数值模拟数据训练所得模型经迁移学习微调后可适应仅有百余组的室内冲击贯入试验数据,反演精度最大平均绝对百分比误差(MAPE)<15%、平均MAPE<10%,优于传统遗传算法反演,并通过SHAP分析揭示了加速度与锥尖阻力两类输入特征对反演结果的独立贡献机制,为灾害现场或难达区域无人机搭载小型贯入仪快速获取土体力学参数提供了可解释的高精度技术途径。
研究人员采用的关键技术方法包括:(1)基于耦合欧拉?拉格朗日(coupled Eulerian-Lagrangian, CEL)有限元法建立三维冲击贯入数值模型,生成覆盖砂土与黏土广域物性范围的源域(source domain)模拟数据集(含贯入仪加速度及锥尖阻力时程与对应土体五参数);(2)分别构建人工神经网络(ANN)、一维卷积神经网络(1D-CNN)及双向循环神经网络(Bi-RNN)模型学习模拟数据中动态响应—土体参数映射关系,经比较选定最优源模型;(3)以室内落锤冲击贯入试验获取的134组砂土样本(目标域(target domain),含加速度与锥尖阻力及对应室内标准试验测得五参数)进行微调(fine-tuning)的迁移学习,使源模型适配试验数据分布;(4)采用沙普利加性解释(SHAP)方法量化加速度与锥尖阻力输入特征对各输出参数的贡献度及相互作用。
Numerical modeling(数值建模)
研究人员采用耦合欧拉?拉格朗日(CEL)方法建立三维冲击贯入有限元模型以复现贯入过程并控制计算量,CEL可容纳大变形而不致严重网格畸变,适用于涉及显著土体流动的贯入及土?结构相互作用问题;据此开展参数扫描生成覆盖砂土与黏土不同c、φ、ρ、E、v组合的源域数据集,输出为贯入过程中锥尖阻力与加速度时程曲线及对应土体参数。
Learning model construction(学习模型构建)
在获得模拟数据集后,研究人员分别采用ANN、1D-CNN和Bi-RNN三种神经网络架构构建从锥尖阻力与加速度时程直接反演土体五参数的学习模型,通过比较各模型在模拟验证集上的表现确定最优网络结构作为迁移学习的预训练(源)模型,并对模型进行初步精度评估。
Transfer learning on test data(试验数据上的迁移学习)
研究人员以室内冲击贯入试验数据集(134组砂土样本,目标域)对预训练源模型进行迁移学习(微调层权重偏置以适应试验数据分布),对比迁移前后及与传统基于遗传算法(GA)反演方法的精度差异,结果显示迁移学习模型在五个参数上的MAPE最大值<15%、平均值<10%,显著优于GA方法,证明数值模拟知识可有效迁移至多域偏移的小样本试验数据。
Conclusions(结论)
研究人员得出如下结论:(1) 所提可解释迁移学习方法能高效、高精度且稳健地由冲击贯入数据反演土体力学参数;(2) 在模拟数据上预训练再经小样本试验数据微调的迁移策略克服了试验数据不足限制;(3) SHAP分析表明加速度与锥尖阻力输入的绝对贡献相当,原始SHAP值沿对称线完全对称且互补性弱,说明二者携带非重叠知识且变化趋相反;(4) 该方法具备推广至原位贯入测试(in-situ penetration testing)的潜力。
讨论总结
论文讨论指出,传统获取土体力学参数手段存在取样扰动(室内试验)或设备昂贵周期长(原位试验)弊端,纯数据驱动机器学习受限于高质量试验数据稀缺,而本研究借助CEL数值模拟生成大样本源域数据训练模型并以迁移学习弥合模拟—试验间域偏移,突破了小样本试验下精确反演难题;SHAP解释增强了"黑箱"模型在工程中的可信度;未来可结合更多土类及现场原位数据进一步验证普适性。研究结论原文翻译如下:本文围绕冲击贯入数据驱动的土体力学参数反演展开,通过可解释迁移学习模型表征贯入仪动态响应时程与土体力学参数间的关系,实现了试验参数高效、高精度及稳健的反演,SHAP分析进一步阐明输入特征贡献,支持以下结论:(1) 在所用神经网络架构中……(原文逐项列于Conclusions小节,此处依前述结论要点总结转述)——即该方法可实现高精度反演、迁移学习克服小样本限制、双输入特征具非重叠反向变化的对称贡献机制,且方法易扩展至原位贯入测试。