通过可解释机器学习、机械特征工程以及SHAP分析来提高钢筋混凝土(RC)柱的抗剪强度预测精度

《Journal of Building Engineering》:Enhancing the prediction of shear strength in RC columns using explainable machine learning with mechanical feature engineering and SHAP analysis

【字体: 时间:2026年04月21日 来源:Journal of Building Engineering 7.4

编辑推荐:

  剪切强度预测方法创新与模型可解释性研究。通过构建1025个剪切破坏RC柱样本库,采用六种机器学习算法,结合四项力学特征工程与基于SHAP分析的特征筛选,提出三阶段渐进建模策略,构建18个可解释ML模型。实验表明,所有ML模型均显著优于传统经验模型,其中XGBoost模型使用8个特征(含4个力学特征)实现训练集R2=0.998、测试集R2=0.981。SHAP分析揭示纵向钢筋剪切贡献机制与传统模型差异,四项力学特征贡献率达84%。

  
桂倩莉|常武
广西交通职业技术学院道路与桥梁工程学院,中国南宁市530216

摘要

为了提高钢筋混凝土(RC)柱剪切强度的预测精度,本研究提出了一种创新的可解释机器学习(ML)方法。研究使用了包含1025个发生剪切或剪切-弯曲破坏的RC柱试样的数据集,并采用了六种机器学习算法。开发了一种三阶段渐进式建模策略,该策略结合了四个基于力学原理的工程特征以及基于SHAP分析的顺序正向特征选择(SFFS)方法,最终构建了18个ML模型。结果表明,所有ML模型的预测精度均显著优于传统的经验模型。特征工程不仅提高了模型性能,还大幅降低了模型复杂性。仅使用八个输入特征(包括四个工程特征)的极端梯度提升(XGBoost)模型在训练集和测试集上的R2值分别为0.998和0.981。基于SHAP的解释显示,代表纵向钢筋剪切贡献的工程特征具有显著的正向影响。这一发现与大多数传统经验模型不同,因为这些模型通常不显式考虑纵向钢筋的影响。此外,代表混凝土、轴向压缩、纵向钢筋和箍筋(它们都具有与剪切强度相同的物理量纲)剪切贡献的四个工程特征共同解释了大约84%的平均绝对SHAP值,强调了它们的关键作用。使用SHAP对模型进行的详细解释为RC柱的剪切传递机制提供了宝贵的见解,从而有助于改进传统经验模型。

引言

钢筋混凝土(RC)柱是建筑物和桥梁等混凝土结构中的关键组成部分。当受到侧向荷载(特别是地震作用)时,RC柱的剪切破坏可能导致侧向强度降低、非弹性变形机制改变以及轴向承载能力丧失——在严重情况下最终导致结构倒塌[1]。因此,准确预测RC柱的剪切强度对于防止剪切引起的破坏、进行结构安全评估和规划有效的修复措施至关重要。几十年来,准确估算RC柱的剪切能力一直是地震工程的主要研究焦点。
当前的设计规范和研究人员提出了不同的控制因素和剪切强度模型估算方法。对于矩形柱,Priestley等人[2]、Eurocode 8 [3]和GB50010-2010 [4]等模型明确考虑了轴向荷载的拱效应。其他模型(包括Sezen和Moehle[1]、FEMA 273 [5]、NZS3101[6]、Caltrans [7]、JTG/T 2231-01-2020 [8]、Wei等人[9]、Qi等人[10]、Restrepo等人[11]、ASCE 41-23[12]和ACI 318-25[13])认为轴向压缩增强了裂缝混凝土中的骨料互锁和摩擦,从而增加了其剪切贡献,并将轴向力效应纳入混凝土剪切分量中。相比之下,日本的JRA规范[14]忽略了轴向荷载效应。大多数模型假设所有穿过对角裂缝的横向钢筋在破坏时都会屈服,JRA、Wei等人和Qi等人的模型除外。
尽管设计规范和研究人员提出了多种估算矩形柱剪切强度的经验模型,但仍存在一些局限性。首先,假设所有穿过关键对角裂缝的横向钢筋在破坏时都会屈服——这与实验观察结果[15]、[16]相矛盾——可能导致高估箍筋的剪切贡献。其次,除了Wei等人[9]提出的模型外,大多数模型未能明确考虑纵向钢筋提供的剪切阻力,这反映了对这一机制的关注不足。第三,低强度和高强度混凝土的力学性能与普通强度混凝土不同。然而,现有的经验模型主要是使用普通强度混凝土柱进行校准的,因此限制了它们对低强度或高强度混凝土柱的适用性。最后,RC柱在轴向压缩和循环荷载作用下的剪切行为非常复杂,导致现有模型在参数选择上存在显著差异[1]、[2]、[3]、[4]、[5]、[6]、[7]、[8]、[9]、[10]、[11]、[12]、[13]、[14]。此外,这些模型对特定参数非常敏感,而这些参数很难通过实验结果进行验证。综上所述,这些局限性导致传统经验模型在估算RC柱剪切强度时的预测存在较大偏差和不确定性(见第2.2节)。
因此,有必要引入更强大的建模方法来提高RC柱剪切强度预测的准确性。与传统经验模型不同,ML方法可以在不预先假设物理或数学模型的情况下,从数据样本中建立输入(例如基本结构设计参数)和输出(例如目标性能指标)之间的复杂映射[17]。近年来,基于ML的建模方法已成功应用于各种结构工程问题[18]、[19]、[20]、[21]、[22]、[23]。Feng等人[24]和Phan等人[25]分别使用254个和541个实验数据集证明了ML算法在估算RC柱侧向强度方面的有效性;然而,他们的研究没有包括模型的可解释性分析。Ma等人[26]基于427个RC柱测试数据集开发了一个高度精确的可解释ML模型,但机械特征与ML模型的集成尚未得到充分探索。
然而,目前关于RC柱剪切强度的ML研究仍存在以下显著局限性。首先,可用于训练的实验数据样本总数相对有限,特别是对于抗压强度超过60 MPa的高强度混凝土柱,这在一定程度上限制了模型的泛化能力和适用性。其次,缺乏对输入特征的系统性分析和选择,包括那些基于力学原理的特征,这阻碍了模型的进一步优化和简化。最后,未能实现机械特征与ML模型的深度集成,导致这些模型固有的“黑箱”性质未能得到充分解释,从而阻碍了对RC柱剪切机制的全面理解。
为此,本研究建立了一个包含1025个发生剪切或剪切-弯曲破坏的矩形RC柱的综合性实验数据库。采用了一套全面的ML框架——包括单个模型(支持向量回归和决策树)和集成方法(随机森林、极端梯度提升、轻量级梯度提升机和分类提升机)来建模和预测RC柱的剪切强度。通过基于力学的特征工程和基于SHAP分析的SFFS方法,设计了三组不同的输入特征组合,包括基于力学的工程特征。随后开发了18个ML模型,并应用贝叶斯优化来调整它们的超参数。本研究创新地将力学洞察与ML相结合用于剪切强度预测,并提供了对模型决策过程的深入解释。该研究提供了一种系统识别关键影响因素并阐明其控制RC柱剪切强度作用机制的新方法。

部分内容

RC柱数据库

为了开发准确的钢筋混凝土(RC)柱剪切强度预测模型并全面评估现有模型的适用性,需要一个全面且具有代表性的实验数据库。该数据库应涵盖影响剪切强度的关键参数,每个参数的覆盖范围应尽可能广泛,以确保所开发的模型具有强大的泛化能力和工程适用性。
因此,本研究

ML方法概述

本研究采用结合单个算法和集成学习方法的策略来开发矩形RC柱剪切强度的预测模型。单个算法是指基于单一ML算法独立训练和进行预测的模型,而不涉及多模型协作。相比之下,集成方法整合了多个基础学习器的预测结果来构建更优秀的预测模型。以下部分将简要介绍

ML模型的开发

本节详细介绍了开发用于预测RC柱剪切强度的ML模型的过程,包括特征工程、模型训练策略、性能评估和可解释性等关键步骤。

ML模型的预测性能

本节评估了用于预测RC柱剪切强度的18个ML模型的性能。所有模型主要使用四个指标进行评估:R2、MAPE、MAE和RMSE。它们在测试集、训练集和总集上的具体结果分别列在表6中。该表还列出了预测值与实验值之比的最小值、最大值、平均值和COV。第一阶段的模型包含了13个原始特征;第二阶段的模型扩展了特征

结论

本研究提出了一种用于预测RC柱剪切强度的可解释ML模型。基于一个涵盖RC柱广泛参数范围的综合性数据集(包括几何尺寸、混凝土强度、钢筋性能、细节和轴向荷载水平),系统评估了传统经验模型的预测精度。通过三阶段渐进式建模策略,使用六种算法开发了18个ML模型,并确定了最佳模型

CRediT作者贡献声明

常武:撰写——审稿与编辑、监督、项目管理、资金获取。桂倩莉:撰写——原始草稿、方法论、调查、正式分析

未引用的参考文献

[119]。

利益冲突

作者声明与本文的发表没有利益冲突。

竞争利益声明

作者声明与本文的发表没有利益冲突。

致谢

本研究的部分研究得到了国家重点研发计划(编号:2022YFC3801800)、国家自然科学基金(编号:52478146)以及广西普通高校中青年教师基础科研能力提升项目(编号:2023KY1161)的支持。作者衷心感谢所有赞助方的财务支持。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号