随机森林(Random Forest, RF)预测钢管混凝土(Concrete-Filled Steel Tube, CFST)受压承载力(Bearing Capacity)的机器学习(Machine Learning)方法研究
《Materials》:Machine Learning Prediction of the Compressive Bearing Capacity of Concrete-Filled Steel Tubes Using Random Forest
编辑推荐:
混凝土填充钢管(Concrete-Filled Steel Tube, CFST)构件因其高承载力和结构效率广泛应用于大跨及高层建筑中,其抗压承载力(Bearing Capacity, Nu)的精确预测对可靠设计至关重要。研究人员基于随机森林(Random F
混凝土填充钢管(Concrete-Filled Steel Tube, CFST)构件因其高承载力和结构效率广泛应用于大跨及高层建筑中,其抗压承载力(Bearing Capacity, Nu)的精确预测对可靠设计至关重要。研究人员基于随机森林(Random Forest, RF)算法开发了一种数据驱动预测模型,使用154组轴压试验数据,以几何尺寸、材料性能和截面特征共24个参数作为输入变量,并通过五折交叉验证(Five-Fold Cross-Validation)和超参数(Hyperparameter)调优优化模型。结果表明,所提模型具有较高精度和稳定性,训练集和测试集的预测值/试验值(Predicted-to-Experimental Ratio)均值分别为1.002和0.989,最大偏差在15%以内。与现有设计规范及其他机器学习方法相比,RF模型预测精度提升约9%且具备较强泛化能力。此外,利用九组CFST柱试验进行独立试验验证,确认其可靠性,预测误差在5%以内。研究证明该模型可为工程中CFST构件抗压承载力预测提供有效实用工具。
论文解读:基于随机森林(Random Forest, RF)算法的钢管混凝土(Concrete-Filled Steel Tube, CFST)轴压承载力(Bearing Capacity, Nu)机器学习(Machine Learning, ML)预测研究
研究背景与意义
钢管混凝土(Concrete-Filled Steel Tube, CFST)组合结构因具有高承载力、大刚度、良好抗震性能及经济效益,被广泛应用于桥梁、高层建筑及大跨度空间结构中。传统计算方法如叠加法(Superposition Theory)忽略钢与混凝土间的复杂相互作用(Interaction Effect),而统一理论(Unified Theory)数学推导复杂且依赖过多简化假定,二者在面对高强度材料、复杂应力状态或新型截面时适用性及精度均受限。精确预测CFST轴压极限承载力(Ultimate Bearing Capacity, Nu)是结构设计和安全评估的核心难题。经典支持向量机(Support Vector Machine, SVM)对小样本非线性问题表现较好但对超参数敏感且训练效率低;深度学习方法需海量数据且可解释性差,不适用于试验数据有限且要求物理可解释性的结构工程领域。随机森林(Random Forest, RF)作为集成学习(Ensemble Learning)方法,通过Bagging(Bootstrap Aggregating)降低过参数化风险,对中小规模数据集具强泛化能力,且可输出特征重要性(Feature Importance),兼顾精度与工程可解释性。本文针对CFST轴压承载力这一高度非线性、多参数耦合的回归问题,建立RF预测模型并以独立试验验证,旨在提供更精确且具力学洞察力的预测工具。本文发表于《Materials》。
主要关键技术方法
研究人员搜集整理文献中154组CFST轴压试验数据构成数据库,参数涵盖钢管外径(D)、壁厚(t)、柱长(L)、钢材屈服强度(fy)、混凝土轴心抗压强度(fck)等,经计算衍生出钢管截面积(As)、混凝土截面积(Ac)、钢管截面惯性矩(Is)、长细比(λ, Slenderness Ratio)、约束效应系数(ξ, Confinement Coefficient)等共24个输入特征,输出为实测极限承载力(Nt)。数据经标准化处理,按8∶2划分为训练集与测试集,采用五折交叉验证(Five-Fold Cross-Validation)结合网格搜索进行超参数调优(决策树棵数n_estimators、最大深度max_depth、叶节点最小样本数min_samples_leaf、节点最小分裂样本数min_samples_split、最大特征数max_features)。优化后RF模型通过均方误差(Mean Squared Error, MSE)、决定系数(Coefficient of Determination, R2)及平均绝对误差(Mean Absolute Error, MAE)评价性能,并与六国设计规范(GB 50936?2014、DBJ/T13?51?2010、AISC、EC4、AIJ、BS5400)及决策树(Decision Tree)、岭回归(Ridge Regression)、k近邻(k?Nearest Neighbors, KNN)、AdaBoost、SVM、反向传播(Backpropagation, BP)神经网络对比。最后研究人员自行浇筑并试验9根CFST柱(Q235B钢管Φ273×6mm,C30/C50混凝土,不同长细比及偏心距),将材料实测值与几何参数输入模型进行独立验证。
研究结果
2. Experimental Program——实验数据库与数据质量
研究人员从文献收集154组轴压试件数据,参数范围:18.0≤D/t≤165,8.4≤λ≤168,216MPa≤fy≤617.8MPa,16MPa≤fck≤121.1MPa。经箱线图(Boxplot)和小提琴图(Violin Plot)分析,λ、ξ及C?存在离群点但属物理真实变异予以保留。各源数据统一采用原文报道的实测均值,假设测量误差随机分布于工程允许公差内。
3. Research Methodology——随机森林原理与模型构建
RF由多棵分类与回归树(Classification and Regression Tree, CART)组成,每棵树基于Bootstrap重抽样训练,节点分裂时随机选取特征子集,最终回归预测取所有树预测均值。研究人员设置树棵数搜索范围10~200,经五折交叉验证确定最优参数为:n_estimators=25,max_depth=10,min_samples_leaf=2,min_samples_split=2,max_features=10,训练集比例80%。示例展示了第19棵CART的递归二分构建过程,模型在训练集上MSE=0.0081,R2≈0.9791,MAE=112.33(真值范围348~5927kN),表明高精度拟合。
4. Model Prediction Results——预测结果与特征重要性
RF输出的特征重要性显示:钢管截面惯性矩(Is)贡献35.56%(主导因素),钢管截面积(As)17.25%,直径(D)8.74%,混凝土截面惯性矩(Ic)8.33%,柱长(L)5.01%,混凝土面积(Ac)4.78%,壁厚(t)3.31%;其余因素(Ec、约束系数C、钢混组合强度fscg、fck、fyr、λ等)合计贡献<15%。前七项累计超80%,符合CFST约束机理与稳定理论——Is、Ic、D、L定义长细比与抗弯刚度,反映整体屈曲对轴压承载力的控制作用,说明RF特征排序具物理可解释性。训练集预测值/试验值均值1.002,测试集0.989,散点沿45°等直线均匀分布,最大偏差≤15%。
5. Comparative Analysis of Model Effects——与规范及其他算法对比
将RF预测结果与六国规范算得的N0/Nt比值比较:AISC、AIJ、BS5400总体偏于保守(低估>10%),EC4偏不安全且离散大,GB 50936?2014均值误差约4%但仍高于RF模型。RF整体误差约1%,变异系数(COV)=0.094为最低。与其他ML算法比:BP神经网络最大偏差42%,SVM 37%,AdaBoost 26%,KNN与Ridge Regression 31%,Decision Tree 20%,RF最大偏差仅15%且MSE最低(0.0081),综合精度与稳健性最优。
6. Experimental Verification——独立试验验证
研究人员制作9根CFST柱(C30/C50各半,三种长细比及偏心条件),实测钢材fy、fu、Es及混凝土fcu,轴压试件呈典型钢管鼓曲与对角剪切滑移失效模式。RF模型预测值与实测值之比均值为0.992,标准差σ=0.017,COV=0.017,最大误差<5%,较交叉验证精度进一步提升,证实模型在外推参数范围内的可靠性。不确定度量化和敏感性分析显示预测/试验比值分布集中,训练集σ=0.058、测试集σ=0.093,均优于规范和其他算法。
讨论与结论翻译
研究人员得出如下结论:(1) 钢管截面惯性矩(Is)对CFST轴压承载力贡献最大(35.56%),其次为钢管截面积(As, 17.25%)、直径(D, 8.74%)、混凝土截面惯性矩(Ic, 8.33%)、柱长(L, 5.01%)、混凝土截面积(Ac, 4.78%)及壁厚(t, 3.31%),这些参数在设计应优先考虑。(2) 优化RF模型相较其他算法平均精度提高约42%,训练集与测试集预测值/试验值均值分别为1.002和0.989,最大偏差≤15%,MSE=0.0081;相较设计规范整体误差约1%,证明其更精确可靠地预测CFST极限承载力。(3) 九组变参数CFST柱独立试验验证显示RF预测与实测最大偏差<5%,预测曲线与试验吻合良好,表明模型可准确预测不同参数下轴压及偏压CFST构件承载力。未来可将RF模型部署为云端应用程序接口(Application Programming Interface, API)集成至建筑信息模型(Building Information Modeling, BIM)软件,并引入分位数回归森林(Quantile Regression Forest)量化预测置信区间以支持基于概率的可靠度评估。