用于预测存在层内损伤的复合翼盒失效指数的元素级有限元驱动机器学习替代模型

《Aerospace Science and Technology》：Element-level finite-element-informed machine-learning surrogates for failure-index prediction in a composite wing box with intralaminar damage

【字体：大中小】 时间：2026年06月19日 来源：Aerospace Science and Technology 5.8

编辑推荐：

　　达里奥·马利亚卡诺|安娜丽莎·莱蒂齐亚|萨拉·迪帕洛|玛丽卡·阿莱奇|马尔科·巴扎尼摘要：本研究开发了基于有限元方法的机器学习替代模型，用于预测含有预定层内刚度退化的复合翼盒子结构中的五种经典失效指标，并对其进行了数值评估。通过改变等效正交各向异性有限元模型中肋条、蒙皮和翼梁

　　达里奥·马利亚卡诺|安娜丽莎·莱蒂齐亚|萨拉·迪帕洛|玛丽卡·阿莱奇|马尔科·巴扎尼

摘要：本研究开发了基于有限元方法的机器学习替代模型，用于预测含有预定层内刚度退化的复合翼盒子结构中的五种经典失效指标，并对其进行了数值评估。通过改变等效正交各向异性有限元模型中肋条、蒙皮和翼梁区域的损伤位置、范围和强度，构建了一个以损伤为导向的数据库。随机森林、XGBoost、LightGBM以及多层感知器被训练并使用统一的数据划分和交叉验证框架进行评估，同时特别关注失效指标范围的高端值。基于树的集成方法始终优于神经网络基准模型；其中最大应力指标的预测精度最高，而克里斯滕森指标以及以翼梁为主的情形则更难预测，尤其是当失效指标值超过0.7时。这些结果证明了在所采用的模型假设下进行快速数值筛选的可行性。

1. 引言
复合翼盒具有较高的比刚度和强度，但其结构响应会受到空间分布的层内退化的影响。虽然反复的有限元分析可以量化局部应力和失效指标的变化，但高昂的计算成本限制了其在大量损伤配置的快速筛选中的应用。因此，本研究探讨了能够根据损伤和几何描述符来再现指定有限元模型失效指标响应的机器学习替代模型。在此背景下，预测的失效指标被视为静态结构响应指标，而非剩余疲劳寿命或失效时间的估计值。

1.1 背景与动机
传统上，预测飞机结构健康状况的方法往往依赖于计算成本较高的模型以及既定的损伤力学原理。Chehade和Younes[1]综述了用于结构可靠性和健康状况预测的各种软件和计算工具。一种常见的方法是强度到失效分析，该方法计算导致未受损翼盒完全失效所需的载荷，通过将这一值与运行过程中的预期最大载荷进行比较，就可以评估结构健康状况。然而，这种方法存在局限性，它无法考虑逐渐退化以及潜在损伤随时间的发展，这可能导致对结构健康状况的低估。Fanteria和Panettieri[2]提出了一种用于描述复合层板非线性剪切行为的本构模型，该模型采用用户自定义的Fortran程序编写，可用于Abaqus非线性有限元代码中。Carrera统一公式提供了一种一致的框架，用于近似各种结构形态，如梁、板和壳结构，它将位移场表示为一系列展开函数，而非传统的逐层或等效单层公式。通过这种策略，可以利用更多数量的展开函数来实现高阶精度[3]，并模拟复杂的应变和位移场[4]。此外，CUF还能处理各种几何形状的结构，并能模拟包括几何非线性在内的非线性行为[5][6]。

数据驱动的结构健康监测研究主要集中于通过振动、导波或其他传感器获取的信息来检测、定位或分类损伤[7][8][9][10][11]。与之互补的基于有限元的方法则利用数值模拟生成标记数据，用于替代模型构建，从而在替代模型训练完成后实现快速响应或失效预测[12][13]。Alaimo等人[14]研究了一种人工神经网络，该网络无需事先了解损伤特征即可检测和定位损伤，可用作结构健康监测系统的实时数据处理器。Casaburo等人[15]开发并验证了一种基于机器学习的工具，用于设计带有嵌入式周期性图案的泡沫芯材，以实现分层概念下的声学路径被动控制。Azad和Kim[16]使用混合深度卷积网络提出了一种针对层合复合结构的强大自主损伤诊断方法。Wang等人[12]则采用有限元模拟与机器学习相结合的方法预测了复合压力容器的失效因素。早期的应用已经证明了将长期结构健康监测系统与基于神经网络的损伤识别方法结合在一起，在大型实际结构，如桥梁[17][18]中的可行性。

这些方法适用于受控的数值研究，而将其应用于实际结构则是一项需要实验校准和验证的独立任务。采用翼盒几何结构是因为它包含了相互作用的肋条、蒙皮和翼梁，以及 coupon级或简单面板研究无法体现的非均匀应力分布。不过，当前模型被刻意简化，以便单独研究预定的层内刚度退化与相应失效指标之间的关系。

1.2 相关工作与贡献
先前发表的翼盒基准研究[19]改变了正交各向异性材料属性，并比较了随机森林和支持向量回归替代模型在最大应力元素处评估的失效指标。而本研究则固定了单一的等效正交各向异性材料，以隔离与损伤相关的效应，并建立了涵盖肋条、蒙皮和翼梁区域的元素级、以损伤为导向的数据库。随机森林、极端梯度提升（XGBoost）、轻量级梯度提升机（LightGBM）以及多层感知器都采用了统一的验证流程进行评估，同时分别研究了失效指标高端范围内的模型表现。因此，本研究的贡献并不在于新的机器学习算法，而在于特定应用的元素级数据库、对比性的模型选择研究，以及对接近临界失效指标范围时的预测误差的安全性分析。这项研究是一个数值概念验证，它并未再现堆叠顺序效应、分层现象、渐进性物理损伤的发展过程，也没有模拟实验测量的结构响应。

第2节介绍了数值模型、预定的损伤表示方法、数据库构建以及学习框架。第3节展示了比较结果，包括专门针对高端范围的误差分析。第4节总结了主要发现、局限性以及未来需要开展的工作。

2. 方法论框架
该方法论包括两个相互关联的阶段。首先，使用一致离散化的有限元模型为预定的损伤配置生成标记过的结构响应数据。其次，训练多种回归模型，以根据损伤和几何描述符再现相应的失效指标。由于所有目标值都来源于有限元模型，因此该评估可量化替代模型与该模型的吻合程度。开发有效人工智能模型的关键在于用于训练它们的数据的相关性和质量。本节将介绍本研究中所采用的数据获取和预处理方法。

2.1 几何形状与材料属性
初始的数据获取阶段侧重于收集作为参考组件的复合翼盒的几何形状和材料属性信息。这些数据是人工智能模型的重要基础，有助于模型理解所评估结构的特定特性。参考组件是从Cirrus SR22飞机的公开CAD模型中提取出的双舱翼盒子结构，如图1所示。该几何形状仅作为代表性的航空翼盒结构，其目的并非重现实际飞机的专有或经过认证的结构定义。

为隔离预定的层内刚度退化与相应失效指标响应之间的映射关系，本研究采用单一的等效正交各向同性连续体模型。这种表示方式有意排除了与堆叠顺序相关的行为、层间应力以及分层起始或扩展现象。通过减少层板特定变量的数量，可以在受控条件下研究损伤位置、范围和强度的影响。因此，这些结果仅适用于所采用的等效材料模型，不应被解读为对实际飞机结构的层级详细分析。用于此等效模型的机械性能和极限强度分别见表1和表2，所选材料密度为1600kg/m3。

•S11+表示纵向拉伸失效时的应力分量σ11的值；
•S11?表示压缩拉伸失效时的应力分量σ11的值；
•S22+表示纵向拉伸失效时的应力分量σ22的值；
•S22?表示压缩拉伸失效时的应力分量σ22的值；
•S12表示纵向剪切失效时应力分量σ12的绝对值；
•S23表示横向剪切失效时应力分量σ23的绝对值。

表1. 所分析碳纤维单向复合材料的等效正交各向同性机械性能[20]
杨氏模量 [Pa]：E11=1.35E+11，E22=1.00E+10，E33=1.00E+10
剪切模量 [Pa]：G12=5.00E+09，G13=5.00E+09，G23=3.60E+09
泊松比：ν12=0.3，ν13=0.3，ν23=0.39

表2. 所分析碳纤维单向复合材料的等效正交各向同性极限强度
极限强度 [Pa]：
S11+S11?：1.50E+09，1.20E+09，5.00E+07
S22?：2.50E+08，7.00E+07，5.04E+07

在这方面，人工神经网络模型可以通过整合全面的几何和材料属性数据，建立受损翼盒的物理特性与其剩余结构健康状况之间的关联。

2.2 数值模型特性、约束条件与载荷
从参考飞机中提取的组件由两个半翼舱组成，即半个机翼由三根肋条界定。参考翼盒中主要构件——包括肋条、蒙皮和翼梁——的厚度分别为2.5毫米、2.0毫米和3.0毫米。图2展示了所分析翼盒的实心和透明等轴视图。

从最靠近的肋条开始，将肋条编号为1至3，边界条件为在肋条3的外表面施加固定约束（见图3a），以此模拟机翼与机身的连接处。在肋条1的外表面施加分布式静载荷（见图3b），这些载荷旨在代表最苛刻的运行条件，即飞行包线图中所谓最大机动点处的条件，该点位于最大载荷曲线与失速曲线的交点处。具体而言，这些载荷分量的估算值为：Fx=0N，Fy=?1774.88N，Fz=21124.1N，Mx=?43640.3Nm，My=5352.03Nm，Mz=389.231Nm；在估算失效指标时，这些数值需乘以1.5的安全系数。此外，还在整个模型上施加沿z轴方向的重力载荷，其大小为?9.81ms2。

在Abaqus中进行了两级网格灵敏度研究，比较了包含3240个节点和1670个C3D8R元素的粗略离散化模型与包含16,860个节点和8592个C3D8R元素的精细离散化模型所得到的最大位移值。为便于计算，在此次验证中仅考虑了具有以下属性的各向同性材料：杨氏模量E=99GPa，泊松比ν=0.286，密度ρ=1410kg/m3。两种离散化模型之间的最大位移差异约为7%。出于实用考虑，选择了精细网格作为构建一致离散化概念验证数据库的折中方案。这一数值并不等同于局部应力或失效指标误差的7%上限，因为后者可能对离散化更为敏感。由于受损和未受损配置都采用相同的精细网格，因此比较趋势和替代模型训练标签保持内部一致性，而绝对的失效指标值则仍受离散化不确定性的影响。因此，本研究并不宣称具备认证级别或高精度的预测能力。

2.3 损伤特性
损伤是通过在选定的有限元区域内预定的局部刚度退化来表示的。数据库记录了三个独立的描述参数：损伤位置、损伤范围和损伤强度。这些描述参数为评估等效结构刚度变化对预测失效指标的影响提供了可控的参数化方式：
•损伤位置：记录了翼盒内损伤的精确位置，包括坐标信息以及对应的具体结构构件（肋条、翼梁、蒙皮）；
•损伤范围：掌握了损伤的几何细节，包括损伤区域的大小数据（以平方米为单位）；
•损伤强度：为了数值模拟损伤的存在，会在模型中受损区域的杨氏模量和剪切模量上按其未受损值的百分比进行降低。

具体而言，损伤强度通过一个标量指数来表示，其定义为：
(1) DI = 1 ? Eijdam / Eijund
其中，Eijdam和Eijund分别表示退化后的弹性刚度分量与原始弹性刚度分量，而指标i和j则表示材料方向。共考虑了四种预定的损伤强度水平，即DI=0.20、0.40、0.60、0.80。这种现象学上的表示方法能够反映层内退化导致的平均残余刚度变化，但它无法再现损伤的起始机制、裂纹形态、渐进性失效过程，以及由物理冲击或疲劳事件可能引发的分层现象。因此，它主要用于生成可控的数值损伤状态，而非模拟完整的物理损伤发展过程。

2.4 所采用的失效准则
本研究从不同角度考察了复合材料中的五种经典失效指标，以此评估所分析部件的损伤状况。•最大应力准则用于判定由三种加载模式引发的复合材料失效：纵向失效、横向失效和剪切失效。当σ11≥S11+或σ11≤S11?时，会发生纵向失效；当σ22≥S22+或σ22≤S22?时，会发生横向失效；当|σ12|≥|S12|时，会发生纵向剪切失效。此时FI等于(σ11S11+、σ11S11?、σ22S22+、σ22S22?、σ12S12)的绝对值最大值，且该值需大于1。•蔡-吴准则是一种基于二次交互应力的失效判定准则，虽能识别失效，但无法区分不同失效模式。当满足F1σ11+F2σ22+F11σ112+F22σ222+F66σ122+2F12σ11σ22≥1这一条件时，即发生失效。蔡-吴准则中的各系数Fi和Fij是根据复合材料的已知/实测强度来确定的：F1≡1/S11+?1/S11?；F2≡1/S22+?1/S22?；F11≡1/S11+S11?；F22≡1/S22+S22?；F66≡1/S122。交互系数F12的计算公式为F12=f·F11·F22，其中f为用户指定的常数，其取值范围在?0.5到0之间。•蔡-希尔准则同样是基于二次交互应力的失效判定准则，无法区分不同失效模式。当满足σ112/S112?σ11σ22/S112+σ222/S222+σ122/S122≥1这一条件时，即发生失效。•哈辛准则可识别复合材料的四种不同失效模式，分别是纤维拉伸失效、纤维压缩失效、基体拉伸失效和基体压缩失效。若σ11≥0，则纤维拉伸失效的判定准则为：(σ11S11+)2+α(σ122+σ132/S122)≥1；若σ11<0，则纤维压缩失效的判定准则为：(σ11S11?)2≥1；若σ22+σ33≥0，则基体拉伸失效的判定准则为：(σ22+σ33)2/S22+2+σ232?σ22σ33/S232+σ122+σ132/S122≥1；若σ22+σ33<0，则基体压缩失效的判定准则为：[(S22?2S23)2?1](σ22+σ33/S22?)+(σ22+σ33)2/4·S232+σ232?σ22σ33/S232+σ122+σ132/S122≥1。哈辛准则需要用户指定参数α，其允许取值范围为0≤α≤1，默认值为α=0。•克里斯滕森准则可识别两种失效模式：基体失效和纤维失效。基体失效的判定准则为：(1/S22+?1/S22?)(σ22+σ33)+1/S22+S22?(σ22+σ33)2+1/S232·(σ232?σ22σ33)+1/S122·(σ122+σ132)≥1；纤维失效的判定准则为：(1/S11+?1/S11?)σ11+σ112/S11+S11?≥1。2.5 用于生成结构健康数据的有限元分析有限元模型被用作可控的虚拟数据生成工具。对于每一种预设的损伤配置，都会在整个翼盒模型中计算应力场以及五个经典的失效指标。这些计算结果可用于描述所采用的数值模型的响应特性，因此本研究旨在评估机器学习模型模拟这种响应的能力。在实际应用之前，还需要进行实验校准、模型更新以及模拟结果与实际测量值的对比分析。本次参数研究包括一种未受损状态，以及通过改变受损结构区域、损伤范围和四种不同的刚度降低程度而得到的112种受损状态。与之前发表的以材料特性为基准的研究[19]不同，本研究侧重于构建基于单元级、单一材料、以损伤为导向的数据库，同时还将模型比较范围扩展到了随机森林、XGBoost、LightGBM以及多层感知器，并重点分析了处于较高失效指标范围的预测误差情况（详见表3）。表3. 用于构建以损伤为导向的数据库的参数分析中所涉及的损伤案例。案例编号位置坐标[米]损伤范围[平方米]空单元格空单元格xyz空单元格1肋条4.21E-01?3.60E-010.00E+004.24E-045肋条4.21E-01?3.60E-010.00E+001.70E-039肋条7.45E-01?3.42E-010.00E+004.24E-0413肋条7.45E-01?3.42E-010.00E+001.70E-0317肋条4.21E-01?3.60E-012.63E-014.24E-0421肋条4.21E-01?3.60E-012.63E-011.70E-0325肋条7.45E-01?3.42E-012.63E-014.24E-0429肋条7.45E-01?3.42E-012.63E-011.70E-0333肋条4.21E-01?3.60E-015.25E-014.24E-0437肋条4.21E-01?3.60E-015.25E-011.70E-0341肋条7.45E-01?3.42E-015.25E-014.24E-0445肋条7.45E-01?3.42E-015.25E-011.70E-0349蒙皮5.95E-01?4.72E-011.33E-013.20E-0353蒙皮5.95E-01?4.72E-011.33E-017.20E-0357蒙皮5.95E-01?4.72E-013.95E-013.20E-0361蒙皮5.95E-01?4.72E-013.95E-017.20E-0365蒙皮5.94E-01?2.37E-011.33E-013.20E-0369蒙皮5.94E-01?2.37E-011.33E-017.20E-0373蒙皮5.81E-01?2.37E-013.95E-013.20E-0377蒙皮5.81E-01?2.37E-013.95E-017.20E-0381纵梁2.97E-01?3.67E-011.33E-016.28E-0485纵梁2.97E-01?3.67E-011.33E-012.51E-0389纵梁2.97E-01?3.67E-013.95E-016.28E-0493纵梁2.97E-01?3.67E-013.95E-012.51E-0397纵梁8.79E-01?3.34E-011.33E-016.28E-04101纵梁8.79E-01?3.34E-011.33E-012.51E-03105纵梁8.79E-01?3.34E-013.95E-016.28E-04109纵梁8.79E-01?3.34E-013.95E-012.51E-03最终，从数值模型各单元体的质心处提取出六个直接应力分量，进而逐个案例确定最大的FI值，相关结果如图4和图5所示。由于此次参数分析的目的是评估人工神经网络能否准确反映所选五个FI指标与层内损伤状况之间的关联，因此数据库也是按照这一逻辑构建的。分析结果同样也是针对每个案例单独呈现的，重点关注那些与未受损状态相比FI值变化最大的单元体，相关结果汇总于图6和图7中。下载：下载高分辨率图像（327KB）下载：下载完整尺寸图像图4. 基于整个模型失效分布图，逐个案例计算出的FI值最高的单元体上的五个FI指标。下载：下载高分辨率图像（729KB）下载：下载完整尺寸图像图5. 同样基于整体模型失效分布图，确定出FI值最高的单元体后，逐个案例计算的五个FI指标的变化情况。下载：下载高分辨率图像（410KB）下载：下载完整尺寸图像图6. 基于整体模型失效分布图，逐个案例计算出的FI值上升幅度最大的单元体上的五个FI指标。下载：下载高分辨率图像（860KB）下载：下载完整尺寸图像图7. 基于整体模型失效分布图，确定出与未受损状态相比FI值上升最显著的单元体后，逐个案例计算的五个FI指标的变化情况。有趣的是，无论是哪种分析方法，变化最为显著、最具研究价值的案例都是编号为81到96的那几组，这类案例涉及特定纵梁的损伤，由此可判断该纵梁在结构失效风险方面是最为关键的。2.6 机器学习替代模型为了评估各类失效指标，研究人员利用单元级数据库训练并比较了多种回归替代模型。由于树型集成模型非常适合处理异构的表格数据以及非线性关联关系，因此随机森林、XGBoost和LightGBM被选为候选模型。同时，为了验证通用神经网络架构以及更丰富的特征集是否能在当前数据集上带来优势，多层感知器也被作为对照模型。因此，人工神经网络在这里更多是作为对比模型存在，而非最优解决方案。整个分析流程包括探索性数据分析、特征工程、模型设计与训练以及验证环节，其中超参数的选择与验证是相互迭代进行的。2.6.1 探索性数据分析探索性数据分析是发现数据集中隐藏趋势与规律的关键步骤，研究者通过描述性统计分析和可视化检查来了解输入变量和输出变量的分布情况。表4汇总了按损伤类型分类的输出变量均值和标准差，而表5则展示了按分类位置划分的相同统计指标。图8中的散点图反映了结构损伤变量与应力张量之间的关系，图9则用FI指标替代了应力张量，同时颜色编码用于表示不同的分类位置。表4. 按受损节点分类的详细统计结果（均值±标准差）。表5. 按位置分类的统计汇总结果（均值±标准差）。下载：下载高分辨率图像（2MB）下载：下载完整尺寸图像图8. 损伤变量与应力张量的散点图，颜色根据分类位置有所不同。下载：下载高分辨率图像（1MB）下载：下载完整尺寸图像图9. 损伤变量与FI指标的散点图，同样采用颜色编码区分不同分类位置。由于没有发现明显的线性关联关系，因此预测任务被调整为直接以FI指标作为目标变量，而非先预测应力张量再进一步处理。两个随机变量之间的线性关联程度通常通过皮尔逊相关系数rxy来衡量，这一数值可以量化两者线性关联的强度和方向，其计算公式为：(2)rxy=Cov(X,Y)/（σX·σY），其中Cov(X, Y)表示X和Y的协方差，σX和σY分别代表两者的标准差。该系数的取值范围在?1到1之间：接近1的值表示存在较强的正线性关联，接近?1的值则表示存在较强的负线性关联，而接近0的值则说明两者之间不存在线性关系。不过需要指出的是，皮尔逊相关系数仅能反映线性关联，无法捕捉变量之间可能存在的非线性相互作用，这类情况可能需要其他关联度量方法。为了进一步分析FI指标的特征，研究者还研究了每种损伤情况下的相关矩阵，且仅考虑那些FI指标值最高的测量单元体对应的数据。采用这种方式是为了突出其中最关键的结构部位，因此每个生成的矩阵实际上代表了112个观测节点的数据。相关分析显示了一个一致的规律：对于所有的FI指标而言，其与受力节点的x分量之间存在负相关关系，而与空间位置以及施加的载荷强度则存在正相关关系，这一点从图10中展示的最大应力指标中就可以看出来。下载：下载高分辨率图像（430KB）下载：下载完整尺寸图像图10. 结构特征与最大应力指标之间的相关矩阵。通过对最大FI指标分布的详细分析，如图11所示，只有编号在81到96之间的损伤案例才表现出明显更高的FI指标值，而且这些案例都与特定纵梁的位置以及节点1402和1522密切相关。为了进一步探究这种关联关系，研究者通过筛选纵梁位置的方式，从所有数据中提取出了32条记录作为子数据集。接着计算了每个测量组的质心坐标，并分析这些质心与受力节点之间的关系。分析结果表明，在81–96号案例中，质心的x坐标是影响FI指标变化的最主要因素，相关结果见图12。下载：下载高分辨率图像（331KB）下载：下载完整尺寸图像图11. 不同损伤案例下的最大FI指标值分布情况，其中81–96号案例由于与该纵梁区域相关的FI指标值较高而被标出。下载：下载高分辨率图像（618KB）下载：下载完整尺寸图像图12. 纵梁部位最高失效指标值的相关矩阵。2.6.2 特征工程特征工程在定义问题范畴以及确保结构健康监测预测的准确性方面起着至关重要的作用。这一阶段的工作包括识别相关变量、应用标准化技术，以及结合领域知识选择合适的特征。分类特征编码为了避免出现不必要的顺序关联关系，分类特征“位置”被采用独热编码的方式进行处理。虽然这种方法会增加数据的维度，但它能够有效提升模型与决策树集成模型以及神经网络的兼容性。特征标准化由于数据存在多模态分布的特点，基于标准正态分布的标准化方法被舍弃，取而代之的是在将数据输入人工神经网络之前先进行最小-最大标准化处理，因为这种方式能够加快基于梯度的优化速度，同时避免数值过大变量对整体模型的主导作用。为避免出现偏差，所有标准化参数都是在将数据分为训练集和测试集之前，仅基于训练数据来确定的。而对于集成学习模型来说，由于它们本身具备尺度不变性，因此无需进行标准化处理。特征选择特征的选择既需要结合领域专业知识，也要考虑模型的适用性。为了降低计算量，机器学习模型主要基于与损伤相关的变量以及节点质心信息来进行训练；而人工神经网络则采用了更为广泛的特征集，其中包括材料特性以及8节点测量单元体的节点坐标。之所以选择这样的特征集，是因为观察发现节点坐标与FI指标之间存在一定的关联关系。2.6.3 模型设计与训练在本研究中，研究者尝试了多种机器学习方法，用以建立结构损伤特征与FI指标之间的映射关系。最终共开发了两类模型：基于树型的集成方法（随机森林、极端梯度提升法和轻量梯度提升法），以及人工神经网络。选择集成方法是因为它们对低方差数据具有较好的适应性，而选择神经网络则是考虑到当前数据集具有较高的内在维度以及复杂的非线性关联特征。人工神经网络在这里被作为对照模型，用于与结构健康监测领域中常用的其他神经网络方法进行比较，而后续的分析结果则表明，对于当前的数据集而言，集成学习模型才是更合适的预测模型。这些集成学习模型是使用scikit-learn库实现的，而人工神经网络则是基于TensorFlow/Keras框架开发的。对于每一个FI指标，都分别训练了对应的模型。集成学习方法随机森林是一种集成算法，它通过构建多棵决策树并整合这些树的预测结果，从而提升预测精度并减少过拟合现象。通过自举采样和随机特征选择的方式，可以增加不同决策树之间的多样性。随机森林回归模型的参数是通过调整以下参数来优化的：•n_estimators：[50, 100, 200]，即模型中决策树的数量；•max_depth：[None, 10, 20, 30]，即每棵决策树的最大深度；•min_samples_split：[2, 5, 10]，即分割内部节点所需的最小样本数；•min_samples_leaf：[1, 2, 4]，即叶节点上所需的最小样本数。研究者通过GridSearchCV工具进行了全面的网格搜索，系统地遍历了所有可能的参数组合。每种参数组合都会通过k折交叉验证来进行评估，最终保留表现最佳的参数组合。主要的评估指标是负平均绝对误差，同时也会计算皮尔逊相关系数rxy。XGBoost是一种逐步构建决策树的模型，每新增一棵决策树都会用来修正现有集成模型的残差，而模型中的正则化机制则有助于防止过拟合现象。XGBoost回归模型的参数优化包括：•n_estimators：[100, 200]，即提升迭代的次数；•learning_rate：[0.01, 0.1, 0.3]，即每次提升步骤中的收缩比例；•max_depth：[6, 10]，即决策树的最大深度，其中?1表示没有限制；•min_child_weight：[1]，即子节点中赫斯矩阵的最小值；•subsample：[0.8, 1.0]，即每次迭代时使用的训练样本比例。最优参数组合同样是通过网格搜索并结合交叉验证来确定的。LightGBM则采用了基于直方图的分组方式以及逐叶生长策略，这类方法通常能使大型数据集的训练速度更快。LightGBM回归模型的参数优化包括：•num_leaves：[8, 31, 63]，即每棵决策树的最大叶节点数量；•max_depth：[-1, 3, 6]，即决策树的最大深度，其中?1表示无限制；•learning_rate：[0.01, 0.05, 0.1]，即收缩率；•n_estimators：[100, 300]，即提升迭代的次数；•min_child_samples：[10, 20, 30]，即叶节点上所需的最小样本数；•subsample：[0.7, 0.8, 1.0]，即每次迭代时使用的特征比例；•colsample_bytree：[0.7, 0.8, 1.0]，即每棵决策树所使用的特征比例。这些参数也是通过GridSearchCV工具来选择的。人工神经网络多层感知器被用来捕捉特征与FI指标之间的非线性关系。该模型是用TensorFlow/Keras实现的，具体配置如下：•数据分割：70%用于训练（673,611个样本），20%用于验证（192,462个样本），10%用于测试（96,231个样本）•输入特征：51个特征（请求节点坐标：3个；测量节点：24个；材料属性：16个；位置信息：3个；强度；范围；测量组中心点：3个）•训练轮数：100轮•批量大小：32•优化器：Adam，学习率=0.0005•损失函数：均方误差•评估指标：平均绝对误差•模型架构：64、32、16、1层（三个隐藏层加输出层）；激活函数：隐藏层用ReLU，输出层用Sigmoid•正则化手段：批归一化、自适应学习率调度以及提前停止机制在这种架构中，网络通过逐层减少神经元数量来逐步降低维度（64→32→16→1）。这种金字塔结构有助于模型提取高层抽象特征，同时降低过拟合风险。隐藏层使用ReLU激活函数可引入非线性特性，避免梯度消失问题，而输出层的Sigmoid激活函数则适合处理有界回归输出。通过批归一化、自适应学习率调度和提前停止等正则化方法，提升了模型在验证集和测试集上的收敛稳定性和泛化能力。从科学角度而言，这种网络架构在模型复杂度与数据维度之间取得了平衡，既能保证足够的表征能力，又不会过度过拟合。神经元数量的逐步减少类似于特征压缩机制，随着网络向输出层推进，冗余或信息量较弱的信号会被过滤掉。此外，还研究了两种不同的架构变体。第一种是在原始输入层之前增加一个包含128个神经元的初始层，但这一改动导致性能大幅下降，因为数据集的方差相对较低，模型复杂度的提升并未带来相应优势，进而出现了过拟合现象。第二种变体则是去掉第一个包含64个神经元的隐藏层，使架构变为[32, 16, 1]层。不过这种简化同样影响了性能，因为模型较低的表征能力无法充分捕捉数据中的复杂关系。这些结果表明，所提出的基准架构在复杂度与泛化能力之间达到了恰当的平衡。2.6.4 验证与评估在训练阶段，采用了两种不同的数据分割策略。首先采用常规的70%-30%分割方式，其中70%的数据用于训练，30%用于测试。对于人工神经网络，测试数据进一步分为验证集（20%）和测试集（10%），以便在训练过程中监控模型性能。为确保各种关键状态都能得到均衡体现，那些FI值高于预设阈值的变量会按照图13中所示的比例分配到各个子集中。其余的FI值则被聚类，再从中抽取代表性样本来完成训练集、验证集和测试集的构建。这种分层处理方式保证了数据集中既有普通结构响应，也有极端结构响应。设置阈值进行分层是为了避免高故障指数区域被排除在评估之外，因为这类区域对于结构健康状况的保守评估而言最为重要。下载：下载高分辨率图像（119KB）下载：下载全尺寸图像图13. 训练集与测试集的饼图。整个训练方法设计得十分系统严谨，预处理策略和超参数优化都是针对不同的回归模型量身定制的。超参数是通过全面的网格搜索来调整的，会遍历所有在预定范围内的组合。除了上述保留样本外的分割方式，还采用了5折交叉验证法，以此评估模型的泛化能力并减少选择偏差。在每次迭代中，数据集会被分成五个子集：模型在四个子集上训练，在剩下的一个子集上进行验证。这种循环方式能够更可靠地评估模型对未见过数据的预测能力，且不受特定训练子集的影响。由于均方根误差对预测值与实际值之间的较大差异十分敏感，因此被选作主要的评估指标。其数学表达式为：(3)RMSE=1n∑i=1n(yi?y^i)2其中yi表示实际观测值，y^i表示预测值，n为样本数量。采用RMSE作为评估指标意味着较大的误差会受到更严厉的惩罚，这一特性在结构健康监测中尤为重要，因为异常偏差可能预示着严重的结构损伤。此外，由于RMSE与目标变量的单位相同，因此便于直接解读，并能方便地比较不同算法的性能。除RMSE外，为了更全面地了解模型性能，还计算了均方误差、平均绝对误差和平均偏差误差等补充指标。不过，最终仍以RMSE作为核心评判标准，用作各模型之间比较的依据。3. 结果与讨论这里分别介绍了两类算法家族的测试结果，并对其进行了详细分析。之所以选择均方根误差作为主要性能指标，是因为它能够保留目标变量的量级。由于故障指数FI的值介于[0,1]之间，因此RMSE值在0.10–0.15区间内可视为良好，而低于0.30的值在本研究中也可接受。在必要情况下，还会给出均方误差、平均绝对误差和平均偏差误差等补充指标，以便更全面地评估模型性能。3.1 集成方法图14展示了基于max_stress FI值训练的随机森林模型的预测值与实际值之间的对比情况。在所有开发的模型中，这种配置的预测精度最高。样本以不同颜色标注：蓝色代表训练数据，红色代表测试数据，黄色则表示超过临界阈值的测试样本，即FI?>?0.7。下载：下载高分辨率图像（349KB）下载：下载全尺寸图像图14. Max Stress——随机森林预测值与实际值的散点图。理想情况下，所有点都应该落在45°的对角线上，这表明预测值与实际值完全一致。偏离对角线的程度代表了预测误差，偏离幅度越大，说明预测精度越低。在训练集中，FI值较低的区域，模型的预测精度很高。但随着FI值上升，数据点围绕对角线的分布范围也会扩大，说明在关键区域的预测不确定性增加。每折交叉验证所得的误差变化很小，这说明该模型具备在未见过数据上泛化的能力。此外，训练集和测试集的性能曲线走势一致，也表明随机森林模型没有出现过拟合现象。图15展示了针对超过临界阈值（max_stress?>?0.7）的样本所做的详细误差分析，误差值为实际值减去预测值。分析结果显示，预测误差会随着FI值的增大而上升。同时，误差与样本密度呈反比关系：在数据较为密集的[0.70-0.75]区间内，误差较大；而当FI?>?0.75时，可用数据点减少，误差也随之增大。由于误差是实际值减去预测值，负值表示预测过高，正值则表示预测偏低。出现较多正误差说明模型倾向于低估FI值，这一偏差可能是由于数据集中低损伤案例占比较高所致。如果能增加更多高损伤案例，就能缓解这种不平衡现象。因此，不能仅通过整体准确率来判断高指数子集的表现。表7列出了针对超过阈值样本的各类误差指标，结果显示，在关键范围内，Max Stress预测器的可靠性仍然最高，而Christensen指数则是当前特征集中最保守的指标。未来的改进方向应侧重于以尖峰为主的、高指数配置，而非单纯增加低损伤案例。下载：下载高分辨率图像（333KB）下载：下载全尺寸图像图15. Max Stress——随机森林在高数值下的预测误差。表6展示了5折交叉验证下各故障指数的各项指标，包括R2、MBE、MAE、MSE和RMSE。随机森林——Max Stress的交叉验证结果R2MBEMAEMSERMSE第1折0.9998700.0001800.00187第2折0.9998400.000010.0001900.00209第3折0.9998500.0001900.00206第4折0.9998600.0001900.00201第5折0.9998400.00010.0001900.00210平均值0.9998500.0001900.00203随机森林——Tsai Wu的交叉验证结果第1折0.9989000.000220.000010.00346第2折0.9988700.000010.000210.000010.00346第3折0.9988000.000030.000220.000010.00358第4折0.9992600.000010.000200.000010.00279第5折0.9985300.000020.000240.000020.00396平均值0.998870.0000140.000220.0000120.00345随机森林——Tsai Hill的交叉验证结果第1折0.9994400.000140.000010.00240第2折0.9994600.000010.000160.000010.00237第3折0.9994800.000010.000150.000010.00232第4折0.9995500.000010.0001500.00219第5折0.9992800.000010.000160.000010.00276平均值0.999440.0000080.000150.0000080.00241随机森林——Hashin的交叉验证结果第1折0.9989900.000010.000190.000010.00315第2折0.9992600.000010.000180.000010.00270第3折0.9993300.000010.000180.000010.00258第4折0.9990700.000010.000190.000010.00304第5折0.9993800.000010.000180.000010.00249平均值0.999210.000010.000180.000010.00279随机森林——Christensen的交叉验证结果第1折0.9984300.000010.000280.000020.00399第2折0.9989700.000010.000270.000010.00326第3折0.9988500.000010.000270.000010.00348第4折0.9989900.000030.000270.000010.00323第5折0.9989900.000010.000260.000010.00354平均值0.998850.0000140.000270.0000120.00350表7. 针对高数值故障指数样本计算的各类误差指标（MBE、MAE、MSE、RMSE）。故障指数MBEMAEMSERMSEMax Stress-0.021100.023920.001080.03287Tsai Wu-0.037290.046700.004770.06909Tsai Hill-0.034370.037730.003370.05802Hashin-0.037680.041480.003970.06298Christensen-0.042520.050320.006770.08226表6和表7汇总了使用随机森林模型对所有故障指数进行建模后得到的各项指标。其他指标也呈现出类似的趋势，其中Christensen指标的预测性能尤为较差。图16和图17展示了Christensen指标的类似散点图，可以看出预测精度显著下降，性能最差。下载：下载高分辨率图像（408KB）下载：下载全尺寸图像图16. Christensen——随机森林预测值与实际值的散点图。下载：下载高分辨率图像（307KB）下载：下载全尺寸图像图17. Christensen——随机森林在高数值下的预测误差。图18和图19分别展示了随机森林、XGBoost和LightGBM这三种集成模型在所有故障指数值以及高指数值下的平均交叉验证误差情况。其中，尽管XGBoost在接近高FI值时的预测效果会有所下降，但这些高值区域正是研究结构失效机制的关键所在，即便如此，XGBoost的误差依然最低。在不同故障指数指标中，各模型的排名基本稳定：max_stress始终是预测效果最好的指标，而Christensen则排名最后。值得注意的是，基于max_stress训练的模型即使在处理关键案例时也能保持不错的性能，这也证明了它非常适合用来构建结构的数字孪生模型[21]。下载：下载高分辨率图像（192KB）下载：下载全尺寸图像图18. 不同学习方法在测试集上的RMSE性能对比。下载：下载高分辨率图像（198KB）下载：下载全尺寸图像图19. 不同学习方法在高指数值上的RMSE性能对比。3.2 人工神经网络图20展示了在训练和验证过程中，人工神经网络所对应的损失曲线。验证集包含训练阶段未曾见过的数据，用于评估模型的泛化能力。虽然训练设置为进行100轮，但由于采用了提前停止机制，训练实际上在更早的时候就终止了。提前停止机制会持续监测验证集的损失情况，一旦某一时段内损失不再有所下降（本例中为5轮），就会中断训练过程。这一机制不仅避免了过拟合，还能在模型尚未收敛到次优解时就停止训练，从而节省计算资源。从损失曲线的走势来看，并没有出现训练集和验证集损失之间典型的分化现象，这表明该人工神经网络并没有刻意记忆训练数据。下载：下载高分辨率图像（193KB）下载：下载全尺寸图像图20. Max Stress——人工神经网络训练与验证阶段的损失函数。然而，图21所示的预测值与实际值的散点图暴露出了明显的预测精度问题。与随机森林的分析结果类似，理想的状况应该是所有点都落在45°的对角线上，这意味着预测值与实际值完全吻合。但实际上，无论是训练集还是测试集的样本，其预测值都与对角线存在较大偏差。在FI值较低和较高的情况下都存在预测误差，而且还会出现饱和现象：无论输入如何，网络都无法预测超过某个阈值的FI值。这一表现强烈表明，该人工神经网络未能掌握背后的功能映射关系，属于欠拟合现象。下载：下载高分辨率图像（251KB）下载：下载全尺寸图像图21. Max Stress——人工神经网络的预测值与实际值的散点图。针对高临界性样本（FI?>?0.7），进行了更为详细的误差分析。如图22所示，预测误差会随着FI值的增大而上升，同时随着样本密度的降低而减小。这与训练样本较少时，模型难以获得足够信息来建立稳健映射的关系是一致的。与误差分布更为复杂的集成方法不同，人工神经网络的误差呈现近乎线性趋势，这进一步说明它的表征能力不足。下载：下载高分辨率图像（234KB）下载：下载全尺寸图像图22. Max Stress——人工神经网络在高数值下的预测误差。图23和图24中的条形图总结了训练集和测试集所有故障指数下的误差百分比。结果显示，训练集和测试集的误差几乎相同，这进一步体现了该人工神经网络缺乏泛化能力。具体而言，Christensen故障指数的预测误差最大，在训练集和测试集中的误差都约为26%，而max_stress的误差最低，接近18%。这些结果都表明，该人工神经网络难以适配数据特征，因此在所有指标上的表现都很不佳。下载：下载高分辨率图像（149KB）下载：下载全尺寸图像图23. 人工神经网络在所有故障指数上的RMSE性能表现。下载：下载高分辨率图像（138KB）下载：下载全尺寸图像图24.从理论角度而言，这一结果可归因于两个主要因素。首先，数据集的方差相对较低，这降低了使用人工神经网络的优势，因为这类网络通常需要较高的数据多样性及较大的样本量才能发挥其非线性函数逼近的能力。其次，低损伤指数与高损伤指数案例之间的不平衡限制了网络学习与极端结构行为相关模式的能力，从而导致关键值的系统性低估。这些局限性与现有研究结果一致，即与基于树的集成方法相比，人工神经网络在方差较低或数据不平衡的数据集上的表现欠佳。表8展示了各种神经网络架构的详细性能指标。总体而言，与集成方法相比，人工神经网络模型的性能较差，这进一步证明了神经网络解决方案与当前数据集的不匹配性。尽管从理论上讲，人工神经网络具有更高的灵活性和可扩展性，但其在结构健康监测任务中的有效性在很大程度上取决于是否拥有足够多样化的训练数据。因此，人工神经网络的结果仅作为参考基准：它为选择基于树的机器学习方法而非神经网络技术应用于当前场景提供了依据。在当前情况下，研究结果表明，在神经网络能够成为集成学习的有效替代方案之前，需要获取更多高损伤程度的样本或采用数据增强策略。表8显示了不同人工神经网络配置在不同损伤指数下的均方根误差值。

| 损伤指数 | 51个特征，3层 | 51个特征，4层 | 11个特征，3层 |
|----------|--------------|--------------|--------------|
| 训练集 | | | |
| 测试集 | | | |
| 最大应力 | 0.018 | 0.018 | 0.032 |
| 0.032 | 0.048 | 0.049 |

| 地点 | Tsai Wu | Tsai Hill | Hashin | Christensen |
|------------|-------------|-------------|-------------|--------------|
| 训练集 | 0.019 | 0.021 | 0.021 | 0.026 |
| 测试集 | 0.019 | 0.023 | 0.026 | 0.026 |
| 最大应力 | 0.041 | 0.040 | 0.036 | 0.044 |

4. 结论
本研究提出了一种基于有限元的机器学习框架，用于预测在静态载荷作用下受损复合翼盒的层内损伤指数。通过数值模拟，构建了一个包含结构受损区域、损伤程度、损伤强度、质心位置、应力状态以及五种经典复合材料损伤指数的完整数据库。这样的设计使得评估学习算法时，不仅能考虑整体预测误差，还能关注对结构健康评估最为重要的结构区域和损伤指数范围。研究结果表明，对于当前这种方差较低且数据不平衡的表格型数据集，基于树的集成回归模型比所测试的前馈神经网络架构更适用。XGBoost和随机森林在留出样本分析及交叉验证中表现出最可靠的性能，而人工神经网络模型则出现饱和现象且存在欠拟合问题，尤其是在高损伤指数区间。其中，最大应力指标的表现最为稳定，而克里斯滕森准则由于各应力分量之间存在较强的非线性耦合，仍是最难预测的指标。未来的工作应聚焦于三个有明确技术要求的方向：通过对装有传感装置的翼盒组件进行实验或实验数值混合验证，通过针对性模拟增加以高损伤指数为特征的梁结构配置，以及在建模过程中纳入层合板级描述符以考虑堆叠顺序和分层效应。在上述范围内，当前框架可作为一种快速筛选工具，用于初步的结构健康评估，并识别出需要进一步通过有限元分析或实验进行详细验证的配置。

CRediT作者贡献说明：
Dario Magliacano：写作——审稿与编辑，写作——初稿撰写，验证，方法论，研究，形式分析，概念构建。
Annalisa Letizia：写作——审稿与编辑，写作——初稿撰写，概念构建。
Sara Di Palo：验证，方法论，研究，形式分析。
Marika Alecci：验证，方法论，研究，形式分析。
Marco Bazzani：监督，资金筹措。

热点排行