《Buildings》:Machine Learning-Based Classification of Stakeholder Readiness for BIM-IoT Adoption in the Construction Industry of Pakistan: A Comparative Analysis of Random Forest, XGBoost, and Support Vector Machine
编辑推荐:
研究人员将三种监督式机器学习分类器(随机森林(RF)、XGBoost(XGB)和支持向量机(SVM))应用于一个包含107名建筑专业人士的数据集,这些专业人士有目的地从巴基斯坦的大型基础设施项目中抽样,包括中巴经济走廊(CPEC)项目和Barakahu绕道项目
研究人员将三种监督式机器学习分类器(随机森林(RF)、XGBoost(XGB)和支持向量机(SVM))应用于一个包含107名建筑专业人士的数据集,这些专业人士有目的地从巴基斯坦的大型基础设施项目中抽样,包括中巴经济走廊(CPEC)项目和Barakahu绕道项目。研究人员使用从整合的技术接受模型与技术-组织-环境(TAM-TOE)调查工具中衍生的五个构面特征,将利益相关者分类为高、中、低三个准备等级。XGBoost取得了最佳分类性能(准确率 = 93%,宏F1 = 0.93),其次是RF(91%,F1 = 0.91)和SVM(87%,F1 = 0.87)。三种结构不同的算法家族之间的收敛性表现表明,准备状态信号反映了一致的态度模式,而非任何单一建模假设的人为产物。特征重要性分析一致地识别出感知收益(32%)和技术意识(25%)为主导预测特征,其次是组织准备度(20%)、感知障碍(15%)和受访者概况(8%)。态度准备状态映射将62%的利益相关者归类为高准备度,28%为中度准备度,10%为低准备度,提供了一个探索性的态度细分框架,以帮助建筑管理者优先考虑能力建设投资,并需接受纵向行为验证。研究人员还发现,数字技术的意识始终领先于实施的组织准备度,这一模式与类似发展中国家建筑背景的研究结果一致。
**论文解读文章**
**研究背景与问题**
发展中国家的建筑行业持续记录着不成比例的高职业事故率,部分原因在于数字安全技术(包括建筑信息模型(BIM)和物联网(IoT)系统)的缓慢采纳。先前的实证研究通过基于调查的框架建立了解释利益相关者采纳意图的人口层面因素,但在方法论上,对个体利益相关者在部署前进行针对性的准备状态分类的能力尚未得到解决。针对这一空白,本研究开展了基于机器学习的分类研究。
**研究内容与结论**
研究人员应用三种监督式机器学习分类器(随机森林(RF)、XGBoost(XGB)和支持向量机(SVM)),对来自巴基斯坦大型基础设施项目(包括中巴经济走廊(CPEC)和Barakahu绕道项目)的107名建筑专业人士的有目的抽样数据集进行分类。研究人员使用从整合的技术接受模型与技术-组织-环境(TAM-TOE)调查工具中衍生的五个构面特征(技术意识、感知收益、组织准备度、感知障碍和受访者概况综合指数),将利益相关者分类为高、中、低三个准备等级。XGBoost取得了最佳分类性能(准确率=93%,宏F1=0.93),其次是RF(91%,F1=0.91)和SVM(87%,F1=0.87)。特征重要性分析一致地识别出感知收益(32%)和技术意识(25%)为主导预测特征,其次是组织准备度(20%)、感知障碍(15%)和受访者概况(8%)。态度准备状态映射将62%的利益相关者归类为高准备度,28%为中度准备度,10%为低准备度。该论文发表在《Buildings》上,其重要意义在于首次在发展中国家建筑背景下证明基于机器学习的态度准备状态分类是可行且具有诊断信息价值的,为建筑管理者提供了一个可直接用于部署前筛选的个体层面工具。
**关键技术方法**
研究人员采用了三种监督式机器学习分类器:随机森林(RF)是一种装袋集成方法,通过多数投票聚合多个决策树的预测;XGBoost(XGB)是一种梯度提升方法,通过序列树逐步纠正残差误差;支持向量机(SVM)是一种基于最大间隔超平面的分类器,使用径向基函数(RBF)核。数据集来源于巴基斯坦大型基础设施项目中107名建筑专业人士的有目的抽样(包括CPEC包4和5以及Barakahu绕道项目),受访者包括项目经理、现场工程师、规划工程师、安全官员、BIM实践者和顾问。特征工程通过计算每个预测构面内各项目的均值得分得到五个构面特征,目标变量(准备等级)基于行为意图(BI)构面均值得分通过三类阈值划分(高:≥4.5,中:3.5-4.49,低:<3.5)。数据预处理采用z-score标准化,并针对低准备度类别(10.3%)采用类别权重平衡和宏F1指标。模型超参数通过5折分层网格搜索交叉验证优化,最终评估采用留一法交叉验证(LOOCV)和500次自举重抽样以评估稳定性。
**研究结果**
**3.1 模型性能比较**:在保留测试集(n=21)上,XGBoost在所有指标上表现最优(准确率=93%,宏F1=0.93,MCC=0.88),其次是RF(准确率=91%,宏F1=0.91,MCC=0.85)和SVM(准确率=87%,宏F1=0.87,MCC=0.79)。所有三种机器学习模型均显著优于多数类基线(准确率=61.7%)和逻辑回归基线(准确率=79%,宏F1=0.76)。混淆矩阵显示,错误分类主要集中在高-中准备度边界,无高-低跨类别错误。
**3.2 模型稳健性:跨算法收敛性**:通过自举重抽样(95%置信区间:XGB宏F1 [0.87, 0.97],RF [0.85, 0.95],SVM [0.79, 0.93])和留一法交叉验证(LOOCV:XGB宏F1=0.89,RF=0.87,SVM=0.84)验证,排名顺序一致,表明分类信号稳定。阈值敏感性分析显示,在保守、原始和宽松三种阈值配置下,XGBoost宏F1范围保持在0.90-0.93,证明结果非特定阈值的人为产物。
**3.3 特征重要性分析**:通过三种方法(RF基尼杂质降低、XGB增益重要性、SVM排列重要性)评估,特征重要性排名完全一致:感知收益(32%)>技术意识(25%)>组织准备度(20%)>感知障碍(15%)>受访者概况(8%)。感知收益是最高区分度的特征,组织准备度在机器学习重要性中排名高于其在回归模型中的贡献。
**3.4 态度准备状态映射**:应用最佳性能的XGB分类器,全样本107名受访者的分类为:高准备度66人(62%)、中准备度30人(28%)、低准备度11人(10%)。高准备度利益相关者在感知收益、技术意识和组织准备度上得分均高于4.0;中准备度者态度得分高(4.1-4.3)但组织准备度低(3.2),表明约束是结构性的而非态度性的;低准备度者所有正向得分均低,感知障碍最高(4.6)。
**讨论与结论**
**讨论部分**:XGBoost优于RF和SVM,与Cha等人(2019)的结果不一致,但该差异可归因于数据类型和任务结构的不同:本研究使用连续Likert尺度特征和分类任务,而Cha等人使用分类变量和回归任务。SVM的较低性能符合其在类别不平衡和边界噪声下的已知局限性。特征重要性排名与TAM理论一致,为跨方法学验证提供了支持。感知障碍在回归中排名第三但在机器学习重要性中排名第四,体现了解释性与预测性建模框架的根本差异。SHAP分析揭示了每个特征对各准备等级的定向贡献:高准备度者所有特征正向贡献,中准备度者在组织准备度上呈负向贡献,低准备度者感知收益的负向贡献最强。研究提供了实用决策支持框架:中准备度者(28%)是最高干预回报群体,因为他们已具备态度一致性,仅需解决结构性缺口(如分阶段成本分担、内部冠军赋能、结构化能力发展);低准备度者(10%)需要基础数字化意识投资作为组织部署的前提。该框架设计了超越巴基斯坦的泛化性,因为TAM-TOE构面和意识-准备度缺口已在尼日利亚和加纳等发展中国家建筑背景下得到独立验证。
**研究结论**:
本研究将随机森林、XGBoost和支持向量机分类器应用于巴基斯坦建筑行业BIM-IoT采纳的利益相关者准备状态分类问题,首次证明在发展中国家建筑背景下,基于机器学习的态度准备状态分类既是可行的,也具有诊断信息价值。三个主要结论如下:第一,XGBoost是此任务的最佳性能分类器(准确率=93%,宏F1=0.93,MCC=0.88),三种结构不同的算法家族之间的收敛性表现(宏F1范围:0.87-0.93;MCC范围:0.79-0.88)表明准备状态信号反映了该数据集中的稳定态度模式。第二,感知收益(32%)和技术意识(25%)是预测个体准备度最具诊断力的特征,与TAM理论中感知有用性首要性的预测一致。第三,预测性准备状态地图(62%高、28%中、10%低)提供了一个可直接操作的细分框架。中准备度群体以高态度准备度受组织资源缺口限制为特征,代表了最具成本效益的能力建设干预目标;低准备度群体需要在组织部署之前进行基础意识投资。本文记录的意识-准备度缺口结构与尼日利亚建筑行业的研究结果一致,表明这是发展中国家经济体建筑技术扩散的一个可泛化特征。未来研究应追求:(1) 纵向验证,通过重新调查相同的107名受访者12-18个月后,检验高准备度等级分类是否能预测实际的BIM-IoT采纳行为——这是当前横截面设计无法提供的关键外部有效性测试;(2) 在更大规模的多国数据集上进行留一法交叉验证,以解决样本量限制;(3) 基于SHAP的个体可解释性分析,以识别将每个受访者置于其准备等级的特定构面。最后,需要强调一个方法论警示,它限制了对本文所报告分类器的实际解释:XGBoost模型在态度数据上达到了93%的分类准确率;然而,被分类的是与BIM-IoT采纳构面系统的态度一致性和受访者调查答案的内部一致性,而非实际部署后的采纳行为。因此,高准确率反映了模型在横截面自我报告工具中识别一致态度模式的能力,不应被解释为真实世界实施成功的预测。将分类与观察到的部署结果联系起来的纵向跟踪仍然是在操作决策中使用该模型进行行为预测之前的必要条件。