地下采矿环境中的预测性维护面临严峻挑战,包括受限空间、高湿度、硅尘(SiO?)存在以及有限的可进入性。本研究基于油液分析与机器学习构建了针对采矿设备多舱室(发动机、液压系统、传动装置、差速器)的预测框架。样本按照ASTM标准处理,整合磨损金属浓度(Fe、Cu、Cr、Pb、Al)、理化性质(黏度、总碱值(TBN)、烟炱(soot))以及污染物(Si、Na)。基于摩擦学原理构建可解释比率。三种算法(随机森林(Random Forest)、梯度提升(Gradient Boosting)和XGBoost)经交叉验证评估。XGBoost达到最佳平衡(F1 = 0.852,AUC = 0.975),关键类别召回率达94.5%,199个测试样本中仅3例假阴性,而随机森林呈现最高全局区分能力(AUC = 0.978)。SHAP(SHapley Additive exPlanations)分析揭示100 °C黏度为最重要预测因子(SHAP ~0.9),超越铁元素。未发现时间性磨损趋势(R2 = 0.000)。阈值优化至0.25使假阴性降低67%(从9降至3)。该框架为地下环境提供具有不确定性量化的可解释预测。
地下采矿作业的连续运营高度依赖安装于关键设备上的柴油机性能,如铲运机(LHDs)、低轮廓卡车、凿岩台车和运输设备。这些发动机的故障不仅导致非计划停机与重大生产损失,还危及人员安全、工艺稳定性和整体运营可用性。该问题在地下采矿环境中尤为突出,归因于受限空间、高湿度、悬浮硅尘、变负荷作业、持续机械振动以及检修任务受限等严重工况。因此,传统的事后维修和预防性维护方案日益不敷使用:前者于故障发生后才响应,后者按固定周期干预,无法反映资
为了应对上述挑战,数据驱动的预测性维护作为能够通过连续监测运行变量预测故障的策略而日益受到重视。人工智能(AI)通过建模非线性关系、从时序信号中提取复杂模式以及估计难以用经典技术捕获的退化指标,显著扩展了预测性维护的能力。这一发展得益于传感器、SCADA(监控与数据采集)平台、物联网(IoT)基础设施以及先进机器学习和深度学习技术的日益普及。然而,将这些进展有效应用于地下采矿设备发动机仍面临阻碍,包括数据异质性、噪声污染、标注记录稀缺、运行工况多变,以及将其他行业开发的模型迁移至真实采矿环境的困难。
尽管重机械、轴承、发电机和能源系统等领域已报告 promising 结果,但相当一部分文献聚焦于孤立部件、受控场景或高阶综述。现有研究在露天采矿中利用经粒子群算法优化的XGBoost模型预测机械铲故障时间,在其他采矿领域利用数字孪生预测提升系统疲劳失效,在可再生能源领域结合随机森林、XGBoost和LightGBM的集成方法以高频率振动样本检测风力涡轮机轴承故障。对于关键采矿机械,CNN(卷积神经网络)和LSTM(长短期记忆网络)等深度学习架构已用于实时故障诊断和退化评估。然而,算法准确性在受控环境与模型在实际运行约束下的实用价值之间仍存在差距。
识别到的研究空白在于:尽管存在将机器学习应用于振动、电流和运行变量分析以进行各行业发动机预测性维护的研究,也有从统计和阈值方法角度探讨采矿设备油液分析作为状态监测技术的文献,但尚未发现针对地下采矿设备柴油机故障预测、专门基于油液分析构建机器学习模型的研究工作。这种油液分析(磨损参数、污染和润滑剂退化)与先进机器学习技术的结合在该特定运行环境中仍属空白。
研究人员开展了基于油液分析与人工智能技术的地下采矿设备柴油机预测性维护研究。不同于基于振动或电流的方案,油液分析是采矿领域广泛使用的非侵入式监测技术,但其通过机器学习进行预测的潜力尚未得到充分开发。研究目标在于促进早期故障检测和资产退化行为建模,弥合文献方法学进展与地下采矿系统运营需求之间的差距。
该研究的科学贡献体现在四个维度。第一,先前未有研究将机器学习应用于地下采矿设备油液分析以进行预测性维护,而该领域极端条件(硅尘、高湿度、受限空间、变负荷、有限进入)使故障预测尤为困难。第二,与多数研究聚焦单一部件不同,该工作同时分析所有关键舱室:发动机、液压系统、传动装置和差速器。分析对象为配备271 HP发动机的低轮廓装载机(LHD),全负荷运行于1950 RPM,分两个日班作业,使用SAE 15W-40发动机油(10加仑)、T46液压油(70加仑)和80W90/85W140传动油(10加仑和4加仑)。第三,与传统摩擦学文献将铁视为主导磨损指示剂不同,SHAP分析揭示100 °C黏度为最重要预测因子(SHAP ~0.9),这一反直觉发现具有重要运营意义。第四,数据集包含28个月连续地下采矿作业的995个真实样本,确保了实践有效性。
研究采用五阶段方法框架:油液分析采样与数据采集;数据预处理与验证;特征工程提取磨损和退化指标;开发训练机器学习模型进行故障预测;生成维护干预规划建议。
采样遵循ASTM D4057标准,热态(约80–95 °C)抽取,确保样本代表性。发动机油每150工
采样一次,极端条件下缩短至100小时。样本送至ISO/IEC 17025认可实验室分析,参数分为三类:光学发射光谱(OES)按ASTM D5185量化磨损金属和污染物浓度;理化性质评估润滑剂退化;按ISO 4406进行颗粒计数确定油液清洁度等级。同步记录运行变量:累积运行小时、距上次换油时间、平均运行温度、维护事件记录和故障记录。
预处理使用Python 3.12及Pandas、NumPy和Scikit-learn库。统一变量命名,清洗重复记录和修正分类变量笔误。连续变量缺失值采用线性时序插补;分类变量以众数填补;缺失超30%记录删除。异常值通过箱线图识别(1.5倍四分位距(IQR)范围),并与历史维护记录交叉核验:对应真实事件者保留,属测量误差者修正或删除。所有预处理步骤仅限训练集拟合参数,再应用于测试集以防数据泄露。未进行特征缩放,因树模型对输入特征尺度不敏感。
特征工程基于摩擦学和润滑剂化学原理构建五组物理可解释比率:铁颗粒指数比(Fe/PQ)区分腐蚀磨损与急性磨损;铁黏度比(Fe/Visc)衡量铁磨损相对于润滑剂退化的程度;铜铝比(Cu/Al)区分轴承磨损(铜)与活塞磨损(铝);硅铁比(Si/Fe)识别粉尘污染;金属总和作为总磨损聚合指标。分母添加单位常数避免除零。Fe/PQ比率依据ASTM D8315:2020文献,区分腐蚀磨损(高Fe、低PQ)与大颗粒急性磨损(低Fe、高PQ)。Cu/Al比率中,铝活塞磨损为柴油机主要失效模式有文献记载。Si/Fe比率识别硅尘污染与金属磨损,文献表明采矿设备最有害污染物为硅尘和水分。金属总和遵循Kauffman等的多元素测定方法。
模型开发比较三种集成算法,各设三
超参数配置,经分层交叉验证选取最优,并以面向操作误差的
模型进行评价。随机森林作为鲁棒基线,梯度提升作为中间层级,XGBoost作为主选候选,因其计算效率、缺失值处理能力和L1/L2正则化机制。采用分层5折交叉验证(StratifiedKFold)保持类别比例。XGBoost配置经训练与验证曲线优化,识别偏差-方差权衡最优
XGBoost以n_estimators=500和early_stopping_rounds=30训练,验证集损失30轮无改善则自动停止。评价指标包括F1-Score、AUC-ROC、Precision-Recall AUC、准确率、混淆矩阵和分类报告。因假阴性(未检测到的故障)操作成本显著高于假阳性(误报),优先保证关键类别召回率。决策阈值从默认0.50调整至0.25,记录各阈值下召回率、精确率、F1、假阴性和假阳性,选定F1-Score超0.78且假阴性最小化的最高阈值。采用SHAP计算测试集各变量对个体预测的贡献,向维护人员解释设备划分为关键状态的原因。
模型输出通过阈值决策方案转化为行动建议:概率低于0.25为正常状态,0.25–0.60触发油样复测和目视检查,0.60–0.80预警潜在故障建议提前干预,高于0.80则预测故障需立即停运检查。磨损金属和构造比率分析还可定向内部部件:铁持续升高提示气缸和活塞环磨损,需规划缸套和换环;铜或铅升高指示连杆或主轴承磨损,定向衬套和轴承更换;高硅值提示进气系统故障导致粉尘侵入,触发空气滤清器核查更换(初级每75小时,次级每150小时);TBN下降至初始值50%以下且黏度升高表明润滑剂严重退化,建议换油和滤清器更换。
数据集包含995个油样,来自28个月连续地下采矿作业的
关键LHD单元,分布为正常状态253样本(25.4%)、注意状态463样本(46.5%)、关键状态279样本(28.1%),覆盖发动机、液压系统、传动装置和差速器。
Pearson相关矩阵分析显示,Fe与PQ中度相关(r = 0.57),与100 °C黏度(r = 0.51)相关,其余变量低相关(|r| < 0.30),表明多数预测因子相互独立,为模型提供信息多样
性。Fe和PQ关联相同内部金属磨损现象,支持其作为早期故障检测关键变量。
三种集成算法的区分能力评估显示,随机森林AUC最高(0.978),XGBoost(0.975)和梯度提升(0.969)次之。F1-Score方面XGBoost最优(0.852),略超随机森林(0.851)和梯度提升(0.836)。所有模型AUC超0.96、F1-Score超0.83,ROC曲线从原点近乎垂直上升,表明高真阳性率
极低假阳性水平。XGBoost通过阈值调整至0.25和scale_pos_weight=2.58的参数实现更优精确率-召回率平衡。
XGBoost训练损失从0.69降至0.19,验证损失稳定在0.232,差距0.0503。早停于第499轮,表明模型正确学习数据集模式,差距小显示良好泛化能力,归因于XGBoost的L1/L2正则化(α = 0.5, λ = 5.0)。
在199样本测试集上,优化阈值0.25的混淆矩阵显示:正确分类133例非关键和49例关键,总体准确率91.5%,关键类别召回率87.5%,假阳性10例,假阴性7例。7例假阴性代表系统未检测到的真实故障,在地下采矿环境中意味着应检修却继续运行的设备,存在严重机械故障和非计划停机风险。阈值从0.50调整至0.25以降低假阴性、略增假阳性,是采矿运营风险
XGBoost的SHAP分析揭示,100 °C黏度为最重要变量(SHAP ~0.9),远超Fe(~0.15);Fe_Visc_ratio(~0.58)和Cr(~0.55)次之;构造比率Cu_Al_ratio和metals_sum中等重要(~0.30–0.40)。蜂群图显示高黏度值(红点)向右偏移,低铬值(蓝点)向左集中。这一反直觉但物理一致的发
现表明,模型优先通过润滑剂化学退化(氧化、烟炱或燃油稀释导致的黏度增加)而非金属磨损预测故障,方向与物理一致:高黏度推向关键状态因油膜增厚无法正常流动保护部件,低铬远离关键性。
Fe与PQ散点图分析显示,正常状态集中于Fe低于30 ppm、PQ指数低值的左下区域;关键状态分散于Fe高于80 ppm、PQ指数高于120 ppm的区域。Fe约10–50 ppm且PQ指数低至中等值的中间区域存在三种状态显著重叠,解释了7例假阴性:存在Fe和PQ值处于模型关联于注意或正常范围的关键案例。线性拟合R2 = 0.000确认两变量无线性关系。虽然极端区域区分可靠,但中间重叠区和非线性边界证明XGBoost等非线性集成模型优于简单替代方案,也提示未来需纳入连续样本间时序趋势或设备负荷历史等附加变量以减少过渡区不确定性。
Fe分布按状态呈现明显递升:正常48 ppm、注意59 ppm、关键119 ppm,关键状态上尾延至约120 ppm,反映严重磨损事件的高离散度。其他金属:Cu分别为18、31、73 ppm;Al:21、17、37 ppm;Cr:3、3、5 ppm;Pb:4、3、6 ppm。Fe、Cu和Pb的上升趋势确认退化是多金属 simultaneous 影响气缸和活塞环(Fe)、衬套和主轴承(Cu、Pb)的过程。Fe在关键状态的显著升高(119 ppm)及高离散度表明磨损不仅更严重且更 variability 和 less controlled,反映疲劳或磨蚀导致的加速磨损事件出现。
阈值优化分析显示,随阈值从0.50降至0.25,召回率从0.85升至0.945,精确率从0.84降至0.73;假阴性从9降至3(降低67%),假阳性从8增至20。最优阈值0.25处召回率达最大且F1-Score高于0.80。该决策完全契合地下采矿运营背景:假阴性成本(未检测关键设备致灾难性故障风险)远超假阳性成本(非必要检查),操作 justify 选择低于默认值的阈值。
随机森林和梯度提升的特征重要性(平均不纯度减少MDI)显示,两模型首变量排名一致:100 °C黏度领先(随机森林0.18,梯度提升0.33),Fe_Visc_ratio次之(0.15和0.20),Si第三(0.09和0.10)。Fe在随机森林仅列第五(0.08)。两模型排序一致性验证了结果的鲁棒性:无论算法如何,100 °C黏度和Fe_Visc_ratio是关键状态的主导预测因子。Fe_Visc_ratio——特征工程阶段构造的比率——在两模型均居第二,确认变量组合比原始变量单独提供更多诊断信号。Si的重要性表明外部颗粒污染(尘土、粉尘)也是相关预测因子,可能因高环境污染条件下设备退化更快。
Fe时序趋势线性回归拟合260个顺序样本,R2 = 0.000,回归线基本水平于25 ppm附近。注意阈值(17 ppm)和关键阈值(23 ppm)均低于拟合线。R2 = 0.000证实样本序号(时间代理变量)不能解释Fe变异,表明退化既非渐进也非累积,而是随机的、受可变运行
二阶多项式拟合确认线性模型相同结果(R2 = 0.000),构成不同方法间的内部交叉验证。未来区间(样本262至280)的不确定带为±1.5σ,范围约5至47 ppm,诚实反映发动机Fe的高残差变异。红色垂线指示关键阈值已在当前投影中被超越,确认发动机慢性运行于风险区。带宽非方法缺陷而是对现实的统计正确表征:残差方差高时,任何RUL点预测均有内在不确定性,必须向运营者明确传达。该方法证明系统不仅生成点预测,还量化自身不确定性,是高风险预测维护应用所需的方法论成熟度标志。
XGBoost超参数验证曲线分析:max_depth从2至6,验证AUC在深度3处(~0.934)后稳定略降,训练AUC持续增长至0.985,深度4起显现过拟合;learning_rate在测试最大值0.10处验证AUC达~0.937,训练与验证间差距恒定;reg_lambda从1.0至12.0,验证AUC从~0.935单调降至~0.928,表明L2正则化超1.0后惩罚区分能力而无泛化收益。最终选择max_depth=4(过拟合显著前)、learning_rate=0.03(保守值允许多轮迭代不过拟合)、reg_lambda=5(适度正则化),基于验证性能与过拟合控制的平衡,而非最大化训练AUC。
5折交叉验证AUC分布显示:随机森林Config 3(max_depth=10, n_estimators=500)最优,中位AUC~0.945且箱体紧凑,Config 1变异性更大;梯度提升箱体最紧凑、跨折变异最小,Config 2(learning_rate=0.05, n_estimators=300)最优(~0.960);XGBoost变异大于梯度提升,Config 1(max_depth=4, learning_rate=0.05)达~0.950但存在弱折下限异常值。配置选择基于5次独立分割的统计证据,梯度提升是三模型中最稳定的,但非绝对AUC最高。
三模型三配置比较的误差条图显示:随机森林三配置F1相似(~0.83–0.85),Config 3 AUC领先(~0.948),Config 1误差条更宽确认100棵树不足以稳定该规模数据集;梯度提升最一致,三配置F1和AUC均非常相近且误差条小,Config 2边际领先,配置间同质性表明梯度提升对该范围内超参数选择鲁棒;XGBoost配置间差异最大,Config 1 F1最高(~0.83)但误差条最大,Config 3(max_depth=2, learning_rate=0.01)F1最低(~0.68)且高变异,证实极浅树配极慢学习率致300估计器欠拟合。XGBoost Config 1选为最优是因其更高AUC,故障检测中按风险排序能力(AUC)比固定阈值下的精确率-召回率平衡更有价值。
100 °C黏度行为分析:箱线图显示三状态黏度中位均约14.8 cSt,无明确升降趋势;历史趋势确认稳定性,围绕均值微小波动;6个月预测维持同水平,窄不确定带反映低历史变异性。该发现表面与SHAP高重要性矛盾,实则因模型学习
偏离名义黏度值的微小变化即为关键状态的敏感预测因子,尽管这些偏差在聚合图中不可见。运营中意味着监测系统必须关注黏度微小变化,因其可成为燃油稀释、氧化或污染的早期指标。SAE 15W-40油100 °C正常黏度范围9–16.3 cSt,观测值14.8 cSt处于该范围且接近上限,上限附近微小变化物理意义重大,指示油液接近使用寿命终点。
研究结论部分指出,应用于所分析特定地下采矿作业油液分析的集成式机器学习模型(随机森林、梯度提升和XGBoost)达到卓越性能,所有评估算法AUC高于0.96、F1-Score高于0.83。结果表明,油液分析作为采矿领域广泛可用的非侵入式监测技术,对所分析设备而言足以开发高精度预测性维护系统,无需振动或电流传感器等额外仪器。在该数据集中,100 °C黏度被发现是关键设备状态的最重要预测因子(SHAP ~0.9),远超传统视为柴油机主要磨损指示
剂的铁(SHAP ~0.15)。该发现提示,在所分析地下采矿作业恶劣条件下,润滑剂的化学退化——因氧化、烟炱积累或燃油稀释——可能是先于金属磨损的关键因子。对所分析设备,监测系统应特别关
意的变化,作为潜在早期退化信号。决策阈值从0.50调整至0.25,将假阴性从9降至3,降低67%,优先保障故障检测而非精确率。该权衡在所分析特定采矿作业中完全合理,因未检测故障成本(非计划停机、生产损失、安全风险)远超非必要预防性检查成本。此结果强调将模型性能指标与实际运营成本对齐的重要性,而非优化准确率或默认F1-Score等通用指标。