Environmental Risk Assessment of Potential Toxic Elements in Co-Pyrolysis of Sludges and Plastics Based on Machine Learning
污泥与塑料共热解过程中潜在有毒元素的机器学习环境风险评估
《Toxics》:Environmental Risk Assessment of Potential Toxic Elements in Co-Pyrolysis of Sludges and Plastics Based on Machine Learning
Jialing Liu,
Xingyu Feng,
Xiyu Zhao,
Sen Yang,
Liyang Dong,
Asani Oneka Green,
Xu Wang and
Qing Huang
编辑推荐:
该研究开发了高精度、可解释的预测模型,并量化了核心风险因素对环境风险的贡献。基于2015年至2025年的实验数据集,研究人员构建了六种机器学习模型。特征重要性分析和沙普利加性解释(SHAP)分析被用于识别核心风险因素并解释模型的决策逻辑。结果表明,XGBoos
该研究开发了高精度、可解释的预测模型,并量化了核心风险因素对环境风险的贡献。基于2015年至2025年的实验数据集,研究人员构建了六种机器学习模型。特征重要性分析和沙普利加性解释(SHAP)分析被用于识别核心风险因素并解释模型的决策逻辑。结果表明,XGBoost、随机森林(Random Forest)和CatBoost的表现优于其他模型,测试准确率分别为0.94、0.92和0.90。特征重要性分析强调了六种不同模型中最重要的特征,其中Cd-F4、As-F1和Cu-F4对模型预测的贡献最为显著。SHAP分析量化了每个特征对模型预测的贡献,验证了Cd-F4是主要的风险判别因子,并进一步揭示了PTEs的F1和F4是区分风险水平的关键因素。本研究提出了一个可解释的机器学习框架,为污泥与塑料共热解工艺的优化及潜在风险评价提供了理论依据。
污泥与塑料共热解环境风险的机器学习评估研究解读
研究背景与问题提出
随着公众对环境质量与人类健康的日益关注,城市固体废物的稳定化固化、解毒、资源化和减量化成为环境科学的关键议题。近年来,污泥产量持续攀升,预计2036年干污泥产量将达1.706亿吨,如何实现其低成本资源化利用和无害化处理成为焦点。传统处置方法如填埋、焚烧和土地利用存在渗滤液污染、气体排放及长期累积风险。相比之下,污泥热解技术在快速减容、无害化和资源回收方面具有优势。同时,塑料因其轻质、耐用、低成本等特性被广泛应用,全球塑料废物量持续增长,预计2050年将达到120亿吨。由于污泥灰分高、有机质比例低导致热解过程能量不足,而废塑料具有高热值、低灰分的特点,将其与污泥共热解不仅能补充能量以实现系统热平衡,还能改善热解炭性能指标并降低处置成本。然而,共热解过程中塑料的存在可能通过改变反应气氛、灰分组成和矿物结构,影响潜在有毒元素(Potential Toxic Elements, PTEs)的挥发行为和化学形态,使其环境行为复杂化。PTEs的环境风险不仅与其总量有关,更与其在不同化学形态间的分布密切相关。通常认为酸溶/可交换态(F1)和还原态(F2)具有较高的迁移性和生物有效性,而残渣态(F4)则相对稳定。但在污泥与塑料共热解的复杂体系中,反应温度、停留时间、塑料掺混比等多种操作参数往往同时变化,导致PTEs形态与环境风险之间呈现非线性和多因素耦合作用,传统的单因素风险评估难以全面反映实际情况。当前研究多集中于共热解的能量转化与工艺优化,对该过程潜在生态与环境风险的研究相对有限。因此,开发融合多种操作参数和PTEs化学形态特征的环境风险评价模型至关重要。机器学习(Machine Learning, ML)方法因其在处理高维、多变量和非线性数据方面的能力,为复杂系统中的环境风险识别提供了新视角。基于此,研究人员开展了本项研究,旨在构建基于机器学习的污泥与塑料共热解PTEs环境风险等级分类与评估模型。
研究方法与技术路径
研究人员系统收集了2015至2025年间发表的关于污泥与塑料共热解过程中PTEs形态分布的同行评审文献数据,构建了包含162个实验记录的数据集。该数据集涵盖反应温度(0-950 °C)、反应时间(0-240 min)、塑料添加比例(0-100%)、升温速率(0-40 °C/min)、热解气氛(N2, CO2/O2, AIR, N2/O2)五种主要操作参数,以及聚氯乙烯(PVC)、聚乙烯(PE)等七种塑料类型,并记录了镉(Cd)、铬(Cr)、锰(Mn)、镍(Ni)、铅(Pb)、锌(Zn)、砷(As)、铜(Cu)八种PTEs经BCR连续提取法测定的四种化学形态(F1-F4)数据。数据预处理包括使用LabelEncoder对塑料类型进行编码,采用基于随机森林回归器(Random Forest Regressor)的IterativeImputer算法处理缺失值,并利用Z-score标准化消除量纲影响。随后,研究人员选取决策树(Decision Tree, DT)及五种集成学习模型——随机森林(Random Forest, RF)、极限梯度提升(XGBoost)、轻量梯度提升机(LightGBM)、梯度提升决策树(GBDT)和CatBoost进行模型开发与评估。数据集按7:3划分为训练集与测试集,并采用五折分层交叉验证优化超参数。模型性能通过准确率(Accuracy)、精确率(Precision)、召回率(Recall)和F1分数(F1-Score)进行评估。此外,研究引入沙普利加性解释(SHAP)分析以增强模型的可解释性,量化各特征对预测结果的贡献度。
研究结果与分析
2.1. 数据收集
研究人员汇集了涵盖广泛操作条件(温度、时间、塑料配比等)和多种PTEs化学形态特征的162组数据,为模型训练和验证奠定了坚实的数据基础。
2.2. 数据预处理
通过编码、插补和标准化处理,确保了数据集的完整性与一致性,使得不同尺度的特征能够公平地参与模型训练,避免了数值范围较大的特征主导学习过程。
2.3. ML模型开发
研究人员计算了个体生态风险(Er)和综合风险指数(RI),并根据RI值将风险划分为低(RI ≤ 50)、中(50 < RI ≤ 150)、高(150 < RI ≤ 300)和极高(RI > 300)四个等级。模型训练结果显示,XGBoost、Random Forest和CatBoost在测试集上的表现最佳,准确率分别达到0.94、0.92和0.90,加权F1分数分别为0.94、0.92和0.90,证明了集成学习算法在处理此类非线性分类问题上的优越性。
特征重要性与SHAP分析
特征重要性分析表明,六种模型共同识别出的最关键特征包括Cd-F4、As-F1和Cu-F4,这突显了特定元素特定形态对风险预测的决定性作用。进一步的SHAP分析不仅量化了各特征的贡献值,还验证了Cd-F4是区分风险等级的首要判别因子。分析揭示PTEs的F1(酸溶/可交换态)和F4(残渣态)是区分风险水平的核心形态指标,这意味着模型在决策时高度依赖于PTEs的生物有效性和长期稳定性特征。
结论与讨论
该研究成功构建了一个结合机器学习与化学形态学分析的污泥与塑料共热解环境风险评估框架。研究人员证实,通过整合操作参数与PTEs的精细形态特征,机器学习模型能够高精度地预测复杂体系下的环境风险等级。研究明确指出Cd-F4、As-F1等特定形态参数是驱动风险变化的核心因子,这为理解共热解过程中PTEs的环境行为提供了新的定量视角。该成果发表于《Toxics》,其重要意义在于克服了传统风险评估依赖单一总浓度的局限性,提出的模型具有良好的可解释性,能够为污泥与塑料共热解工艺的参数优化(如调控温度、塑料配比以降低高风险形态含量)提供直接的决策支持,对推动有机固废协同处置技术的环境安全管理具有重要的理论与实践指导价值。