今日动态 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通首页  >  今日动态  >  正文

基于回归的混合机器学习模型在加尔各答空气质量指数预测中的性能评估

《Scientific Reports》:Regression based hybrid machine learning model performance evaluation on air quality index prediction in Kolkata

【字体: 大 中 小 】 时间:2026年06月11日 来源:Scientific Reports 3.9

编辑推荐:

  摘要空气污染,尤其是颗粒物浓度的升高,对城市地区的公共健康和环境可持续性构成了重大威胁。本研究通过运用机器学习和混合集成模型,构建了一个用于预测空气质量指数(AQI)的稳健框架。为了处理数据集中的缺失值,采用了一种多步骤插补方法来预处理包含气象变量和空气污染物的数据集。空气质量指

  

摘要

空气污染,尤其是颗粒物浓度的升高,对城市地区的公共健康和环境可持续性构成了重大威胁。本研究通过运用机器学习和混合集成模型,构建了一个用于预测空气质量指数(AQI)的稳健框架。为了处理数据集中的缺失值,采用了一种多步骤插补方法来预处理包含气象变量和空气污染物的数据集。空气质量指数(AQI)被选为目标变量。为了评估目标变量之间的依赖性,考虑了两种特征配置:一种是包含所有特征的完整配置,另一种是不包含PM2.5和PM10的简化配置。研究使用了多种模型,包括线性回归、决策树、随机森林、梯度提升、KNN、MLP和LSTM,以及集成方法如投票回归器和堆叠回归器。同时,还纳入了基线模型(如持久性模型和SMA模型)进行对比分析。评估模型性能时,采用了时间序列的训练-测试分割方法,指标包括RMSE、MAE、MAPE、RMSLE和R2。投票回归器获得了最低的RMSE(10.938)和最高的R2(0.974),而堆叠回归器则表现出最低的MAE和MAPE,这表明集成模型的性能更为优越。LSTM模型能够捕捉时间变化模式,但其性能低于集成模型。特征较少的模型表现明显较差,进一步凸显了颗粒物的重要性。SHAP分析显示PM2.5和PM10是最具影响力的特征,而鲁棒性分析则表明这些模型的性能较为稳定。

相关新闻
生物通微信公众号
生物通新浪微博
微信
新浪微博
我要投稿
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:智能分选、误差预测、激光粒度、环境风险、城市污染、数据挖掘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号