基于多尺度时空信息，估算长江三角洲地区每日1公里范围内的PM2.5浓度

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Atmospheric Pollution Research》：Estimating daily 1-km PM 2.5 concentrations across the Yangtze River Delta region based on multi-scale spatiotemporal information

【字体：大中小】 时间：2026年03月19日 来源：Atmospheric Pollution Research 3.5

编辑推荐：

　　PM2.5浓度估计的两阶段深度学习方法在长江三角洲地区应用，首先通过Aero-Transformer模型填补AOD数据缺失值（R2=0.94），其次STAFNet模型融合多尺度空间特征与短时-长时联合建模，实现日尺度PM2.5高精度估算（R2=0.92，RMSE=7.02）。研究揭示区域PM2.5季节分布为冬＞春＞秋＞夏，空间分布呈现北部高南部低特征。

曾巧琳|王欣|范萌|陈良富|朱松岩

中国重庆市空间大数据智能技术工程研究中心，重庆400065

摘要

在空气质量评估和流行病学研究中，构建一个全覆盖、高质量的PM_2.5数据集至关重要。在区域PM_2.5估算中，分析PM_2.5与驱动因素之间的时空异质性时，常常忽略了空间邻域特征和时间演化模式。为了解决这个问题，本研究提出了一种两阶段深度学习方法来估算长江三角洲（YRD）地区的PM_2.5浓度。首先，设计了一个Aero-Transformer模型来填补气溶胶光学厚度（AOD）的缺失值，其填补性能表现出色（R²=0.94）。接下来，构建了一个时空注意力融合网络（STAFNet），通过提取多尺度时空特征来估算每日PM_2.5浓度。具体来说，在空间模块中设计了一种新颖的多尺度特征提取机制和多通道特征交互注意力机制，以从目标网格单元及其周围区域提取多尺度空间特征。在时间模块中，采用了一种“短期+长期”的联合建模框架，结合了基于差分自注意力机制的LocalGRU结构来捕捉精细的时间演化特征。与其他模型相比，STAFNet模型取得了最佳性能（R²=0.92，RMSE=7.02 μg/m³）。季节平均图显示，PM_2.5浓度表现为冬季 > 春季 > 秋季 > 夏季。从空间上看，PM_2.5浓度在北部较高，南部较低。本研究推进了估算技术的发展，并为YRD地区的污染预防和控制提供了有意义的数据支持。

引言

PM_2.5是指空气动力学直径不超过2.5微米的细颗粒物（Qian等人，2024年）。高浓度的PM_2.5与多种不良健康效应有关（例如，心血管疾病（Basith等人，2022年），慢性阻塞性肺疾病（Bai等人，2023年）。中国已建立了许多空气质量监测站来测量PM_2.5浓度（Li等人，2023年）。然而，监测站分布不均，阻碍了对PM_2.5时空特征的分析（Wu等人，2024年）。这一限制可以通过卫星遥感数据来缓解，因为卫星遥感数据具有广泛的空间覆盖范围（Ma等人，2022年）。气溶胶光学厚度（AOD）已被用于PM_2.5的估算（Xu等人，2025年）。然而，由于卫星轨道周期和云层覆盖，AOD数据中经常出现随机缺失值（Unik等人，2023年；Zhu等人，2023年）。为了提高AOD的覆盖率，Wang等人（2025年）采用了极端梯度提升（XGBoost）模型来填补缺失的AOD值。Zeng等人（2024b）开发了一个多层感知器（MLP）模型来拟合AOD与气象变量之间的关系，重建了2019-2023年的全覆盖AOD数据集。

PM_2.5估算方法分为模型驱动和数据驱动两种方法。模型驱动方法通常以化学传输模型（CTMs）为代表，如GEOS-Chem（Bey等人，2001年）和CMAQ（Wang等人，2023年）。CTMs不依赖于地面观测数据，是最早用于PM_2.5估算的工具之一。然而，它们计算复杂，且依赖于排放清单的准确性和时效性（Zhu等人，2023年）。相比之下，数据驱动方法侧重于从观测数据中学习映射关系，包括统计回归模型、机器学习模型和深度学习模型。在统计模型中，通过拟合预测变量和目标值之间的线性关系来估算PM_2.5浓度（例如，线性回归（LR）（Wan等人，2025年），地理加权回归（Chen和Wei，2024年）。尽管统计模型比CTMs更容易实现，但它们在捕捉变量之间的复杂非线性关系方面效果较差，且准确性受样本大小的影响（Wang等人，2024年）。最近，由于机器学习模型在模拟复杂非线性关系方面的强大能力，如随机森林（RF）（Lin等人，2022年），XGBoost（Wang等人，2022年）和LightGBM（Wong等人，2024年），它们被广泛用于估算PM_2.5浓度。然而，这些方法通常采用点对点建模，难以完全捕捉时空动态（Tang等人，2024年）。相比之下，深度学习模型可以利用反向传播机制有效捕捉大规模数据集中的潜在时空依赖性（Zhou等人，2024年），已成为PM_2.5估算的流行方法。

卷积神经网络（CNN）因其出色的性能而被用于提取空间特征（Borjigen等人，2024年；S. Wang等人，2022年）。例如，设计了PMUnet（Mazza等人，2025年）模型和空间邻域深度神经网络（SNDNN）（Chen等人，2023年）模型来估算PM_2.5浓度，证明了结合空间特征的有效性。为了捕捉更深层次的空间信息，许多研究尝试提取多尺度特征。例如，She等人（2024年）和Wei等人（2024年）利用不同波段的顶大气（TOA）反射率分析了污染物与各种环境变量之间的关系。Chen等人（2021年）使用深度贝叶斯网络提取多尺度空间特征来估算PM_2.5浓度。他们的研究表明，提取多尺度特征可以提高PM_2.5估算的准确性。同时，引入了注意力机制来增强空间特征表示。这些机制引导模型关注关键空间区域，同时抑制无关信息（Wu等人，2023年；Zeng等人，2024a）。Zhang等人（2024年）将注意力机制与RF结合，以捕捉相邻站点之间的空间依赖性。Zeng等人（2023年）将注意力机制纳入U-Net中，以增强从邻近区域提取空间特征的能力。Wang等人（2024年）利用空间注意力增强了关键空间信息的表达，实现了对中国范围内PM_2.5的估算。尽管注意力机制增强了空间信息的表达并提高了估算准确性，但仍存在两个关键挑战。首先，注意力机制通常使用全局池化来生成通道或空间权重，但这一过程可能会忽略重要的局部结构信息（Yu等人，2024年）。其次，当前的注意力机制主要关注局部特征相关性，缺乏整合跨区域多尺度空间特征的能力。因此，有必要进一步探索将多尺度空间特征与注意力机制相结合，以提取丰富的空间信息。

循环神经网络（RNN）（Lu等人，2021年），门控循环单元（GRU）（Ma等人，2024年），时间卷积网络（TCN）（Zeng等人，2023b），长短期记忆网络（LSTM）（Zhu等人，2022年）和Transformer模型（Liu等人，2024年）常用于提取时间信息。由于RNN的序列性质，它们在处理长序列时效率较低（Kumar和Kumar，2024年）。TCN计算效率高，但由于其接收场有限，难以捕捉全局时间依赖性（Hu等人，2024年）。Transformer模型通过多头自注意力克服了序列建模的局限性，能够捕捉全局时间依赖性，推进了PM_2.5的时间建模。PM_2.5浓度和气象变量在短时间尺度上波动剧烈，但在较长时期内变化相对平稳，并表现出明显的周期性模式（Lin等人，2024年；Wang等人，2025年）。然而，时间建模中通常忽略了短期剧烈波动和长期周期性变化的影响。因此，一些研究探索了不同的方法来增强Transformer模型提取时间特征的能力。例如，Li等人（2024年）将ConvGRU与自注意力结合，以捕捉多维时间特征，提高了自注意力在PM_2.5预测中的有效性。Zhang等人（2024年）对PM_2.5时间序列进行了趋势分解，并用傅里叶注意力替换了自注意力，提出了STFformer模型来捕捉季节性特征。Zou等人（2024年）结合了LSTM和Transformer来提取多级时间特征，有效减少了PM_2.5的估算误差。Transformer模型对时间特征的建模能力得到了提升，但仍难以完全捕捉短期波动。因此，如何有效整合短期和长期时间信息仍然是PM_2.5估算中的一个重要挑战。

本文提出了一种两阶段时空模型策略来应对上述挑战。首先，开发了Aero-Transformer模型来模拟多源数据与AOD之间的关系，旨在获得长江三角洲（YRD）地区的全覆盖AOD。其次，设计了时空注意力融合网络（STAFNet）来估算2019年至2024年的每日1公里PM_2.5浓度。STAFNet模型由空间模块和时间模块组成。空间模块基于Resnet块（ResBlock）架构构建，并通过多尺度特征提取机制和多通道特征交互注意力机制进行了增强。时间模块中构建了一个联合建模框架，其中提出了LocalGRU和差分自注意力机制，共同捕捉短期细粒度时间变化和长期周期性趋势。随后，采用了不同的交叉验证（CV）策略来评估STAFNet模型在YRD地区全覆盖PM_2.5估算中的有效性。

研究区域

本研究聚焦于中国的YRD地区，包括上海、江苏、浙江和安徽的全部区域（图S1）。YRD地区工业密集、人口众多，是中国经济最发达的地区之一，也是PM_2.5预防和控制的关键区域（Su等人，2022年）。近年来，YRD地区的PM_2.5浓度显著改善，但由于冬季

Aero-Transformer模型

由于AOD与气象因素之间存在复杂和非线性关系，提出了一种基于Transformer编码器的插补模型来填补AOD的缺失数据。Transformer模型是最先进的深度学习架构之一，其多头自注意力机制可以评估输入序列中每个时间步的重要性（Yan等人，2023年）。如图1所示，Aero-Transformer旨在处理不同程度的数据缺失。

AOD插补评估

为了评估Aero-Transformer模型在AOD插补中的有效性，将其与其他几种方法进行了比较（表1），包括LR（Cheng等人，2019年），RF（Youn等人，2024年），CatBoost（Ding等人，2024年），LightGBM（Yu等人，2024年），XGBoost（Wang等人，2025年）和MLP（Zeng等人，2024b）。Aero-Transformer模型在所有比较方法中表现最佳，R²为0.94。此外，它的误差变化最小。XGBoost和MLP也表现出

AOD在PM_2.5估算中的重要性评估

2019年至2024年YRD地区原始MAIAC AOD数据的缺失率如图S17所示。Terra和Aqua卫星的平均缺失率分别为79.68%和81.75%。合并两个数据集后，整体缺失率略有下降，但仍高达74.49%。在整个研究期间，年度AOD缺失率通常超过75%。2024年的AOD缺失问题尤为严重，Terra的缺失率达到82.46%，Aqua的缺失率达到84.81%

结论

本研究提出了一种新颖的两阶段PM_2.5估算策略。首先，提出了Aero-Transformer模型，利用气象变量、时空特征、NDVI和DEM来填补YRD地区的每日缺失AOD值。其性能优于现有的插补模型（R²=0.94，RMSE=0.069），尤其是在数据缺失率较高的情况下表现优异。其次，开发了STAFNet模型来估算每日PM_2.5浓度。通过明确引入

CRediT作者贡献声明

朱松岩：监督。 曾巧琳：写作 – 审稿与编辑，监督，方法论，资金获取，概念化。 王欣：写作 – 审稿与编辑，初稿撰写，软件，方法论，数据管理。 范萌：监督，方法论，概念化。 陈良富：监督，方法论

未引用参考文献

Liu等人，2024年；Lu等人，2021年；Wang等人，2024年；Wang等人，2022年；Wang等人，2024年；Yu等人，2024年；Zhang等人，2024年。

数据可用性

所使用的数据是保密的。

利益冲突声明

? 作者声明他们没有已知的可能会影响本文工作的财务利益或个人关系。

致谢

本研究得到了重庆市教育委员会的科学技术研究计划（项目编号KJQN202300620）、国家重点研发计划（项目编号2023YFC3705801）、广东生态与环境监测中心的服务（项目编号ZXCG-2024-161）以及重庆研究生研究与创新项目（项目编号CYS25479）的支持。

联系信箱：

粤ICP备09063491号

摘要

引言