通过结合激光雷达和无线电探空仪的垂直观测数据来提升PM2.5预报的准确性陈思英、李达明、王伟生、陈河、郭攀、姜雨荣、杨茜、马阳成、金宇浩、舒英杰

《Remote Sensing》：Enhancing PM2.5 Forecasting via the Integration of Lidar and Radiosonde Vertical Structures Siying Chen, Daoming Li, Weishen Wang, He Chen, Pan Guo, Yurong Jiang, Xian Yang, Yangcheng Ma, Yuhao Jin and Yingjie Shu

【字体：大中小】 时间：2026年04月28日 来源：Remote Sensing 4.1

编辑推荐：

　　**亮点** - 主要发现是什么？ - 提出了一种结合激光雷达和无线电探空仪垂直剖面的多源时空框架，用于预测PM2.5浓度。 - MST-Net框架在1-24小时的时间范围内表现出一致的性能提升，在较长的预测期内误差增长显著减缓。 **主要发现的含义是什么？** -

　　**亮点**
- 主要发现是什么？
- 提出了一种结合激光雷达和无线电探空仪垂直剖面的多源时空框架，用于预测PM2.5浓度。
- MST-Net框架在1-24小时的时间范围内表现出一致的性能提升，在较长的预测期内误差增长显著减缓。

**主要发现的含义是什么？**
- 随着短期污染持续性的减弱，垂直气溶胶和热力学背景变得越来越重要。
- 多源垂直剖面分析为加强城市空气质量预警系统提供了实用的途径。

**摘要**
- 由于大气垂直结构、热力学稳定性和污染物积累过程之间的复杂耦合，准确预测近地面PM2.5浓度仍然具有挑战性。大多数现有的基于地面的统计和深度学习方法难以表征大气的三维状态，这限制了它们在复杂气象条件下的鲁棒性。在这项研究中，我们提出了一种多源时空学习框架（MST-Net），通过整合来自激光雷达和无线电探空仪观测的垂直分辨大气信息来提高PM2.5预测的准确性。实验结果表明，MST-Net在多个预测时间范围内均优于传统的时间序列模型。特别是在较长的预测时段（12-24小时），该框架表现出更强的稳定性和更慢的误差增长。对于24小时的预测，MST-Net将RMSE减少了约13%，MAE减少了约19%。这些结果表明，利用多源垂直大气信息可以有效提高城市空气质量预测的可靠性。

**1. 引言**
- 细颗粒物（PM2.5）具有≤2.5微米的空气动力学直径，是全球重要的环境健康威胁[1]。由于其微小的尺寸和较大的比表面积，PM2.5颗粒可以作为有毒物质的载体，穿透肺泡-毛细血管屏障并进入血液，加剧全身毒性[2]。长期暴露于高浓度PM2.5与心血管和呼吸系统疾病以及肺癌的发病率和死亡率增加密切相关[3]。根据世界卫生组织的估计，2019年全球约有420万例过早死亡归因于环境中的PM2.5污染[4]。除了对公共卫生的严重影响外，作为大气气溶胶的主要成分，PM2.5在地球的辐射预算中 também扮演着关键角色。它通过散射和吸收太阳辐射直接影响气候强迫，并通过作为云凝结核间接影响气候[5]。因此，精确监测和预测PM2.5不仅是一项技术挑战，也是保护公共健康和减缓气候变化的关键需求。

- 当前的PM2.5预测方法大致可以分为确定性化学传输模型（CTMs）和数据驱动的统计模型。CTMs如WRF-Chem和CMAQ基于物理和化学机制来模拟大气过程[6,7,8]。尽管在物理上非常严谨，但这些模型计算成本高昂，且严重依赖于排放清单，而这些清单往往不准确或过时，限制了它们在高分辨率、实时预测中的有效性。相比之下，经验统计方法（如土地利用回归LUR和地理加权回归GWR）已被广泛用于绘制污染物的空间分布[9,10,11,12]。然而，这些传统模型通常假设稳定性和线性，难以捕捉污染事件的高度非线性和动态演变。近年来，深度学习的发展显著推动了数据驱动的空气质量建模。先进架构（如长短期记忆LSTM和循环神经网络RNN）已经显示出捕捉空气质量数据中的复杂时间模式和时空依赖性的能力[13,14,15,16,17]。然而，一个关键的限制仍然存在：大多数操作型数据驱动模型仅依赖于地面级的观测数据。虽然这些观测提供了高时间分辨率，但它们本质上无法解析行星边界层（PBL）内的复杂垂直交换过程。在静态稳定或夜间逆温条件下，近地面空气团常常与上层大气有效隔离，导致基于地面的模型在捕捉污染变化方面出现显著滞后。此外，最近利用无人机和遥感技术（如MAX-DOAS）进行的垂直剖面研究揭示，高空污染物传输通常会通过向下混合成为地面污染事件的来源——这种机制对地面监测来说是不可见的[18,19]。因此，仅依赖地面数据会忽略大气传输的三维特性。气象现象（如温度逆温）可能会加剧PM2.5污染，特别是在这些逆温现象频繁发生的高污染环境中[20]。污染物在高层浓度的潜在增强[21]对忽略垂直剖面信息的深度学习方法构成了重大挑战。

- 为了弥合地面测量与大气垂直结构之间的差距，激光雷达（光检测和测距）成为一种重要的遥感仪器。通过提供距离分辨的气溶胶剖面，激光雷达克服了被动卫星反演（如AOD）的柱集成特性，后者掩盖了气溶胶层的垂直异质性[22,23,24]。最近的基于激光雷达的观测显示了检测高浓度气溶胶层、识别边界层逆温结构以及揭示与热力学分层和区域传输相关的污染累积的能力[25]。然而，将原始激光雷达信号转换为定量PM2.5质量浓度具有挑战性，因为早期的经验回归方法往往无法考虑气溶胶光学特性的复杂时空变化。消光和质量之间的关系受到气象和微物理因素的复杂影响[26]。例如，高相对湿度通过吸湿性增长增强散射并促进水相反应，从而改变化学组成[27]，而非球形颗粒与人为气溶胶的异质混合在不同高度产生不同的退极化和散射特性[28,29]。因此，静态转换模型不足以捕捉这些动态变化，需要更先进的反演框架。

- 为了解决对垂直感知预测框架的需求，本研究提出了MST-Net。这种深度学习架构旨在将异构数据流——连续的地面测量数据、高分辨率激光雷达气溶胶剖面和气象无线电探空仪观测数据——融合到一个统一的模型中，用于预测近地面PM2.5浓度。这项工作的具体贡献如下：
- （1）提出了一种多源垂直融合框架，该框架同时将基于地面的激光雷达气溶胶消光剖面和无线电探空仪热力学剖面整合到深度学习的PM2.5预测模型中。这种整合提供了仅依靠地面数据无法获得的大气垂直背景信息，使模型能够学习与污染积累和消散相关的气溶胶层和边界层稳定性的表示。
- （2）处理时间不匹配问题：我们引入了一种显式的时间延迟编码机制，将间歇性可用的激光雷达和无线电探空仪剖面与高频地面数据相结合。通过编码自最近垂直测量以来的时间，网络可以动态调整旧信息的影响，在没有新的垂直数据期间的性能保持稳定。

**2. 数据集构建**
- **2.1. 研究区域**
- 该研究聚焦于北京，这座位于华北平原西北边缘的特大城市。该地区的地形较为封闭，西侧以太行山脉为边界，北侧以燕山山脉为边界。这种地理配置与气象过程相互作用，导致在风力较弱的情况下污染物累积。具体来说，南方气流促进了来自重工业部门的排放物传输，平均占进入北京的污染负荷的约45%[30]。在冬季，由于住宅部门燃烧煤炭用于供暖，这一外部贡献进一步加剧，而工业部门仍然是区域PM2.5污染的主要来源[31]。这些区域流入与局部滞留之间的相互作用经常产生复杂的垂直气溶胶层。因此，仅依靠地面测量数据是不够的；在该地区进行准确预测需要对大气垂直结构有深刻的理解。

- **2.2. 多源数据采集**
- 为了捕捉地面污染与垂直结构之间的复杂耦合，进行了一次长期的综合观测实验。数据集的时间跨度接近三年，从2023年1月1日到2025年11月30日。观测框架整合了三个数据来源，观测站的地理分布如图1所示，背景层代表VIIRS夜间光（NTL）辐射，作为城市建成区强度的代理。所有三个观测站点都位于北京的高NTL城市核心区域。彩色圆圈表示该地区国家监测站的年平均PM2.5浓度。

- **地面空气质量监测：**地面空气质量数据来自万柳国家监测站（116.30°E, 39.96°N），数据来自中国国家环境监测中心（CNEMC）（http://www.cnemc.cn/）。数据集包括六种标准污染物的小时质量浓度：PM2.5、PM10、二氧化硫（SO2）、二氧化氮（NO2）、一氧化碳（CO）和臭氧（O3）。
- 包括气态前体（SO2、NO2）和氧化剂（O3）在物理上是合理的；这些变量为深度学习模型提供了关于大气氧化能力和二次气溶胶形成潜力的信息，这是北京雾霾演变的主要驱动力[32]。

- **激光雷达观测：**使用自开发的Raman-Mie激光雷达系统在北京工业大学（BIT，116.31°E, 39.94°N）获取气溶胶光学特性的垂直剖面，该位置距离万柳站约3公里。这种接近性确保了激光雷达观测的垂直剖面与地面测量数据在空间上的一致性。激光雷达系统的关键规格总结在表1中。由于在400米以下光束-望远镜重叠不完全，有效的反演结果仅限于400米以上的完整重叠区域。
- 在发射355纳米激光脉冲后，大气后向散射信号由牛顿望远镜收集并准直。随后，光被分束器（DBS）分离成弹性（355纳米）和拉曼（386.85纳米）通道。355纳米弹性信号进一步由偏振分束器（PBS）分为同极化（平行）和交叉极化（垂直）成分，而386.85纳米的氮拉曼信号由窄带干涉滤光片分离。三个独立的光电倍增管（PMTs）同时检测这些信号。根据经典拉曼激光雷达方程（方程1）[33]从氮拉曼通道信号中检索气溶胶消光系数（AEC）：
$$ AEC = \frac{\int_{z} \left( I_{\parallel} - I_{\perpendicular} \right) e^{-\alpha \cdot L} dL }{\int_{z} e^{-\alpha \cdot L} dN} $$
其中 $ I_{\parallel} $ 和 $ I_{\perpendicular} $ 分别是平行和垂直方向的入射光强度，$ \alpha $ 是消光系数，$ L $ 是光程，$ N $ 是大气分子数密度。

- 然后推导出粒子退极化率（PDR），以表征气溶胶形态，区分球形颗粒（低退极化）和非球形尘埃（高退极化）。体积退极化率（）首先从经过增益校准的平行和垂直弹性信号计算得出。然后通过使用后向散射率 $ \frac{I_{\parallel}}{I_{\perpendicular}} $ 解耦分子贡献来检索 $ PDR $ [34]：
$$ PDR = \frac{\alpha}{\alpha + \frac{1 - \frac{I_{\parallel}}{I_{\perpendicular}}} $$

- **无线电探空仪剖面：**L波段无线电探空仪剖面来自北京南郊观测站（WMO站54511，39.80°N, 116.47°E），该位置位于激光雷达站以南约21公里处。数据通过怀俄明大学大气数据库（http://weather.uwyo.edu/）获取。尽管地理位置上分离，南郊站是北京地区的主要气象参考站，广泛用于表征区域垂直大气结构[35]。无线电探空仪每天在UTC时间00:00和12:00（当地标准时间08:00和20:00）发射两次，提供分辨率达到30米的垂直剖面。数据集使用了四个关键气象参数，为深度学习模型提供热力学和结构先验：温度（TEMP）和相对湿度（RELH）表征与气溶胶吸湿性生长相关的垂直热力学结构和湿度条件；风速（SPED）代表污染物的动态传输和扩散潜力；以及位温（THTA）指示大气静态稳定性[36]。这些剖面作为输入特征，使模型能够学习边界层动态的潜在表示，如热稳定性和垂直混合强度，这对于PM2.5预测非常重要。
- 原始数据在模型训练前经历了质量控制。对于激光雷达数据，由于信号衰减，在恶劣天气条件（例如降水和浓厚的低云层覆盖）下收集的剖面数据被排除在外，有效的剖面数据被限制在400-3000米的高度范围内，以避免近地表的几何盲区。地面监测数据（2.1%）和无线电探空数据（0.93%）中的小缺失通过线性插值来填补。为了解决空间不一致性问题，激光雷达和无线电探空数据都被重新采样到一个统一的30米垂直网格上，从地表延伸到3公里。本研究使用的多源数据配置总结在表2中。表2. 多源数据配置总结。

3. 方法论
3.1. 整体模型架构
为了解决大气颗粒物污染的垂直变化及其时间演变，所提出的模型旨在学习激光雷达衍生的光学参数、高层气象场、近地表化学观测和地面PM2.5质量浓度之间的非线性映射。如图2所示，MST-Net的核心架构包括三个功能模块。首先，构建了一个多源物理特征编码模块，包含三个并行的特征提取分支。具体来说，使用1D-CNN从激光雷达光学剖面提取垂直结构信息和边界相关特征，而另一个1D-CNN分支应用于基于无线电探空的气象剖面，以捕捉垂直热力学特征。同时，多层感知器（MLP）用于编码近地表化学测量值。其次，引入了一个显式的时序滞后嵌入模块，以解决多源观测中时间采样不规则的问题。通过加入时间编码机制，该模块根据历史气象和光学特征与预测时间的时间距离动态调整其有效权重，从而补偿时间稀疏性并增强异步输入的相关性。最后，实现了一个时空协同演化和反演模块，使用LSTM网络。该模块捕捉污染物浓度演变的长期时间依赖性和累积效应，使模型能够学习大气污染过程并产生最终的PM2.5浓度估计。

3.2. 多源特征提取
光学分支和气象分支都使用1D-CNN作为特征提取器。输入的剖面序列表示为，其中L代表垂直层次的数量，C表示通道的数量。第l个卷积层的输出特征图可以表示为。通过堆叠多个1D-CNN层，模型逐步提取出高级抽象特征，这些特征编码了气溶胶的垂直分布模式和大气的热力学稳定性，产生深入的光学和气象特征表示。近地表特征包括在地表监测站测量的化学成分，包括六种污染物。这些浓度向量构成了一个非结构化的多变量特征表示，为局部化学条件和前体转化趋势提供了重要约束。MLP用于执行非线性特征映射。

3.3. 时空协同演化和PM2.5反演
在提取了特定分支的空间特征后，模型进入时空融合和反演阶段，旨在捕捉复杂大气条件下污染过程的累积效应和时间持久性。在时间步t，从光学、气象和地面化学分支提取的特征向量被连接起来，形成统一的表示，描述了当前时刻大气的联合物理-化学状态。为了建模长期的时间依赖性，引入了LSTM网络来处理输入序列。LSTM单元通过遗忘门、输入门和输出门动态调节信息流，核心状态更新方程由给出。

3.4. 优化和训练策略
为了最小化反演误差并提高模型的泛化能力，采用均方误差（MSE）作为主要损失函数，以量化预测的PM2.5浓度与相应地面真实观测值之间的差异。同时，引入了一个正则化项来减轻过拟合。

4. 实验和结果
实验使用了从2023年1月1日到2025年11月30日的三年多源观测数据集，共获得24,816个有效样本。为了严格评估模型的泛化能力并防止时间序列预测任务中常见的信息泄露，数据集是按照时间顺序严格划分的，而不是随机打乱的。具体来说，2023年1月1日至2024年10月31日的数据用于模型训练。验证集涵盖了2024年11月1日至2025年2月28日的时期，故意包括了一个完整的冬季供暖季节，该季节以频繁的温度逆温和升高的污染水平为特征，从而有助于在具有挑战性的条件下监控过拟合和提前停止。测试集从2025年3月1日持续到2025年11月30日，在训练期间完全未见。

所提出的MST-Net模型使用PyTorch 2.5.1框架实现，并在NVIDIA GeForce RTX 3080 GPU上进行训练。基于网格搜索调整，采用了AdamW优化器，并使用余弦退火学习率调度，初始学习率为。对于时间建模，LSTM模块使用了两个堆叠层，隐藏维度为128，时间窗口为24小时，以捕捉大气边界层内的日变化和累积污染效应。为了全面评估MST-Net的性能，选择了四个代表性的基线模型进行比较，包括作为非时空参考的MLP、基于门控循环单元（GRU）和LSTM/BiLSTM架构的循环神经网络，用于评估长期依赖性建模，以及一个CNN-LSTM混合模型，代表常用的黑箱时空框架。模型性能使用三个标准指标进行定量评估：决定系数（R^2）、均方根误差（RMSE）和平均绝对误差（MAE）。

4.2. 输入特征的物理解释
在使用MST-Net模型进行时空反演之前，本节定量检查了输入变量与PM2.5浓度之间的统计关系，以验证特征选择的合理性，并为网络设计提供物理论据。图3展示了地面化学污染物之间的皮尔逊相关系数（PCCs）。结果表明PM10和PM2.5之间存在强正相关，为模型提供了一个稳健的线性基准约束。气体前体如CO和NO2也与PM2.5表现出中等到强的相关性，反映了它们的共同排放源和化学耦合。相比之下，SO2和O3与PM2.5的线性相关性较弱。这些低线性相关性激发了在地面分支中使用深度非线性特征映射来捕捉与二次颗粒物形成相关的非线性关系。图3显示了不同地面化学污染物之间的皮尔逊相关系数热图。图4显示的相关系数垂直剖面进一步提供了洞察力。激光雷达衍生的消光系数在对流层下部（大约300-1000米）与地面PM2.5表现出一致的正相关，表明高空的气溶胶光学信息与近地表颗粒物污染密切相关。PDR显示出相对较弱但高度依赖的相关性，表明对气溶胶类型和混合状态变化的敏感性。

4.3. 整体性能
基于独立测试集，量化评估了MST-Net和五个基线模型在1小时到24小时不同预测范围内的预测性能。表4总结了RMSE、MAE等方面的整体结果。在1小时预测范围内，所有模型都实现了高预测精度，这可以归因于大气污染物浓度在短时间尺度上的强时间自相关性。在这个范围内，LSTM的误差略低于MST-Net，因为短期浓度持续性占主导，而垂直剖面信息可能贡献的额外预测价值有限。随着预测范围的增加，基线模型的性能以不同的速率下降。相比之下，MST-Net显示出预测误差的增长速度明显较慢，表明在长预测范围内具有更好的鲁棒性和稳定性。图5进一步展示了不同预测范围内的MAE演变。当预测范围超过12小时时，主要依赖时间记忆机制的模型表现出MAE的显著增加，表明在延长预测时间内预测鲁棒性降低。相比之下，MST-Net在所有范围内保持了最平坦的误差增长曲线，表明纳入垂直解析的物理上下文有效地缓解了长期误差的积累。

为了将高维隐藏状态映射回目标物理空间，输出被输入到一个全连接回归层中，得出时间t的预测PM2.5浓度。

4.4. 优化和训练策略
为了最小化反演误差并提高模型的泛化能力，采用均方误差（MSE）作为主要损失函数，以量化预测的PM2.5浓度与相应地面真实观测值之间的差异。同时，引入了一个正则化项来减轻过拟合。在短时间范围内（1-3小时），预测值紧密聚集在1:1参考线周围，回归斜率接近于1。尽管在更长的时间范围内分散度增加，但MST-Net即使在较长的预测时间跨度内也能保持明显的线性关系。图6显示了不同预测时间点下MST-Net预测的密度散点图：(a) T+1小时，(b) T+2小时，(c) T+3小时，(d) T+6小时，(e) T+12小时，以及(f) T+24小时。图7提供了代表性的时间序列预测示例。在短时间范围内，MST-Net能够准确再现背景变化和污染峰值。在更长的时间范围内，该模型能够继续捕捉PM2.5的时间演变，而没有明显的相位滞后或过度平滑。所有预测时间范围（1-24小时）的完整时间序列预测结果都包含在补充文档中以供参考。这些示例表明，结合垂直分辨的气溶胶和气象信息有助于在较长的预测时间范围内获得更稳定和一致的时间序列预测。图7显示了不同预测时间点下MST-Net的时间序列预测结果：(a) T+1小时，(b) T+6小时，以及(c) T+12小时。

4.4 多源数据有效性的验证
为了定量评估每个输入变量的边际贡献并提高MST-Net的可解释性，我们采用了排列特征重要性（PFI）方法。具体来说，特征重要性是通过在保持其他输入不变的情况下随机排列一个目标变量后RMSE的百分比增加来评估的，增加越大表示模型对该变量的依赖性越强。图8总结了不同预测时间范围内的PFI排名，并揭示了主导预测因子随时间的变化。对于短期预测（T+1-T+6小时；图8a-d），特征重要性主要由污染物相关指标和时间信息主导。在最短的时间范围内（T+1-T+2小时），PM10和时间特征最具影响力，这与近期PM2.5浓度的高持久性一致。特别是在T+1小时，排列PM10会导致RMSE增加40.1%，突显了它在即时预测中的主导作用。随着时间范围扩展到T+3-T+6小时，氧化剂相关变量（尤其是O3和NO2）变得越来越重要，表明预测重点逐渐从单纯的浓度持久性转向化学和气象相关的协变量。这与之前的研究结果一致，在华北平原，高效的光化学和水相反应可以在大约4.6小时内加速新排放的BC颗粒的老化，辐射吸收增强多达2.4倍[38]。老化的BC颗粒会加热上边界层，促进温度逆温并抑制垂直扩散，从而在随后的几个小时内增加近地表PM2.5的积累。因此，模型在这些时间范围内对O3和NO2的依赖性增加可能反映了其对光化学驱动的污染加剧的敏感性。

图8显示了不同预测时间范围内输入变量的PFI：(a) T+1小时，(b) T+2小时，(c) T+3小时，(d) T+6小时，(e) T+12小时，以及(f) T+24小时。跨时间范围，AEC始终是一个不可忽视的贡献因素，在T+1-T+12小时的重要性值约为10-22%，而在T+24小时为7.3%。这种行为表明，垂直分辨的气溶胶信息提供了超出地面观测的补充约束。对于长期预测（T+12-T+24小时；图8e-f），PM10的贡献显著减少，而气象变量——特别是相对湿度和温度以及风速——变得越来越重要。总体而言，这些结果表明，随着预测时间范围的增加，初始浓度状态的记忆减弱，MST-Net逐渐更多地依赖于与气溶胶演变和污染物扩散相关的动态和热力学条件。

为了进一步探讨垂直信息如何支持上述发现，选择了2025年10月28日的一个典型严重污染案例进行详细案例分析（图9）。在夜间和清晨时段（01:00-07:00），激光雷达观测显示AEC水平保持在较高水平，而PDR逐渐降低（图9b,c），表明以细模式、弱去极化气溶胶为主。当地时间08:00，无线电探空仪剖面显示从地面以上约100米到1300米处存在明显的温度逆温（图9d），同时低层大气中的相对湿度也升高（图9e）。这些热力学和气溶胶特征共同构成了不利于污染物扩散的垂直环境。图9展示了2025年10月28日的典型严重污染案例：(a) MST-Net和LSTM在T+6小时的PM2.5预测比较；(b) 01:00至07:00的AEC时间演变；(c) 01:00至07:00的PDR时间演变；(d) 08:00的温度剖面；以及(e) 08:00的相对湿度剖面。在这种背景下，09:00至15:00之间观察到一个快速污染增长阶段，期间PM2.5浓度急剧增加（图9a）。在此期间，LSTM模型表现出明显的相位滞后和对峰值幅度的低估，反映了它对历史浓度信号的时间平滑的强烈依赖。相比之下，MST-Net在不利的垂直条件被识别后不久就开始提高预测的PM2.5浓度，并紧密跟踪随后的快速增加，没有明显的延迟。这种对比说明，包含垂直分辨的热力学和气溶胶信息使MST-Net能够更好地表征与快速污染积累相关的环境条件，从而提高了其在高增长污染事件中的响应能力和稳定性。

总体而言，PFI分析结合典型案例研究表明，MST-Net利用的信息来源随时间范围的不同而变化，从短期的浓度持久性转向在更长时间跨度内增加对气象和热力学的依赖。通过将垂直分辨的信息纳入预测框架，MST-Net相对于纯时间模型减少了相位滞后，并实现了更稳定的长时段预测。

5. 讨论
5.1 消融研究
为了量化每个垂直数据源的边际贡献，我们通过逐步添加激光雷达和无线电探空仪输入到仅基于地面的基线模型（LSTM）来进行消融研究。表5总结了不同预测时间范围内的RMSE和MAE结果。表5显示，在T+1小时时，激光雷达分支相对于仅基于地面的基线有所改善，而结合无线电探空仪剖面则会导致性能略有下降。从激光雷达获得的气溶胶消光系数与低层大气中的近地表PM2.5直接相关，为短时间范围内的地表浓度提供了即时约束。12小时的无线电探空仪采样间隔意味着最新的剖面可能不能很好地代表预测时的大气状态，这可能解释了T+1小时时的性能下降。随着预测时间范围扩展到T+3小时以上，无线电探空仪分支在性能改进中占据主导地位，而激光雷达分支则继续做出适度贡献。这与表3中的统计模式一致，即随着污染严重程度的增加，温度逆温的发生频率上升，BPL高度下降，表明热力学稳定结构对于预测更长时间范围内的污染物积累变得越来越重要。MST-Net结合了这两种来源，实现了最佳的整体性能，这可能证实了气溶胶光学和热力学剖面在预测时间范围内的互补性。

补充材料中的图S25和S26进一步描述了逆温与PM2.5关系中的日变化不对称性。强烈的早晨逆温（08:00 BJT）与随后12小时的持续污染物积累相关，而强烈的 evening 逆温（20:00 BJT）则通常伴随着地表浓度的逐渐下降，反映了白天和夜间边界层条件的不同。

5.2 局限性和未来工作
尽管取得了令人鼓舞的结果，但仍需承认本研究的几个局限性。基于地面的激光雷达在400米以下存在几何盲区，由于太阳背景辐射对拉曼通道的干扰，有效的气溶胶反演仅限于夜间。因此，白天的激光雷达剖面不可用，模型必须依赖于白天预测期间的最新夜间观测数据。尽管时间滞后编码模块旨在缓解这一问题，但缺乏实时的白天气溶胶垂直信息可能会限制白天污染事件的预测精度，这些事件在强光化学条件下可能迅速发展。本研究中使用的无线电探空仪剖面来自位于激光雷达站点以南约21公里的南桥站。尽管单个城市内的PM2.5空间变化通常适中，但两个站点之间的距离意味着可能无法完全捕捉到城市核心上方的局部热力学特征，如浅层逆温层或局部边界层结构。在观测站点附近进行垂直分辨的探空将提供更具代表性的热力学约束，特别是在复杂的污染事件期间。

未来的工作可以考虑两个方向。首先，结合来自微波辐射计或拉曼温度和湿度激光雷达等的连续热力学剖面，可以补充稀疏的无线电探空仪采样，并将边界层观测扩展到白天的更高时间分辨率。其次，消融结果表明，在短期预测时间范围内，气溶胶消光信息仍然是主要贡献因素。卫星气溶胶光学深度（AOD）与柱积分消光密切相关，可以纳入以扩展气溶胶光学约束的空间覆盖范围，超越单个激光雷达站点的限制，从而可能提高短期预测的准确性。

6. 结论
在这项研究中，提出了MST-Net来解决与大气颗粒物反演的垂直异质性和时空不匹配相关的挑战。该模型结合了基于1D-CNN的垂直特征提取分支，利用激光雷达和无线电探空仪剖面来表征大气边界层的热力学和结构特性。此外，引入了显式的时间滞后嵌入机制，以适应高层观测数据的非连续性，使模型能够根据数据的及时性自适应调整其对历史信息的依赖性，从而缓解由白天激光雷达盲区和稀疏无线电探空仪采样引起的信息不连续性。在三年长期的观测数据集上进行的实验表明，MST-Net通常优于传统的基于时间的预测模型，包括LSTM和CNN-LSTM，在广泛的预测时间范围内表现更好。值得注意的是，对于超过12小时的 medium 和 long 期预测，所提出的模型保持了更高的决定系数，并且预测误差的累积速度显著减缓。这些结果可能表明，当浓度持久性减弱时，垂直分辨的信息提供了有用的条件，从而增强了长时段PM2.5预测的鲁棒性。进一步的特征归因分析揭示了模型利用的主要信息源随时间范围的增加而明显变化：从短期的浓度持久性转向依赖于与大气结构相关的气象和热力学背景。通过将垂直分辨的信息纳入预测框架，MST-Net减少了相对于纯时间模型的相位滞后，并实现了更稳定的长时段预测。

补充材料中提供了以下支持信息：https://www.mdpi.com/article/10.3390/rs18091301/s1，图S1-S24详细评估了MST-Net模型在1至24小时所有预测时间范围内的性能。图S25和S26展示了根据08:00和20:00 BJT无线电探空仪剖面分层的PM2.5增量分布。

热点排行