基于全局集成学习的VMF1-FC预测加权平均温度的改进模型曹丽英、桑继章、李飞娟、张宝

《Remote Sensing》：Global Ensemble Learning-Based Refined Models for VMF1-FC Forecasted Weighted Mean Temperature Liying Cao, Jizhang Sang, Feijuan Li and Bao Zhang

【字体：大中小】 时间：2026年04月28日 来源：Remote Sensing 4.1

编辑推荐：

　　亮点主要发现是什么？基于对319个全球无线电探空站的评估，VMF1-FC在预测温度（Tm）方面表现出具有竞争力的均方根误差（RMSE）性能，但其偏差相对于GPT3模型较大。基于集成学习的改进模型（XTm、LTm和CTm）有效减少了VMF1-FC Tm的偏差，并进一步将RMSE

　　亮点
主要发现是什么？
基于对319个全球无线电探空站的评估，VMF1-FC在预测温度（Tm）方面表现出具有竞争力的均方根误差（RMSE）性能，但其偏差相对于GPT3模型较大。基于集成学习的改进模型（XTm、LTm和CTm）有效减少了VMF1-FC Tm的偏差，并进一步将RMSE提高了约18%。

主要发现的含义是什么？
改进模型提供了在不同纬度、高度范围和时间尺度上更准确且空间更稳定的全球尺度温度（Tm）数据。改进后的VMF1-FC Tm模型在增强基于近实时全球导航卫星系统（GNSS）的可降水量水汽（PWV）传感器和天气预报应用的可靠性方面具有巨大潜力。

摘要
准确预测加权平均温度（Tm）对于将天顶湿延迟（ZWD）转换为基于全球导航卫星系统（GNSS）的可降水量水汽（PWV）以应用于实时感测和预报至关重要。维也纳映射函数1（VMF1-FC）是由维也纳技术大学开发的全球预报产品，它基于数值天气预报模型，可以提供一天后的网格温度（Tm）。在这项研究中，我们使用2019-2021年间319个全球无线电探空站（RS）的观测数据评估了VMF1-FC预测的Tm准确性。结果表明，与广泛使用的全球压力和温度3（GPT3）模型相比，VMF1-FC预测的Tm显示出相对较低的RMSE，但偏差较大（0.75 K）。为了提高VMF1-FC预测Tm的准确性，分别使用极值梯度提升（XGBoost）、轻量级梯度提升机（LightGBM）和分类提升（CatBoost）开发了三种改进模型XTm、LTm和CTm。这些模型使用经度、纬度、椭球高度、年中的浮动日（fdoy）和VMF1-FC Tm作为输入特征，以RS Tm作为目标变量。使用未参与模型开发的2022年RS数据进行验证显示，改进模型显著减少了偏差，XTm、LTm和CTm的偏差分别为0 K、0 K和-0.03 K。由于偏差的有效减少，均方根误差（RMSE）相应降低。XTm、LTm和CTm的RMSE分别为1.45 K、1.45 K和1.46 K，与VMF1-FC和GPT3模型相比分别提高了18.50%/64.93%、18.44%/64.91%和18.11%/64.76%。此外，这三种改进模型在不同纬度带、椭球高度范围和时间尺度上表现出更高的准确性并提高了稳定性。改进模型提供了更准确的全球尺度温度（Tm），为GNSS气象应用，特别是基于实时GNSS的PWV感测和天气预报提供了强大潜力。

1. 引言
大气水汽是最重要的温室气体之一，对各种气象研究和应用至关重要，包括天气预报、气候分析和灾害预警[1,2,3,4,5,6]。目前，有多种技术被广泛用于大气水汽观测[7]，包括微波辐射计、无线电探空仪和卫星遥感。此外，由于其低成本、高精度、高时间分辨率和全天候能力，全球导航卫星系统（GNSS）越来越多地应用于可降水量水汽（PWV）感测[8,9,10]。随着极端天气事件频率和强度的增加，对及时可靠的大气水汽信息的需求也在增长，以支持快速监测和预报。这些特性使得基于GNSS的PWV在实时感测和预报应用中特别有价值。大气加权平均温度（Tm）是将GNSS信号中的天顶湿延迟（ZWD）转换为PWV所需的唯一独立参数[11,12,13]。因此，提高预测Tm的准确性对于增强从GNSS ZWD到PWV的转换至关重要，从而提高基于实时GNSS的PWV传感的性能。

目前，预测Tm可以通过两种主要方法获得：经验模型[8,14]和数值天气预报模型[15]。对于经验模型，一个广泛使用的类别是基于建立表面温度（Ts）和Tm之间的线性关系。这种关系最初由Bevis等人提出[8]，可以表示为Tm = a + bTs，其中a和b是通过线性回归确定的经验系数。基于美国13个无线电探空站（RS）的观测数据，得到的系数分别为a = 70.20和b = 0.72。由此产生的模型在全球范围内的Tm准确度为4.74 K。然而，这种Ts和Tm之间的线性关系会随时间和地点而变化[16]。随后，开发了许多考虑季节性和区域变异性的全球或区域模型[17,18,19,20]。Wang等人[21]利用2008-2015年间北极和南极地区的RS数据，分别为南极和北极地区建立了二次和线性回归Tm模型。这两种模型的RMSE值约为2.87-3.53 K，优于极地地区的GPT2w模型。基于Tm和Ts之间的关系，Yang等人[22]提出了一个全球Tm模型（GGTm-Ts），其验证结果表明与Bevis公式相比具有更高的全球准确性。然而，这些模型严重依赖于现场表面气象数据，因此应用范围有限。另一类经验模型旨在减少对现场表面气象数据的依赖。例如，Yao等人[23]利用2005-2009年间135个全球RS站点的数据开发了一个全球加权平均温度模型（GWMT），其中Tm仅使用位置和时间信息进行估算。由于用于模型构建的RS站点都位于陆地上，因此该模型在海洋区域的Tm估算存在偏差。随后，Yao等人[24]和Yao等人[25]结合大气再分析数据进一步改进了GWMT模型，发展出了性能更好的GTm-II和GTm-III模型。此外，B?hm等人[26,27,28,29]考虑了Tm的年度和半年度变化，基于欧洲中期天气预报中心（ERA-Interim）的再分析数据开发了全球压力和温度（GPT）模型系列，包括GPT2w和GPT3。基于类似的方法，也建立了一些Tm模型[13,30,31,32]。在这些模型中，GPT3目前被认为是最具代表性的经验模型，并在全球范围内表现出相对较高的准确性[12,33,34]。

数值天气预报（NWP）数据的持续更新和数据质量的提高为Tm预测提供了有希望的方法[35,36]。多项研究表明，基于NWP的方法在对流层延迟预测方面优于经验模型，因为NWP系统可以吸收最新的大气观测数据，从而更好地表示当前的对流层状态及其快速变化[37,38,39]。基于欧洲中期天气预报中心（ECMWF）的24小时NWP产品，VMF数据服务提供了全球网格化预报产品，包括VMF1-FC和VMF3-FC。使用网格化的VMF1-FC，可以通过插值在全球任意位置和时间获得Tm，这使其在实时GNSS气象应用中具有巨大潜力[40,41]。然而，与再分析产品类似，NWP数据是通过整合和模拟全球观测数据生成的。因此，它们的准确性很大程度上取决于观测数据的空间分布和质量。结果是在观测数据密集和高质量的区域内通常可以获得更高的准确性，而在观测数据稀疏的区域则会出现不确定性。因此，在预测的对流层参数中可能会出现空间不一致的准确性，某些局部区域的不确定性会增加。

基于上述问题，使用319个全球RS站点的观测数据作为参考，并以广泛使用的GPT3模型作为比较模型，评估了网格化VMF1-FC预测的Tm（VMF1-FC Tm）的准确性。此外，基于集成学习算法开发了三种改进的VMF1-FC Tm模型，即极值梯度提升（XGBoost）、轻量级梯度提升机（LightGBM）和分类提升（CatBoost）。这些改进模型分别称为XTm、LTm和CTm，并评估了它们在不同时间和空间尺度上的Tm预测性能。本文的其余部分组织如下：第2节介绍本研究使用的数据集、模型、Tm推导和准确性统计指标；第3节使用RS Tm对VMF1-FC Tm的准确性进行评估；第4节描述了改进模式的构建；第5节提供了所开发改进模型的性能评估；第6节总结了结论。

2. 数据和方法
2.1. RS Tm
RS站点通常用于高层大气观测，主要通过在每天两次（00:00和12:00 UTC）释放无线电探空仪气球来收集高层大气数据。综合全球无线电探空档案（IGRA）提供了从地面到大约30公里高度的层状气象参数，包括压力、温度和相对湿度，适用于全球RS站点。这些数据可以从国家环境信息中心（NCEI）免费获取。由于RS观测代表现场测量，从RS气象参数推导出的Tm具有较高的准确性，常被用作基于观测的分析和模型验证的参考值[1,42,43,44,45,46]。在这项研究中，获得了319个全球分布的RS站点的Tm数据，RS站点的空间分布如图1所示。Tm的计算公式如下：
（1）
其中和分别表示第i个无线电探空层的水汽压力（hPa）和空气温度（K），表示相应大气层的位势高度差（m）。是可用垂直层的总数。

2.2. VMF1-FC Tm
VMF数据中心提供三种类型的产品，包括后处理产品（VMF-EI）、超快速产品（VMF-OP）和预报产品（VMF-FC）。VMF-FC产品基于欧洲中期天气预报中心（ECMWF）输出的24小时数值天气预报模型生成。VMF-FC产品包括VMF1-FC（2.5° × 2°）和VMF3-FC（1° × 1°和5° × 5°），两者都在下一个时间的四个时刻（00:00, 06:00, 12:00, 18:00 UTC）提供网格化和站点化的预报[40,47]。只有VMF1-FC提供Tm数据。因此，在这项研究中，使用网格化的VMF1-FC产品来获取319个RS站点的预测Tm。处理过程如下：首先提取一个完整的Tm网格场。然后在水平方向进行双线性插值，以获得目标RS站点的Tm。接着，使用Kouba推荐的垂直递减率模型[48]将网格点高度的外推到RS站点高度，得到该RS站点和时刻的VMF1-FC Tm。这个过程对所有可用时刻重复进行，得到的VMF1-FC Tm值与相应的RS衍生Tm在时间上匹配，以便后续分析。值得注意的是，VMF1-FC产品使用椭球高度，而RS剖面数据以位势高度提供。为了避免因不同的垂直参考系统而产生的不一致性，根据文献[47]描述的方法将RS中的位势高度转换为椭球高度。

2.3. GPT3 Tm
GPT3模型提供了基于网格的表面压力、温度和气象参数的经验估计。由于其全球覆盖范围、低计算成本和独立于实时气象观测的特点，GPT3在GNSS应用中被广泛采用，特别是在对流层延迟校正和可降水量水汽感测方面。通过输入修改后的儒略日期、纬度、经度和椭球高度，可以获得气象参数，如压力和温度。网格点处Tm的计算公式如下：
（2）
其中表示一年中的天数，是平均值，和分别是年度和半年度的谐波振幅。GPT3模型提供两个版本，水平分辨率为1° × 1°和5° × 5°。在这项研究中采用了1° × 1°版本。

2.4. 统计指标
偏差和均方根误差（RMSE）被用作评估模型性能的统计指标。计算公式如下：
（3）
（4）
其中表示从VMF1-FC、GPT3和改进模型得到的Tm，表示从RS获得的参考Tm，是样本总数。表1显示了VMF1-FC和GPT3 Tm的偏差和均方根误差（RMSE）。结果表明，VMF1-FC Tm的RMSE为1.76 K，显著低于GPT3的4.24 K。然而，观察到VMF1-FC有明显的正偏差0.75 K，而GPT3则表现出明显的负偏差?0.60 K。这些结果表明，尽管VMF1-FC的RMSE较低，但在偏差性能方面并不明显优于GPT3。表1展示了GPT3和VMF1-FC Tm的偏差和RMSE。为了评估VMF1-FC Tm的空间变异性，图2进一步展示了全球RS站点上GPT3和VMF1-FC Tm的偏差和RMSE的空间分布。如图2a,b所示，GPT3在大多数区域都表现出负偏差，尤其是在中高纬度地区；而VMF1-FC在全球范围内主要表现出正偏差，在北半球的偏差更为明显。这种不同的偏差模式与表1中报告的总体偏差统计结果一致。在RMSE方面（图2c,d），GPT3通常表现出较大的误差，特别是在中高纬度站点，其RMSE经常超过4–6 K。相比之下，VMF1-FC在大多数区域的RMSE值都较低，包括大陆和沿海地区。图2显示了GPT3和VMF1-FC Tm的偏差和RMSE的空间分布。(a) GPT3的偏差；(b) VMF1-FC的偏差；(c) GPT3的RMSE；(d) VMF1-FC的RMSE。为了进一步评估VMF1-FC Tm的时间准确性和可靠性，计算了GPT3和VMF1-FC Tm的月平均偏差和RMSE，并将结果展示在图3中。结果显示，GPT3 Tm的偏差全年都保持负值，夏季月份的负值相对较大。相比之下，VMF1-FC在所有月份的偏差都保持正值，季节性变化较小。然而，与GPT3相比，VMF1-FC在一月、二月、五月、十一月和十二月的偏差较大。GPT3的RMSE表现出明显的季节性变化，冬季值较大，夏季值较小。相反，VMF1-FC的RMSE的季节性变化相对较弱，全年都低于2 K，显示出比GPT3更好的整体性能。图3展示了GPT3和VMF1-FC Tm的月平均偏差和RMSE。上述结果表明，VMF1-FC在预测温度（Tm）方面具有很大的潜力。这得到了其相对于GPT3更优的RMSE性能的支持。然而，VMF1-FC预测的温度偏差相对较大且不稳定。因此，需要进一步改进VMF1-FC Tm以提高其预测准确性和实际应用性。

4. 基于集成学习的精细化模型开发
集成学习算法被用来构建更加精细的VMF1-FC Tm模型，以实现更高的温度估计精度。在模型开发过程中，仔细考虑了特征选择和超参数优化，以获得性能最佳且具有实际应用性的精细模型。

4.1. 集成学习算法
集成学习通过结合多个弱学习器来构建一个强学习器。常见的集成框架包括装袋法（bagging）、提升法（boosting）和堆叠法（stacking）。其中，基于提升法的集成学习通过迭代训练策略构建强学习器，在该过程中逐渐增加对之前迭代中预测不佳的样本或残差的关注，如图4所示。这一过程可以解释为对样本权重或贡献的适应性调整，引导后续学习器专注于纠正之前的错误。与其他传统的机器学习算法相比，基于提升法的集成方法在捕捉复杂的非线性关系和提高泛化性能方面更为有效。通过训练过程中适应性地关注难以处理的样本，这些方法对异常值和异构数据分布具有更强的鲁棒性，特别适合用于精细化VMF1-FC Tm的偏差校正。因此，本研究采用了三种代表性的基于提升法的集成算法——XGBoost、LightGBM和CatBoost来构建VMF1-FC Tm的精细模型。图4展示了提升算法的结构。省略号（“…”）表示训练过程的重复迭代。XGBoost是一种广泛使用的梯度提升决策树实现方式，它通过二阶梯度优化和正则化技术来提高模型性能。这些特性提高了收敛稳定性，并有效控制了过拟合。LightGBM是一种高效的梯度提升框架，通过使用基于直方图的特征离散化和逐叶生长策略加速训练，显著降低了计算成本，同时保持了高预测精度，这对于大规模地球物理数据集非常有利。CatBoost是一种梯度提升算法，旨在通过有序提升和先进处理异构特征分布来提高模型鲁棒性。关于XGBoost、LightGBM和CatBoost算法的详细描述，请参考[49,50,51]。

4.2. 精细化模型开发与训练策略
温度（Tm）表现出明显的季节性和地理依赖性[12,13]。考虑到实际模型实现的便利性，选择了经度（lon）、纬度（lat）、椭球高度（h）、一年中的浮动日期（fdoy）和VMF1-FC Tm作为输入特征，而RS Tm作为目标变量，基于XGBoost、LightGBM和CatBoost算法构建了分别表示为XTm、LTm和CTm的精细VMF1-FC Tm模型。这些输入特征被选用来捕捉影响温度的关键因素。除了需要校正VMF1-FC Tm外，经度和纬度还代表了大规模的空间变异性，而椭球高度（h）则考虑了垂直依赖性。引入一年中的浮动日期（fdoy）来描述季节性和时间变化。这种特征组合使得模型能够用相对简单的特征集来校正VMF1-FC Tm。收集了2019至2022年间319个RS站点的VMF1-FC Tm数据，以及相应的RS Tm和经度、纬度、椭球高度和一年中的浮动日期数据。2019至2021年的观测数据被随机分为训练集和验证集，其中80%用于训练，20%用于验证。2022年的数据作为独立测试集，用于评估精细模型的泛化性能。值得注意的是，将基于网格的温度（Tm）插值到非网格位置不可避免地会引入误差，主要来自水平插值和高度校正。在提出的方法中，精细模型使用插值后的Tm值以及明确的位置信息进行训练。通过将地理坐标和椭球高度作为输入特征，模型可以学习并部分补偿与水平插值和高度校正相关的系统误差。在实际应用中，一旦得到VMF1-FC预测的温度产品，就可以通过将相应的VMF1-FC Tm以及位置和时间信息输入精细模型来直接获得校准后的温度。因此，精细模型可以在研究区域的任意位置提供校准后的温度估计，从而提高了计算效率，并有效减少了插值相关误差。

4.3. 超参数确定
为了构建最佳的精细模型，对XGBoost、LightGBM和CatBoost算法进行了超参数调整。超参数被定义为控制机器学习模型学习过程和泛化行为的配置参数[52]。适当的超参数选择对于平衡模型复杂性和预测精度以及避免过拟合至关重要。在本研究中，使用Scikit-learn（sklearn.model_selection GRIDSearchCV）实现的GridSearch Cross-Validation框架进行超参数优化，该框架通过交叉验证系统地评估预定义的超参数组合。这种方法通过最小化多折交叉验证中的验证误差，实现了目标和可重复的最佳超参数集选择。GridSearchCV的理论背景可以在[47,53]中找到。超参数调整采用逐步策略进行。首先，为关键超参数指定合理的初始值，并按升序排列预定义的候选值。随后，按预定顺序调整超参数，指定它们的搜索范围并确定最优值，同时暂时固定其他参数。例如，首先使用从100到500的预定义候选值范围调整估计器数量（n_estimators），步长为100。找到最优值后，它将替代初始设置，并在调整其余超参数时保持不变。应当注意的是，如果某个超参数的最优值位于预定义候选值的边界（即最小值或最大值），则进一步扩展候选集并重复调整过程，以确保获得真正的最优值。三种集成算法的超参数调整顺序和预定义候选值在表2中总结。图5展示了精细模型构建的整体工作流程。

5. 精细化模型的性能评估
从多个角度使用测试数据集评估了三种精细模型的性能，包括总体全球精度及其随纬度、椭球高度和时间尺度（季节性和日变化）的变化。

5.1. 全局精度
基于测试数据集的总体全球精度在表3中为XTm、LTm、CTm、GPT3和VMF1-FC进行了总结。表3还展示了验证精度以供比较。XTm、LTm和CTm的验证精度分别为0.00 K、0.00 K和0.00 K，而GPT3和VMF1-FC的验证精度分别为?0.60 K和0.75 K。相应的RMSE值分别为1.37 K、1.39 K和1.36 K，低于VMF1-FC（1.76 K）和GPT3（4.24 K）。测试结果显示，XTm、LTm和CTm的偏差分别为0.00 K、0.00 K和?0.03 K，而GPT3和VMF1-FC的偏差分别为?0.56 K和0.74 K。测试结果与验证结果一致，表明没有明显的过拟合。基于测试结果相对于VMF1-FC和GPT3的改进率也在表3中总结。精细模型有效校正了偏差，相对于VMF1-FC和GPT3的改进率分别为99.93%/99.91%、99.75%/99.67%和95.49%/93.98%。XTm、LTm和CTm的RMSE分别为1.45 K、1.45 K和1.46 K。与VMF1-FC（1.78 K）和GPT3（4.13 K）相比，XTm、LTm和CTM的RMSE分别降低了18.50%/64.93%、18.44%/64.91%和18.11%/64.76%。总体而言，XTm、LTm和CTm的偏差接近零，RMSE较低，表明温度估计精度有所提高。表3总结了不同模型的总体全球精度。为了进一步评估精细模型的空间稳定性，图6和图7展示了基于GPT3、VMF1-FC、XTm、LTm和CTm的温度精度空间分布。GPT3和VMF1-FC在偏差和RMSE方面表现出明显的空间异质性。GPT3在中高纬度大陆内部表现出显著的正偏差和较大的RMSE，而在沿海地区则表现为负偏差和较小的RMSE。VMF1-FC主要表现为正偏差，在东北欧亚和北美东北部的偏差和RMSE值都相对较大。相比之下，XTm、LTm和CTm的偏差和RMSE分布在全球范围内更为均匀，区域变异性明显减小。图6展示了基于GPT3、VMF1-FC、XTm、LTm和CTm的温度偏差的站点分布。(a) GPT3；(b) VMF1-FC；(c) XTm；(d) LTm；(e) CTm。图7展示了基于GPT3、VMF1-FC、XTm、LTm和CTm的温度RMSE的站点分布。(a) GPT3；(b) VMF1-FC；(c) XTm；(d) LTm；(e) CTm。总体而言，XTm、LTm和CTm在全球范围内实现了更低的偏差和RMSE，与VMF1-FC和GPT3相比，站点间的精度分布更加均匀。

5.2. 不同纬度带模型的精度
温度精度随纬度的变化已被广泛报道[54,55,56]。为了说明XTm、LTm和CTm的纬度依赖性能，将地球划分为六个间隔30°的纬度带。对于每个纬度带，根据每个带内的站点计算了基于GPT3、VMF1-FC和精细模型的平均偏差和RMSE，如图8所示。在偏差方面，GPT3在南半球的中高纬度地区表现出相对较大的偏差，并在五个全球纬度带中表现出负偏差。最大绝对偏差达到2.21 K，表明温度被低估了。相比之下，VMF1-FC在北半球呈现出较大的偏差，并且在五个纬度带中显示出正偏差，最大值为1.07 K，这表明Tm的估计明显过高。XTm、LTm和CTm在所有六个纬度带中的绝对偏差都更接近于0 K。这表明改进后的模型有效地消除了与纬度相关的偏差，使得Tm的估计值更接近参考值，从而提高了准确性。就RMSE而言，GPT3在所有六个纬度带中的RMSE最大，且随着纬度的增加而增加。VMF1-FC的RMSE随纬度的变化相对较小，但在高纬度地区也显示出较大的RMSE。与VMF1-FC相比，改进后的模型在所有纬度带中的RMSE表现都有所改善，特别是在中高纬度地区，从而在所有纬度带上实现了更均匀的RMSE。这可能归因于有效校正了偏差。图8显示了GPT3、VMF1-FC、XTm、LTm和CTm在不同纬度带上的偏差和RMSE。总之，改进后的模型有效地减少了Tm准确性的纬度依赖性，表明所提出的改进方法能够在全球范围内提供更准确的Tm估计值。

5.3. 模型在不同椭球高度范围内的准确性
Tm的准确性也受到高度的显著影响[57]。因此，为了评估改进后模型的高度依赖性性能，将319个站点的椭球高度范围（-50至2500米）划分为六个高度区间：-50–20米、20–50米、50–100米、100–200米、200–500米和>500米。图9显示了每个高度区间内不同模型得到的Tm偏差和RMSE。VMF1-FC和GPT3得到的Tm偏差与高度呈现出互补的模式。在100–200米高度区间内，GPT3的偏差相对较小，而VMF1-FC的偏差较大。相反，在20–50米和200–500米高度区间内，VMF1-FC的偏差较小，而GPT3的偏差较大。相比之下，XTm、LTm和CTm在所有高度区间内的偏差始终更接近0 K，表明改进后的模型有效地减少了高度依赖性偏差。同时，VMF1-FC、XTm、LTm和CTm在RMSE方面的表现也比GPT3更好。相对于VMF1-FC，XTm、LTm和CTm在所有高度区间内的RMSE都有进一步的改善。为了进一步量化XTm、LTm和CTm相对于VMF1-FC所实现的RMSE改进，表4总结了六个椭球高度区间内的RMSE值。XTm、LTm和CTm的RMSE相对于VMF1-FC至少提高了5%。在低和中等高度范围内，改进最为明显。特别是在100–200米高度范围内，VMF1-FC的RMSE从2.24 K降低到改进后的模型的大约1.60–1.61 K，减少了近28–29%。在更高高度（>200米）处，尽管绝对RMSE值通常较低，XTm、LTm和CTm仍然实现了大约5–6%的稳定减少。表4显示了VMF1-FC、XTm、LTm和CTm在不同椭球高度范围内的RMSE（K）。总体而言，XTm、LTm和CTm在不同高度区间内的准确性和稳定性都优于GPT3和VMF1-FC。Tm准确性的高度依赖性得到了有效缓解，突显了所提出改进模型的强大性能和稳健性。

5.4. 模型在不同时间内的准确性
Tm与季节变化有一定的相关性[58,59]。为了评估模型的季节性特征，计算了五个模型在不同季节得到的Tm偏差和RMSE。结果以误差条图的形式显示在图10中。每个面板中的中心圆表示季节平均值，而相应的误差条长度反映了相应季节内模型误差的分布。对于偏差，GPT3和VMF3-FC显示出明显的季节性依赖性，尤其是在秋季和冬季，偏差较大，误差条也较长。相比之下，XTm、LTm和CTm在所有季节内的偏差始终接近零，且分散度明显减小。RMSE也显示出类似的季节性模式。GPT3在不同季节的误差较大，季节性对比也更强。与GPT3相比，VMF1-FC的RMSE较小，季节性变化也较小，表明其季节性性能更佳。XTm、LTm和CTm进一步降低了RMSE，并保持较低的值水平，季节性变化有限。这些结果表明，尽管Tm受到季节性热变量的影响，但改进后的模型提供了最一致和季节性稳定的Tm估计值。

图10显示了GPT3、VMF1-FC、XTm、LTm和CTm在不同季节的偏差（a）和RMSE（b）的变化。季节性分析反映了长期（低频）的变化。为了进一步描述短期（高频）变化，进行了日变化分析。这两种分析互补地评估了模型在不同时间尺度上的性能。图11显示了每日平均偏差和RMSE的时间序列。如图11的上半部分所示，GPT3的偏差分布更广，全年波动较大，而VMF1-FC、XTm、LTm和CTm的偏差相对稳定。VMF1-FC的偏差全年保持正值，并显示出相对稳定的变化。XTm、LTm和CTm的日偏差变化与VMF1-FC相似，但全年始终更接近0 K，与RS Tm的一致性更好。图11的下半部分显示，GPT3的日平均RMSE最大，时间波动最明显，具有明显的季节性变化。相比之下，VMF1-FC和三个改进模型的日平均RMSE全年相对稳定。尽管VMF1-FC和改进模型的年RMSE水平相当，但改进模型在大多数时期内的日RMSE值较小，表明其性能优于VMF1-FC。

总体而言，XTm、LTm和CTm在不同高度区间内的准确性和稳定性优于GPT3和VMF1-FC。Tm准确性的高度依赖性得到了有效缓解，凸显了所提出改进模型的强大性能和稳健性。

6. 结论
在这项研究中，首先使用2019–2021年间来自319个全球RS站点的RS Tm数据和GPT3模型评估了网格化VMF1-FC的Tm预测准确性。评估结果表明，尽管VMF1-FC的RMSE具有明显优势，但其偏差也相对较大。此外，VMF1-FC的RMSE和偏差都显示出显著的空间异质性和季节性变化。为了改进VMF1-FC预测的Tm，基于XGBoost、LightGBM和CatBoost开发了三个改进的VMF1-FC Tm模型（XTm、LTm和CTm）。2022年使用独立RS观测数据的验证表明，XTm、LTm和CTm与RS Tm的一致性更好，其偏差分别为0 K、0 K和-0.03 K。得益于偏差的减少，改进模型的RMSE也有所提高，相对于VMF1-FC和GPT3，其改进率分别为18.50%/64.93%、18.44%/64.91%和18.11%/64.76%。此外，XTm、LTm和CTm在不同纬度带、椭球高度范围和时间尺度上的表现也优于VMF1-FC和GPT3。因此，所提出的改进模型可以有效提高GNSS气象学中使用的Tm准确性，从而实现从GNSS ZWD到PWV的更可靠转换。这一改进对于基于GNSS的实时PWV和天气预报应用特别有益。未来的工作将改进模型在复杂大气条件下的泛化能力，如极端降雨。

热点排行