《Atmospheric and Oceanic Science Letters》:Improving seasonal prediction skill for South China heatwaves based on circulation classification and machine learning
编辑推荐:
由于华南热浪具有多样的环流背景,本研究采用环流分型和机器学习方法以提高热浪的季节预测技巧。具体而言,研究人员首先利用谱聚类方法将1981–2024年华南热浪的环流型客观地分为两类:高压主导热浪(HP-HW)和热带气旋驱动热浪(TC-HW)。研究人员选取HP-H
由于华南热浪具有多样的环流背景,本研究采用环流分型和机器学习方法以提高热浪的季节预测技巧。具体而言,研究人员首先利用谱聚类方法将1981–2024年华南热浪的环流型客观地分为两类:高压主导热浪(HP-HW)和热带气旋驱动热浪(TC-HW)。研究人员选取HP-HW的总日数和所有热浪(ALL-HW,即未分类热浪)的总日数作为两个预测对象,以检验环流分型是否能提升季节预测技巧。结果表明,HP-HW是华南地区的主导热浪类型,占总热浪日数的75.1%。在独立预测期,HP-HW预测的确定系数(R2)平均值为0.42,相关系数(CC)为0.78,分别比ALL-HW的预测结果(R2= 0.23;CC = 0.69)高出19%和13%。机理分析表明,诸如印度洋海表温度异常等大尺度前兆信号能够持续加强华南地区的季节性高压背景,从而增强HP-HW的季节可预报性。这些结果表明,环流分型能够有效分离出可预测的物理路径,并为改进区域气候极端事件的季节预测提供了一个实用的框架。
在全球变暖背景下,热浪的频率与强度显著增加,对人类社会系统和公共健康构成了严峻威胁。季节尺度的热浪预测能够为防灾减灾、能源调度和政策规划提供关键的预警时间,因此受到广泛关注。中国地区的热浪变化呈现出明显的区域差异,其中华南地处东亚季风与南亚季风的过渡带,受西太平洋副热带高压(WPSH)、南亚高压以及热带气旋的共同影响。这种复杂的动力驱动机制使得该地区可靠的季节热浪预测面临巨大挑战。尽管近年来相关研究取得了一定进展,但现有研究大多将所有热浪事件视为单一类别进行处理,这掩盖了不同天气尺度机制下的独特前兆信号。例如,西太平洋副热带高压的增强与热带气旋均可能触发热浪,但其预测所依赖的前兆因子和物理机制截然不同。因此,引入环流分型方法有望提升季节预测的准确率。此外,机器学习技术的兴起为改进季节预测技巧提供了新的契机,其性能在某些案例中甚至超越了数值模式和传统统计方法。鉴于此,研究人员基于环流分型思想,结合多种机器学习算法,旨在探究分类预测是否优于传统的未分类整体预测,以期为区域热浪预测提供新的见解。该研究成果发表在国际期刊《Atmospheric and Oceanic Science Letters》上。
为了开展此项研究,研究人员采用了以下几个关键技术方法:首先,研究使用了1980年至2024年的多源数据集,包括来自第五代欧洲中期天气预报中心大气再分析(ERA5)的2米气温数据用于识别热浪,以及海表温度(SST)、土壤湿度、积雪深度和海冰密集度等作为候选前兆因子,同时引入了ECMWF第5季季节预报系统(SEAS5)的500-hPa位势高度场及多个大气涛动指数。其次,在热浪识别与分型方面,研究人员定义了华南区域(21°–25°N, 108°–118°E)的热浪标准,并采用谱聚类方法,输入1000 hPa、850 hPa、500 hPa和200 hPa的日均水平风场特征,将热浪日样本客观划分为两类环流型。最后,在预测建模与评估环节,研究人员选用了线性回归(LR)、岭回归(Ridge)、套索回归(Lasso)、负二项回归(NB)、随机森林(RF)、ARIMAX(ARX)和长短期记忆网络(LSTM_ARX)共七种机器学习算法;通过构建所有可能的三因子组合作为候选预测因子集,采用独立期预测验证(2016–2024年)和20年滚动交叉验证进行评估,并以决定系数(R2)、相关系数(CC)和技巧评分(SS)作为核心评价指标。
3.1. 基于环流分型的热浪分类
研究人员通过谱聚类分析发现,华南热浪在环流背景上可明确分为两类。第一类为高压主导热浪(HP-HW),其特征是500 hPa高度场呈显著正异常,850 hPa伴随明显的反气旋异常,通常通过下沉增温和辐射加热促使高温产生。第二类为热带气旋驱动热浪(TC-HW),其500 hPa高度场为负异常且西太平洋副热带高压被抑制,850 hPa呈现气旋性异常,主要由气旋外围的下沉气流经地形产生的焚风效应引起。统计显示,在研究期内共识别出397个热浪日,其中HP-HW占主导地位,比例高达75.1%,并且是总热浪日数年际变异和长期趋势的主要贡献者;TC-HW虽然占比为24.9%,但也呈现出明显的增长趋势。
3.2. HP-HW与ALL-HW的预测表现
针对HP-HW和未分类的所有热浪(ALL-HW)的预测实验表明,环流分型显著提升了预测技巧。在独立预测期,HP-HW预测的平均R2达到0.42,CC达到0.78,SS为0.23;而ALL-HW的平均R2仅为0.23,CC为0.69,SS为0.12。其中,负二项回归模型对HP-HW的预测技巧最高(R2= 0.58, CC = 0.76, SS = 0.34)。对比分析发现,七种算法中有六种在HP-HW上的表现优于ALL-HW,模型平均R2、CC和SS分别提升了19%、13%和11%。时间序列对比进一步证实,HP-HW的预测结果能更紧密地追踪观测值的年际变率,且振幅误差更小。
3.3. HP-HW预测技巧更高的物理解释
为了解释为何HP-HW具有更高的预测技巧,研究人员分析了印度洋海温(IO_SST_MAM)、赤道东太平洋海温(EP_SST_JF)和西太平洋热带海温(WTP_SST_May)等关键前兆因子。合成分析发现,这些前兆因子的高值年往往伴随着华南地区显著的500 hPa正位势高度异常。这些大尺度前兆信号能够持续加强季节尺度的反气旋环流,促进下沉增温和晴空辐射加热,从而有利于HP-HW的发生,表现出稳定的物理联系。相比之下,TC-HW主要受热带气旋活动影响,其动力机制更多由天气至中尺度扰动和大气内部变率主导,与大尺度前兆信号的联系较弱且不稳定。因此,将TC-HW与HP-HW混合为ALL-HW进行分析,会将强信号淹没在高噪声的变率中,从而降低了整体的预测技巧。
讨论与结论
该研究证实了环流分型能够实质性地提高华南热浪的季节预测技巧。通过将高压主导热浪从所有热浪事件中分离出来,七种机器学习模型均一致显示出对HP-HW更高的预测能力,这反映了HP-HW与大尺度前兆信号之间更清晰、更稳定的物理联系。物理诊断进一步揭示,关键的海温及陆-气前兆因子能够加强华南地区的反气旋环流,而TC-HW则受制于天气尺度的变率,稀释了ALL-HW的可预测性。这些发现证明了将环流背景态纳入统计预测框架的益处,并阐明了增强区域热浪预报的物理机制。
尽管取得了上述进展,当前研究仍存在一定的局限性。固定三个预测因子的超轻量级设计限制了模型整体解释方差的提升,未来应探索扩展预测因子集、非线性架构及优化超参数的方案。此外,尽管TC-HW带来了显著的局地风险,但其季节可预测性受到天气尺度动力过程和样本稀疏的根本限制,未来需致力于开发考虑零膨胀特性的统计-动力混合预测方法。