孟加拉国寒潮预测：一种经验证的机器学习早期预警与脆弱性降低方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《BMC Environmental Science》：Forecasting cold wave in Bangladesh: a validated machine learning approach for early warning and vulnerability reduction

【字体：大中小】 时间：2026年06月11日 来源：BMC Environmental Science

编辑推荐：

　　背景寒潮是孟加拉国北部重要的健康危害，但用于支持早期预警的经验证预测工具仍然有限。本研究构建并验证了用于预测迈门辛地区每日最低气温和寒潮事件的机器学习模型。方法研究人员分析了1985—2022年的每日最低气温数据（38年）。采用ARIMA和

背景
寒潮是孟加拉国北部重要的健康危害，但用于支持早期预警的经验证预测工具仍然有限。本研究构建并验证了用于预测迈门辛地区每日最低气温和寒潮事件的机器学习模型。

方法
研究人员分析了1985—2022年的每日最低气温数据（38年）。采用ARIMA和ETS，以及机器学习模型SVR、RF、LSTM，并通过5折时间序列交叉验证（Time Series Cross-Validation）检验混合模型的表现。最终选择性能最优的LSTM模型（32个单元，1层）用于2027年预测，并给出预测区间。

结果
LSTM的表现优于其他所有模型，测试集获得RMSE为1.395 °C、MAE为1.053 °C、MASE为0.906。统计模型表现较差（RMSE＞6.7 °C）。与独立LSTM相比，混合模型未显示统计学显著优势。在寒潮检测方面（阈值＝低于10 °C），LSTM表现出较高的判别能力（ROC-AUC＝0.975），但召回率很低（0.215），仅识别出65个实际寒冷日中的14天。对2027年的预测显示不存在寒潮，且所有温度均高于阈值。上述发现仅适用于迈门辛观测站；推广至其他地区仍需进一步验证。

结论
LSTM在气温预测方面有效，但其极低的召回率（0.215）严重限制了其在业务化早期预警中的直接应用。这些发现支持在冬季将模型输出与审慎解释相结合的业务指导原则。未来研究应纳入多个观测站和健康结局数据，以增强针对脆弱性降低的预测能力。

该论文发表于《BMC Environmental Science》，围绕孟加拉国北部寒潮这一具有显著公共卫生和农业风险的气候事件，评估了多类时间序列预测模型在区县尺度寒潮预警中的适用性。研究背景在于，迈门辛（Mymensingh）等北部地区冬季常出现最低气温低于10 °C的寒冷过程，此类事件可增加低体温症死亡风险，并造成农业减产与基础设施扰动。然而，现有寒潮预警工具在当地仍缺乏严格验证，尤其缺少能够同时兼顾温度预测精度与寒潮识别能力的业务化模型。传统统计模型如自回归积分滑动平均模型（ARIMA）和指数平滑状态空间模型（ETS）擅长刻画线性趋势和季节性，但对极端天气中常见的非线性波动和突发性降温响应不足。与此同时，机器学习方法，尤其长短期记忆网络（LSTM，一类能够学习长期时序依赖的循环神经网络），在复杂气象序列建模方面显示出潜力。基于此，研究人员系统比较了统计模型、机器学习模型及其混合模型在迈门辛日最低气温预测中的性能，并进一步讨论其对寒潮预警和脆弱人群保护的现实意义。

方法概括：研究使用孟加拉国气象局（BMD）提供的迈门辛单站1985—2022年每日最低气温资料，共13,787条记录。缺失值以基于时间的插值法处理。数据按时间顺序划分为训练集（70%）和测试集（30%），并基于偏自相关分析构建30天滞后特征。研究比较ARIMA、ETS、支持向量回归（SVR）、随机森林（RF）和LSTM，以及6种混合模型；采用5折时间序列交叉验证进行超参数选择与残差建模；以RMSE、MAE、sMAPE、MASE评估预测性能，并以精确率、召回率、F1值、准确率和ROC-AUC评价寒潮识别能力，最后对2027年进行带80%和95%预测区间的外推预测。

在研究结果部分，论文首先通过“历史最低气温格局”表明，1985—2022年迈门辛日最低气温具有显著季节周期，夏季较高、冬季较低，最低记录为2012年12月10日的4.70 °C，最高记录为2007年7月11日的30.60 °C。这种明显的年内变化和年际波动，为寒潮预测建模提供了经验基础。研究还指出，缺失值仅占0.22%，经清洗后，增广迪基-富勒检验（ADF）拒绝单位根原假设，而KPSS检验未拒绝平稳性原假设，说明该最低气温序列在研究期内具备平稳性，从而支持后续时间序列建模。

在“年际变异与分解分析”部分，研究通过逐年箱线图和STL分解（季节-趋势分解）发现，季节成分主导了温度序列的变化，可解释总方差的92.3%。这一结果说明，虽然年际间存在极端低温离群点，但序列总体受强季节性控制，也提示模型若能有效学习季节循环与局地波动，就有望提高最低气温的预报能力。

在“统计模型选择与基线比较”部分，研究人员仅利用训练集进行模型筛选，以避免测试集信息泄漏。ARIMA候选模型中，ARIMA(1,1,2)在AIC和BIC上最优；ETS中，ETS(A,N,N)优于包含趋势或季节项的其他设定。尽管如此，这两类统计模型在测试集上的表现都较差，RMSE约为6.7—6.8 °C，MASE大于4，甚至劣于简单基线方法。研究还比较了气候学基线、季节朴素模型和持续性预测，发现气候学基线表现最好，且Diebold-Mariano检验表明基线模型间差异具有统计学意义。这说明对该地区日最低气温而言，单纯线性统计框架难以充分刻画其复杂变化。

在“滚动窗口验证与预报时效”部分，ARIMA(1,1,2)在5折滚动验证中显示，随预报提前期延长，误差单调增大：1天、3天、7天和30天前瞻RMSE依次增加。这一结果虽未改变其整体劣势，但揭示了提前期与预报可靠性之间的关系，对业务预警中不同时间尺度的信息使用具有参考意义。

在“个体模型表现比较”部分，研究显示，机器学习模型整体显著优于统计模型。LSTM取得最佳综合表现，RMSE为1.395 °C、MAE为1.053 °C、SMAPE为10.995%、MASE为0.906；SVR与RF紧随其后，RMSE分别为1.403 °C和1.435 °C。所有机器学习模型的MASE均低于1，表明其优于朴素持续性预测。论文指出，LSTM优势主要来自三个方面：一是日最低气温相较平均温度和最高温度具有更强的时间自相关性；二是38年的长时间训练样本足以学习稳定的季节结构；三是单站分析避免了空间异质性带来的额外误差。因此，LSTM能够更好提取时序中的长期依赖和非线性关系。

在“混合模型性能比较”部分，研究构建了LSTM+ARIMA、LSTM+ETS、SVR+ARIMA、SVR+ETS、RF+ARIMA和RF+ETS六种混合模型，其思路是先用机器学习模型生成预测，再用统计模型拟合残差中的剩余线性结构。结果显示，LSTM+ARIMA的RMSE为1.397 °C，LSTM+ETS为1.399 °C，均与独立LSTM的1.395 °C极为接近。Diebold-Mariano检验进一步表明，仅LSTM+ARIMA与其基础模型存在统计学差异，且仍是独立LSTM更优；其余混合模型均未较对应单一模型带来显著改进。因此，该研究没有支持“混合化必然提升预测精度”的假设，提示在此类单变量最低气温序列中，LSTM已足以捕捉大部分有效信息。

在“最佳模型拟合效果”部分，研究通过测试期实际值与LSTM预测值的对比图表明，LSTM能够较好跟踪整体季节变化和日尺度波动，说明其不仅在误差指标上领先，在时序形态重建方面也具有较好的稳定性。

在“月尺度表现与寒潮识别”部分，研究将寒潮日定义为最低气温低于10 °C的日期，并评估LSTM的分类能力。结果表明，该模型在夏季月份表现最佳，RMSE约0.85—0.92 °C，而在11月至1月等冬季月份误差升高至约1.37—1.87 °C，提示极端低温情景更难预测。寒潮识别主要集中在11—12月和1月：12月实际43个寒潮日中识别出22天，11月18天中仅识别2天，1月4天中识别1天。总体而言，模型精确率为0.560，召回率仅0.215，F1值为0.311，准确率为0.985，ROC-AUC为0.975。论文特别指出，高准确率受到类别不平衡影响，因为非寒潮日远多于寒潮日；尽管ROC-AUC表明模型具有很强的区分能力，但其保守倾向导致漏报严重，共漏检51个寒潮日，仅有11次误报。这意味着模型更倾向于避免虚警，而不是尽可能捕捉真实寒潮，对于公共卫生预警而言，这种低召回率是关键短板。

在“2027年预测与不确定性评估”部分，研究采用最佳LSTM模型对2027年进行预测，并构建80%和95%预测区间。预测结果维持典型季节循环，夏季最低气温约24—25 °C，冬季最低约22—23 °C；预测区间随时间推移而逐渐变宽，80%区间平均约±1.8 °C，95%区间约±2.7 °C。中心预测值全部高于10 °C阈值，因此模型未给出2027年寒潮日。然而，论文明确强调这一结果必须极其谨慎地解读：由于模型历史召回率仅为0.215，存在系统性低估寒潮的倾向；模型训练数据止于2011年，不能反映其后潜在的气候型态变化；同时冬季区间宽度仍允许实际温度落至阈值以下。因此，该结果不应被理解为“2027年没有寒潮风险”，而仅是“在既有模式延续假设下的一种情景”。

在讨论部分，研究人员认为，LSTM优于ARIMA、ETS、SVR和RF，证明深度时序模型在最低气温预测上具有明显优势；而混合模型未能超越独立LSTM，则说明当基础模型已充分学习到主要时序结构时，残差校正的附加价值有限。论文同时强调，虽然LSTM对寒潮具有高判别能力，但极低召回率严重限制其直接用于业务化早期预警。模型当前更适合作为最低气温预测工具，而非独立寒潮预警系统。研究还指出若要增强实用性，未来应纳入湿度、风速、云量及大尺度气候指数等补充因子，并处理类别不平衡问题，如通过过采样、代价敏感学习或稀有事件检测方法提高召回率。此外，由于本研究仅基于迈门辛单站数据，且未结合死亡、住院等健康结局，因此其公共卫生转化价值仍有待进一步验证。

研究结论可概括为：该研究系统比较了统计模型、机器学习模型和混合模型在孟加拉国迈门辛寒潮预测中的表现，结果表明LSTM以RMSE 1.395 °C和MASE 0.906取得最佳最低气温预测效果，明显优于ARIMA和ETS等传统统计方法。混合模型并未较独立LSTM带来显著提升。尽管LSTM在寒潮判别上具有较高ROC-AUC（0.975），但其召回率仅为0.215，只识别出65个实际寒潮日中的14天，因此不适合直接作为独立的业务化早期预警工具。基于这一局限，该模型更适合作为温度预测支持工具；若要服务孟加拉国脆弱人群风险降低，未来需整合多站点资料、更多气象预测因子与健康结局数据，并针对类别不平衡问题开展方法改进。

联系信箱：

粤ICP备09063491号

热点排行