《Data Science and Management》:Interpretable hydropower forecasting method using two-stage decomposition and its management applications
编辑推荐:
作为发电领域的首要可再生能源,水电拥有巨大的建设规模和强劲的发电能力。在全球能源危机的背景下,精确的水电预测变得愈发关键,它为各国政府制定能源战略、支持向稳定、清洁的能源未来转型提供了重要基础。尽管先前应用于水电预测的方法取得了可嘉的成果,但它们难以捕获水电发
作为发电领域的首要可再生能源,水电拥有巨大的建设规模和强劲的发电能力。在全球能源危机的背景下,精确的水电预测变得愈发关键,它为各国政府制定能源战略、支持向稳定、清洁的能源未来转型提供了重要基础。尽管先前应用于水电预测的方法取得了可嘉的成果,但它们难以捕获水电发电量显著的季节性和固有不确定性,并且往往忽视了预测模型内部可解释性的重要性。为应对上述局限性,研究人员采用了一个创新且可解释的水电发电量预测模型,该模型包含用于输入数据处理的两阶段分解方法、用于超参数优化的差分进化算法,以及时间融合Transformer(Temporal Fusion Transformer, TFT)。首先,通过两阶段分解策略自适应地获得一系列子序列,从而能够更深入地探究复杂短期水电发电序列固有的波动特征。随后,利用极光优化算法(Polar Lights Optimization, PLO)智能且有效地优化TFT模型中的参数,确保预测结构的稳定性和可靠性。实证结果表明,所提模型在短期水电预测数据集中展现出显著的适用性和有效性。通过探索对水电预测结果的解释,决策者能够更好地理解未来的水电生产能力,从而优化资源配置、管理风险并确保电力供应的稳定性。
在全球能源危机日益迫近与环境可持续发展需求双重驱动下,实现对水电发电量的精准预测已成为政府有效管理可再生能源资源的关键。然而,水电发电数据固有的复杂非线性与非平稳特性,使得实现高精度预测极具挑战性。为此,研究人员提出了一种名为EMD-ICEEMDAN-PLO-TFT的混合预测模型。该模型首先采用一种两阶段自适应分解策略,即先利用经验模态分解(Empirical Mode Decomposition, EMD)对原始水电发电时间序列进行初步分解,提取出本征模态函数(Intrinsic Mode Functions, IMF),随后选取首个IMF(IMF1)进一步使用改进的自适应噪声完全集成经验模态分解(Improved Complete Ensemble EMD with Adaptive Noise, ICEEMDAN)方法进行二次分解,从而能够从不同频率尺度更全面地揭示序列的复杂波动特征。在模型构建与优化阶段,研究人员引入了极光优化算法(PLO),这是一种受极光现象启发的新型元启发式优化算法,用于对TFT模型的关键超参数(如批处理大小、丢弃率、隐藏层数、学习率等)进行智能寻优,以确保模型获得最佳预测性能。TFT模型本身是一种基于Transformer架构、具备高可解释性的深度学习模型,它通过自注意力机制、门控机制和变量选择网络,能够有效捕捉时间依赖关系并识别不同输入特征的重要性。整个研究使用了美国、加利福尼亚州、俄勒冈州和华盛顿州从2000年12月至2024年2月的月度净水电发电数据集进行验证,数据以千兆瓦时为单位,每个数据集包含279个数据点(其中253个用于训练,26个用于测试)。
在实验结果部分,研究人员首先描述了数据集,并通过两阶段分解过程展示了如何从原始非平稳序列中提取出能够反映整体趋势、季节特征和局部波动的多组子序列。接着,通过与EMD-ICEEMDAN-LSTM、EMD-ICEEMDAN-RNN、EMD-ICEEMDAN-GRU、EMD-ICEEMDAN-TFT以及单一TFT等五个基准模型进行对比,使用平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)、平均绝对误差(Mean Absolute Error, MAE)和均方根误差(Root Mean Square Error, RMSE)三项指标评估预测性能。结果表明,所提出的EMD-ICEEMDAN-PLO-TFT模型在所有四个数据集上均取得了最优的预测精度。例如,在华盛顿州数据集上,该模型的MAPE分别比其他三个可比模型低52.5%、50.5%和52.3%,验证了TFT模型在时间序列预测中的优越性以及PLO算法在参数优化方面的智能性和有效性。同时,实验证明了两阶段分解策略相较于无分解模型能显著提升预测性能,并确认了仅对IMF1进行二次分解的策略在控制输入质量方面的合理性。研究还指出,加利福尼亚州的预测误差相对较高,这反映了该地区水电发电规律性和周期性较弱,凸显了针对不同区域制定本地化预测模型的必要性。
在讨论部分,研究人员深入分析了模型的可解释性结果。通过对过去输入变量的重要性排名分析发现,不同地区预测所依赖的关键频率成分不同,例如美国整体预测中中高频成分(IMF4)最重要,而华盛顿州和加利福尼亚州则显示过去发电历史(滞后0期)的重要性极高。对未来已知变量的重要性排名分析揭示了区域差异:美国整体预测主要受季节因素(月份)驱动,华盛顿州同样以月份为主导,俄勒冈州则受到长期趋势(年份)和相对时间因素的共同影响,加利福尼亚州则更强调长期气候变化(年份)与季节波动的组合效应。对不同滞后阶数的关注值分布分析表明,美国整体预测高度依赖最近一期(滞后-1)的数据,而华盛顿州预测更依赖长期历史数据(滞后-8),俄勒冈州在特定历史窗口(滞后-6至-4)有显著关注峰值,加利福尼亚州则需要适度权衡近期与中期历史数据。这些可解释性发现为制定差异化的能源管理策略提供了实证依据。
最后,论文得出的研究结论指出,EMD-ICEEMDAN-PLO-TFT方法在水电发电量预测中表现出高精度和稳定性,并有效利用了TFT的可解释性来应对当前领域缺乏透明度的问题。基于TFT模型解决的三方面可解释性结果,研究人员得出以下结论:基于区域差异的管理策略对水电预测至关重要;不同地区对频率成分和时间变量的依赖不同;能源管理部门应根据各区域的特征开发个性化的预测模型。例如,华盛顿州应侧重季节性预测,而加利福尼亚州则应侧重年度长期规划。同时,需要构建一个结合快速响应和长期规划能力的多时间尺度电力调度机制。通过集成知识管理系统综合分析IMF成分、时间变量和滞后关系,可以显著提高预测精度,优化电网运行,提升水电系统的可靠性和韧性,并为能源转型和气候变化下的水电资源调度提供科学依据。