基于分位数的深度集成模型用于有效波高的概率预测

《Engineering Applications of Artificial Intelligence》:Quantile-based deep ensemble models for probabilistic forecasting of significant wave heights

【字体: 时间:2026年05月24日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  有效波高(Significant Wave Height, SWH)的预测是海洋相关应用中的一项关键挑战。与传统的点预测方法不同,概率预测纳入了不确定性量化,从而能够在高度变化的海洋条件下支持更可靠、风险感知型的数据驱动决策。本文构建了一系列无分布假设(dis

  
有效波高(Significant Wave Height, SWH)的预测是海洋相关应用中的一项关键挑战。与传统的点预测方法不同,概率预测纳入了不确定性量化,从而能够在高度变化的海洋条件下支持更可靠、风险感知型的数据驱动决策。本文构建了一系列无分布假设(distribution-free)、基于分位数的集成深度学习模型,通过对自回归神经网络架构进行并行集成,以实现高质量的SWH概率预测。此外,本文回顾了适用于SWH场景的现有概率预测评估指标,并提出了一种公平决策规则,以支持可靠决策。基于来自不同海洋浮标的8个数据集开展的大量实验研究揭示了一系列具有启发性的发现。无分布假设的分位数深度学习模型优于常用的DeepAR和混合密度网络(Mixed Density Network, MDN)模型。更重要的是,与单一深度学习模型相比,所提出的集成框架在基于分位数的方法中使预测区间(Prediction Interval, PI)宽度显著降低了11%,从而实质性减少了预测不确定性。此外,海洋学外生变量对概率预测质量的影响在不同数据集之间表现出显著差异。
本文发表于《Engineering Applications of Artificial Intelligence》,聚焦于海洋工程与智能预测交叉领域中的有效波高(Significant Wave Height, SWH)概率预测问题。SWH是海洋观测与海事决策中的核心状态变量,广泛服务于波浪能开发、海上运输、近海作业、灾害预警与船舶调度等场景。由于SWH不仅受时间与空间位置影响,还与海况、气象等多种复杂外部因素耦合,其时间序列通常表现出显著的非线性、自回归依赖和非正态噪声特征。因此,传统基于能量平衡方程的物理模型虽然可用于大范围海浪演变模拟,但在特定地点、短时尺度预测任务中常面临建模复杂、计算代价高的问题;而经典统计模型如AR、ARMA、ARIMA和SARIMA虽然具有一定可解释性,却依赖线性与高斯噪声等假设,难以充分刻画SWH的复杂动态。正是在这一背景下,研究人员将深度学习与概率预测结合,旨在构建兼具精度、不确定性表达能力与决策支持价值的SWH预测框架。

现有SWH研究虽然已广泛采用人工神经网络(ANN)、极限学习机(ELM)、循环神经网络(RNN)、长短期记忆网络(LSTM)和门控循环单元(GRU)等数据驱动模型开展短期预测,但多数工作仍集中于确定性点预测。确定性预测只能输出单一未来值,容易掩盖海洋环境中客观存在的随机波动,从而使决策者产生虚假的确定性认知。相比之下,概率预测通过给出预测区间(Prediction Interval, PI)及其置信水平,能够量化风险并为实际应用提供更稳健的依据。尽管风电、光伏和负荷预测等领域已经较充分地发展了不确定性量化(Uncertainty Quantification, UQ)方法,但SWH概率预测研究仍相对有限,且现代深度概率模型与集成策略在该领域尚未得到系统探索。特别是,已有文献缺乏对不同概率预测模型的全面比较,也缺少围绕“在保持可靠性的前提下缩窄PI宽度”这一核心目标的系统分析。基于这些问题,本文开展了针对逐小时SWH的分位数型深度集成概率预测研究。

研究人员提出了一套无分布假设的分位数深度学习框架,以并行集成异构自回归神经网络来生成高质量SWH概率预测。该框架的关键思想是分别训练两个分位数网络,对应PI下界和上界;在每个分位数网络内部,同时引入RNN、LSTM和GRU三类异构深度预测架构,并将它们的隐藏表示通过稠密层进行融合。融合权重通过分位数损失函数,即pinball loss,进行端到端反向传播学习。该设计不同于传统不确定性量化中常见的bootstrap aggregation或独立模型事后平均策略,也不同于以学习完整条件分布或多个相邻分位函数为目标、并施加非交叉约束的深度分位数集成框架。本文更关注以固定置信水平构建高质量PI,并通过结构化集成提高区间质量。

除所提出的分位数集成方法外,研究还考察了近年来常用于概率预测的两类代表性深度模型,即DeepAR与混合密度网络(MDN)。其中,DeepAR通过自回归循环结构直接建模条件概率分布,MDN则通过神经网络输出混合分布参数以拟合预测分布。两类模型在风电与电力负荷等任务中已有较好表现,但在SWH概率预测中的应用尚少。本文将这些模型与基于分位数的单模型和集成模型进行统一实验比较,以系统评估不同概率预测范式在海浪场景中的适用性。研究结果表明,分位数方法在覆盖率控制方面更稳定,而DeepAR与MDN在SWH数据上较难持续达到目标覆盖水平。

从技术方法看,本文主要采用三类关键方法。其一,使用基于分位数回归(quantile regression)的无分布假设概率预测框架,通过估计0.05与0.95分位函数构造90%置信水平的PI。其二,在每个分位网络中并行集成RNN、GRU和LSTM等异构自回归神经架构,并利用稠密融合层进行端到端联合训练。其三,基于来自不同海洋区域浮标的8个逐小时SWH数据集,对11种深度概率预测模型进行系统评估,并结合现有评分规则与本文提出的公平决策规则分析模型在实际决策支持中的表现。

在研究结果部分,论文首先围绕“Deep learning based probabilistic forecasting models”展开,对概率预测问题及常用深度自回归模型进行了综述性梳理。该部分为后续方法比较奠定了理论基础,明确了SWH概率预测任务不仅要求预测值准确,还要求预测分布或区间具备良好的校准性(calibration)与尖锐性(sharpness)。这意味着评估不能仅关注平均误差,还需要关注PI是否覆盖真实值以及区间是否足够紧凑。

在“Methodology”部分,研究人员系统描述了所提出的SWH概率预测流程。核心是将下界与上界分位数建模分解为两个独立学习任务,并在每个任务中利用RNN、LSTM和GRU并行抽取时间依赖特征。与单一架构相比,这种异构并行集成有助于整合不同循环结构对短期与长期依赖的建模优势。随后,通过稠密层对隐藏特征进行融合,并以pinball loss优化对应分位数估计。该方法最终生成具有指定覆盖水平的PI,用于表征未来SWH可能落入的范围。论文还在方法部分讨论了概率预测评估指标及两模型比较时的公平决策规则,体现出其研究不仅关注建模,也关注评估与应用落地。

在“A detailed analysis of the proposed deep quantile ensemble framework”部分,论文从多个角度分析了所提深度分位数集成框架的结构特性与性能优势。研究表明,集成学习不仅能提高覆盖表现,更能改善PI的结构质量。特别是在不损害校准性能的条件下,集成可有效压缩PI宽度。对于概率预测而言,更窄且仍能维持目标覆盖率的区间意味着更低的不确定性和更高的可操作性。这一点对于海上运维、风险预警和能源调度等任务具有直接意义,因为决策者通常更依赖既可靠又不保守的区间信息。

在“Experiment section”部分,研究人员基于8个不同海洋浮标数据集,对分位数深度学习模型、分位数深度集成模型、DeepAR模型和MDN模型等共11种深度概率预测方法进行了广泛比较。实验使用逐小时SWH数据,并以90%置信水平为目标,通过估计0.95分位函数和0.05分位函数构建PI。结果显示,基于分位数的方法整体优于DeepAR和MDN,说明在SWH这类复杂、噪声分布不稳定的海洋时间序列中,无分布假设的分位数框架更具鲁棒性。更重要的是,相比单一深度模型,集成框架将PI宽度显著缩减11%,同时未牺牲目标覆盖率。这一结果直接证明,异构深度并行集成在概率预测场景中不仅提升了预测质量,也有效降低了不确定性表达中的冗余保守性。论文还指出,海洋学外生变量对预测质量的贡献在不同数据集之间存在明显差异,提示不同海域的SWH概率预测可能需要因地制宜地设计输入特征与模型配置。

综合论文主体内容,本文的主要学术价值体现在三个方面。首先,它将分位数学习与异构深度集成有机结合,补足了SWH概率预测领域在现代数据驱动不确定性建模方面的不足。其次,它通过与DeepAR、MDN等代表性深度概率模型的系统比较,明确了不同方法在SWH应用中的适用边界,证明分位数方法在覆盖率实现和区间质量控制上具有优势。再次,论文不仅关注预测性能本身,还进一步讨论了概率预测评估规则及其与实际决策支持目标的一致性,这使研究从“模型精度优化”拓展到“可靠决策服务”的层面。

论文讨论部分强调,SWH预测中的真正关键并非仅提高点预测精度,而是在海洋高变环境中提供可靠、可解释且可操作的不确定性信息。研究表明,集成学习能够在维持校准性的同时缩窄PI,这对海洋与波浪能应用中的实时决策尤为重要。与此同时,不同外生海洋变量对概率预测质量的影响存在数据集间差异,说明模型泛化和输入变量选择仍需结合具体场景审慎评估。总体而言,本文为SWH概率预测提供了一种具有实际应用潜力的深度学习解决方案,并为后续围绕评估准则、决策规则及多源海洋信息融合的研究奠定了基础。

研究结论部分可概括翻译如下:本文开发了面向SWH应用的深度概率预测模型,采用以pinball loss函数优化的分位数学习框架,并结合深度神经架构的并行集成。所提出框架通过估计下侧q分位函数与上侧(0.9+q)分位函数,生成90%置信水平的逐小时SWH概率预测。为实现这一目标,研究考察了包括RNN、GRU和LSTM在内的多种深度学习架构及其混合集成形式。整体实验结果表明,基于分位数的深度学习模型优于DeepAR与MDN模型,而并行集成框架进一步显著降低了PI宽度,从而减少预测不确定性并提升决策支持能力。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号