《Applied Ocean Research》:Fast prediction of oceanic nearshore circulation (FPOCH) system with multi-model fusion strategies
编辑推荐:
近岸流场的精确表征对于高效海岸带管理与风险缓解至关重要。传统数值模型通常需要在预测精度与计算效率之间进行权衡。相比之下,纯数据驱动海洋模型难以充分捕捉多尺度过程、区域异质性与极端事件,从而限制了其在业务化预报中的适用性。为应对这些挑战,本研究提出海洋近岸环流快
近岸流场的精确表征对于高效海岸带管理与风险缓解至关重要。传统数值模型通常需要在预测精度与计算效率之间进行权衡。相比之下,纯数据驱动海洋模型难以充分捕捉多尺度过程、区域异质性与极端事件,从而限制了其在业务化预报中的适用性。为应对这些挑战,本研究提出海洋近岸环流快速预测(FPOCH)系统,这是一种数字孪生(digital twin)框架,集成了数值模拟(FPOCH numerical simulations,以下简称 FPOCHNS)、模型嵌套策略以及机器学习(machine learning,ML)技术。该集成框架可实现从大陆架到近岸海岸带的快速、高精度和可扩展预测。
FPOCHNS 采用模型嵌套策略,集成两个基于物理的模型和一个 ML 平台:FPOCHNS1 覆盖中国近海;FPOCHNS2 为南黄海(South Yellow Sea,SYS)提供更高分辨率模拟;FPOCH-ML 则面向 SYS 内的一个近岸子区域。在大空间尺度上,FPOCHNS 的预报精度优于全球业务化模型,从而为后续在 FPOCH-ML 中实施的快速预报框架提供边界条件与强迫数据。在近岸尺度上,FPOCH-ML 引入先进算法,在保持与验潮站观测一致的更新频率前提下,利用稀疏潮位观测实现快速流速预测。FPOCH-ML 包含两个算法模块:单点预报算法与场预报算法。针对每个模块,研究人员训练多个 ML 模型开展协同工作,并系统测试和比较多种网络架构。结果表明,基于经验模态分解(Empirical Mode Decomposition,EMD)的混合机器学习架构(EMD-ML)在单点与区域两类潮位预报任务中均优于长短期记忆网络(long short-term memory,LSTM)和卷积长短期记忆网络(convolutional LSTM,ConvLSTM)模型。相较之下,在两类应用情景下的流速预报中,LSTM 与 ConvLSTM 的表现均优于 EMD-ML。经优化后,该框架表现出较高预测精度:EMD-ML 在潮位预报中的均方根误差(RMSE)为 0.03 m;LSTM 在单点流速预报中的 RMSE 为 0.03 m/s;ConvLSTM 在区域流速预报中的 RMSE 为 0.03 m/s,流向预报误差为 5.46°。值得注意的是,在台风诱发风暴增水期间,FPOCHNS 的误差约为全球模型的 1/3,而 FPOCH-ML 的运行速度约为传统数值模拟的 20 倍。
本研究表明,融合基于物理与数据驱动方法的多模型集成策略优于单一数据驱动模型和传统全球业务化系统。由此,FPOCH 为跨多空间尺度与时间尺度的集合预报提供了高效框架,可为近岸水动力应用、灾害预警和海岸工程设计提供可操作的信息支持。
该文发表于《Applied Ocean Research》,围绕近岸水动力快速预报这一关键问题,提出了海洋近岸环流快速预测(FPOCH)系统,用以解决传统数值模式与纯数据驱动模式各自存在的局限。研究背景在于,近岸海域受复杂水深地形、岸线形态、边界条件及多过程耦合作用影响,流场具有显著三维性、多尺度性与区域异质性,尤其在潮汐、风暴增水和台风等极端事件作用下,流速、流向及水位变化更为剧烈。这使得近岸环流的业务化预报长期面临双重难题:一方面,高分辨率物理数值模式虽然能够较好刻画动力过程,但普遍存在计算成本高、实时性不足的问题;另一方面,纯机器学习模型虽然计算迅速,却往往难以保持物理一致性,也难以在多尺度嵌套、极端事件和空间外推场景下稳定泛化。因此,开展兼顾物理机制、预报精度与计算效率的混合式数字孪生研究,成为近岸环流预报领域的重要需求。
针对上述问题,研究人员构建了一个物理—数据双驱动的数字孪生框架 FPOCH。该系统由多源数据采集模块、嵌套式数值模拟系统 FPOCHNS、机器学习快速预报平台 FPOCH-ML 以及可视化模块组成。其核心思想是在大尺度上通过数值模式获得稳定且具物理约束的海洋环境背景场,在小尺度近岸区域中利用观测与上游模式输出建立机器学习代理模型,从而实现从中国近海到南黄海再到通州湾近岸子区的多尺度快速预报。论文的主要结论表明:FPOCHNS 在区域海域和台风风暴增水模拟中优于常见全球业务化分析系统;FPOCH-ML 在潮位和流场快速预报方面具有较高精度,其中 EMD-ML 更适于潮位预测,LSTM 与 ConvLSTM 更适于流速和流向预测;整体系统在保持较高精度的同时显著提高了运算效率,验证了多模型融合策略在近岸数字孪生预报中的有效性。该研究的重要意义在于为近岸水动力场实时模拟、灾害预警、无人船轨迹规划和海岸工程设计提供了一种可扩展的业务化技术框架。
研究人员主要采用了以下关键技术方法:首先,建立了三级嵌套技术体系,包括覆盖中国近海的 FPOCHNS1、覆盖南黄海近岸的高分辨率 FPOCHNS2,以及面向通州湾蓝沙洋航道附近约 2 km × 5 km 子区的 FPOCH-ML;其次,在数值模拟部分采用基于三维原始方程的有限体积海洋模式,并通过非结构网格提高近岸与岛屿附近分辨率;再次,在机器学习部分分别构建单点预报与场预报流程,系统比较 LSTM、EMD-ML 和 ConvLSTM 三类网络架构;最后,以 2016–2017 年 LYS 站小时潮位资料和 FPOCHNS2 输出作为训练与验证数据,并以 2024 年独立观测资料作为预报检验数据,形成数值模式—观测—机器学习联合验证体系。
以下结合论文主体结果进行解读。
3.1. Performance of FPOCHNS1
该部分检验 FPOCHNS1 作为大尺度上游物理模式的可靠性,因为它不仅决定中国近海区域的潮位与流场精度,也直接为下游嵌套模式和机器学习平台提供边界与背景信息。
3.1.1. During non-typhoon period
在非台风时段,研究人员按照区域特征及潮汐类型对站点进行了分类,并将 FPOCHNS1 的潮位与表层潮流结果同国家海洋数据与信息服务系统(NMDIS)资料进行对比。结果显示,FPOCHNS1 对潮位的模拟精度较高,RMSE 小于 0.2 m,BIAS 小于 0.05 m,NSE 大于 0.9;对表层潮流流速的模拟同样表现较好,RMSE 为 0.09–0.12 m/s,BIAS 为 ?0.01–0.05 m/s,NSE 大于 0.7。由此可见,该模式在稳定天文潮主导条件下能够较好重现中国近海不同潮汐区的水位与流速变化,为后续极端天气检验及嵌套应用提供了基础。
3.1.2. During typhoon period
在台风情景下,研究以 2024 年台风 Bebinca 个例为例,比较了 FPOCHNS1、HYCOM 分析资料与 CMEMS 分析资料对风暴增水和流场的模拟能力。结果表明,台风登陆期间,中国东部近海出现显著向岸流动,南黄海附近形成强流汇聚,FPOCHNS1 成功捕捉到入湾急流结构,并在空间细节上优于 HYCOM 和 CMEMS。与实测潮位比较发现,FPOCHNS1 对沿岸站点增水峰值的误差小于 0.1 m,而 CMEMS 对峰值存在明显低估,在部分站点误差可达 2.0 m 和 0.5 m。该结果说明,采用混合台风风场与更高近岸分辨率的 FPOCHNS1,在极端天气下对近岸响应的刻画明显优于全球业务系统。
3.2. Performance of FPOCHNS2
FPOCHNS2 是面向南黄海近岸复杂地形和人类活动影响区域建立的高分辨率模式,重点承担近岸局地流场的精细化模拟任务。研究人员利用 LYS 站实测潮位与深度平均流速分量对其进行验证。结果显示,潮位模拟的 R
2 为 0.98,RMSE 为 0.1 m,BIAS 为 ?0.01 m,NSE 为 0.97;深度平均流速 u、v 分量的 R
2 为 0.88–0.93,RMSE 为 0.05–0.08 m/s,BIAS 为 ?0.01–0.02 m/s,NSE 为 0.86–0.89。台风时段进一步比较发现,FPOCHNS2 在潮位和流速分量上均比 CMEMS 和 FPOCHNS1 更接近观测,尤其能够更好重现近岸局地动力细节。这说明二级嵌套模式通过引入更细网格和更准确地形,显著提升了近岸水动力模拟能力,并为 FPOCH-ML 提供了高质量训练样本和参考场。
3.3. Performance of FPOCH-ML
这一部分是全文的核心,展示了基于潮位观测和数值模式输出构建的机器学习快速预报平台在单点和区域场两类任务中的表现。
3.3.1. Single-point forecast
在单点预报中,研究人员首先分析了 LYS 站潮位和潮流的基本特征,包括春潮与小潮期间涨落潮历时不对称、潮流滞后以及潮流椭圆的垂向结构等。结果表明,FPOCHNS2 及基于 LSTM、EMD-ML 的 FPOCH-ML 均能较好再现这些动力学特征。在潮位预报方面,两种 FPOCH-ML 模型与 FPOCHNS2 的 NSE 和 R
2 均超过 0.95,但 EMD-ML 借助经验模态分解预处理取得更高精度,NSE 和 R
2 可达 0.98,且相对于 LSTM 与 FPOCHNS2 分别降低了 0.16 m 和 0.02 m 的 RMSE,说明 EMD 对复杂潮位振荡模态的提取有明显优势。
在潮流预报方面,LSTM 总体优于 EMD-ML,尤其在流速峰值和流向转换阶段表现更好。LSTM 的流速 RMSE 约比 EMD-ML 低 0.01 m/s,NSE 高 0.15;在流向预报中,LSTM 的 RMSE 比 EMD-ML 低 13°。与 FPOCHNS2 相比,采用 LSTM 的 FPOCH-ML 在潮流速度和流向预报上也实现改进,表现为更低的偏差和更高的 NSE。研究人员指出,这一差异与近岸地形非线性作用、多频相互作用以及 EMD-ML 在 u、v 分量重构时可能引入叠加误差有关。因此,论文明确得出:单点情景下,EMD-ML 更适于潮位预报,而 LSTM 更适于潮流预报。
3.3.2. Field forecast
在区域场预报中,研究人员将单站潮位观测、空间潮位映射和流场预测串联为三步机器学习流程,并比较 LSTM、EMD-ML 与 ConvLSTM 三类网络对区域潮位与表层潮流场的预测效果。结果显示,各模型对潮位相位与振幅均能给出较好预测,其中 EMD-ML 在区域潮位预报中精度最高,RMSE 为 0.03 m,优于 LSTM 的 0.06 m 和 ConvLSTM 的 0.07 m,表明 EMD 预处理在多站点相关潮位变化提取方面仍具优势。
对于表层潮流场,三类网络在流向偏差上整体较小,高潮、低潮及涨落潮阶段的空间分布均能被较好捕捉,但 ConvLSTM 在空间结构保持方面最优。研究表明,ConvLSTM 的流速预报 RMSE 为 0.03 m/s,优于 EMD-ML 的 0.05 m/s;流向预报 RMSE 为 5.46°,也优于 EMD-ML 的 8.78° 和 LSTM 的 6.37°。尤其在流速较大的涨潮和落潮阶段,ConvLSTM 对强流区的刻画更准确。由此可见,具有显式时空卷积结构的 ConvLSTM 更适于近岸流场区域预报,而基于点预报后插值重建场的方法在空间相关性保持上存在不足。
4. Discussions & conclusions
讨论部分围绕性能提升机制、技术架构优势、系统局限与未来方向展开。研究人员指出,FPOCH 的首要贡献在于实现了模式性能与计算效率的双重突破:在大尺度海域,局地校准的 FPOCHNS1 优于 HYCOM 和 CMEMS 等全球分析系统,尤其减少了全球粗分辨率模式对近岸极端环流的低估;在近岸尺度,FPOCH-ML 通过利用潮位—潮流强相关关系和机器学习代理建模,实现了高精度快速预报。文中进一步给出效率对比:对于约 5 km × 2 km、水平分辨率 100 m、6 个垂向层的三维区域,ConvLSTM 可在约 1100 s 内完成 365 d 模拟,而传统数值模式 FVCOM 在相同条件下需约 2.2 h,显示出显著加速优势。
技术架构层面,论文总结了三方面关键优势。其一是数据互补性:数值模式弥补机器学习训练数据不足,观测数据则校验并约束数值模式和数据驱动结果,形成物理模拟与数据学习之间的协同循环。其二是 FPOCH-ML 对潮位观测的有效利用:在强潮海域中借助潮位与潮流相关性,将单站长期潮位观测转化为近岸流场快速预报能力。其三是 EMD 预处理对极值潮位预测的增强作用,为更复杂河口—潮汐耦合和中长期业务化预报奠定基础。
同时,论文也明确指出系统局限:FPOCH-ML 区域内长期观测站点数量有限,限制了更大范围场预报检验;ERA5 作为背景强迫在台风强度上存在低估,极端事件样本数量仍不足;目前系统仅在中国近岸特别是通州湾蓝沙洋航道区域完成验证,泛化能力尚需更多海区与更多风暴个例支持;物理模块尚未实现运行期自主学习和自适应调节,数值模式与机器学习、观测之间的全互操作性仍待加强;此外,尽管 ConvLSTM 提升了流场预报精度,但高维空间模拟的训练代价仍有进一步优化空间。
论文结论部分可译述如下:总之,FPOCH 成功展示了数字孪生技术在近岸水文与水动力预报中的应用潜力。通过无缝集成基于物理的数值模型与数据驱动的机器学习方法,该系统实现了近岸水动力场的快速而准确预测。此外,FPOCH 为极端事件模拟和高分辨率海岸带预报相关挑战提供了具成本效益的解决方案,显示出其在海岸管理业务应用与科学研究中的潜力。研究进一步强调,海流模拟精度天然受复杂边界条件制约,因此必须针对不同空间尺度、物理变量和下游应用选择合适的模型算法。在这一背景下,物理定律和经验关系的引入使得 FPOCHNS1 与 FPOCHNS2 这类基于物理的建模在数字孪生系统中不可或缺。FPOCH 正是通过集成多级嵌套与多过程耦合数值模式,提高了近岸水动力预测精度。未来,系统将进一步发展物理约束机器学习(physics-constrained ML)模型,优化预报流程,并改进 FPOCH-Data 存储架构,以提升数据库管理效率;同时,围绕南黄海等重点区域持续积累高质量观测与数值资料,并建设云集成平台,以支持分布式数据管理与实时应用。总体而言,这些发展将为海岸工程、灾害预警和海洋资源管理提供更强有力的技术支撑。