MKG-GNN:基于海洋知识图谱(Maritime Knowledge Graph)和图神经网络(Graph Neural Network, GNN)框架的港口船舶速度预测系统
《Ocean Engineering》:MKG-GNN:Maritime Knowledge Graph and GNN Framework for ship speed forecasting in port
编辑推荐:
船舶速度预测框架MKG-GNN通过Bi-LSTM填补AIS缺失数据,构建港口实体知识图谱并嵌入语义,结合改进GNN实现高精度预测,实验显示MAE较DLinear降低47.3%,较PatchTST降低55.6%,较传统LSTM降低83.1%。
Xinqiang Chen|Peiyang Wu|Zichuang Wang|Zhen Feng|Lijuan Luo|Han Zhang|Salvatore Antonio Biancardo
上海海事大学物流科学与工程学院,中国上海,201306
摘要
准确的船舶速度预测对于优化运营效率和确保复杂港口环境中的航行安全至关重要。目前的速度预测主要依赖于机器学习和深度学习方法。然而,这些方法通常存在语义上的空白,无法捕捉港口环境中的语义关联。我们提出了一种基于海事知识图(MKG)的图神经网络(GNN)船舶速度预测框架,该框架分为四个步骤实现。首先,该框架采用了一种创新的双向长短期记忆(Bi-LSTM)模型,这种模型可以作为一种独特的方式来填补自动识别系统(AIS)数据的缺失。其次,结合定义的核心关系对各种实体关系进行知识图建模。然后使用RotatE方法对建模后的知识图中的组合关系进行处理。最后,该框架将嵌入的知识图与改进的GNN模型集成在一起,以实现准确的港口船舶速度预测。广泛的评估表明,与DLinear和NLinear相比,在复杂操纵、停泊和离港的三种典型情况下,我们的框架平均绝对误差(MAE)降低了约47.3%。与先进的PatchTST方法相比,MAE指数提高了约55.6%。与传统的基于LSTM的时间预测方法相比,我们的方法在MAE方面提高了约83.1%。消融实验进一步证实,去除知识图模块会导致性能显著下降,这证明了其在捕捉复杂时空依赖性方面的关键作用。
引言
在全球贸易一体化的推动下,海上运输约占全球贸易总量的90%。因此,其安全性、效率和智能化已成为评估海上物流能力的关键标准(Qingmei等人,2021年)。港口是陆上和海上运输的重要节点。运输密度越高,航行环境就越复杂(Shi等人,2020年)。因此,准确预测船舶速度对于确保船舶航行安全、提高港口调度效率以及通过预测策略优化整体能源消耗具有重要意义(Li等人,2025年;Xiao等人,2026年;Ma等人,2021年),并促进智能船舶和自主导航技术的发展。它可以为船舶交通服务(VTS)提供可靠的交通状况预测,并对可能的拥堵和事故发出预警。此外,它还为导航员和AIS的研究和应用奠定了基础(Shin等人,2025年;Hashimoto等人,2022年;Li等人,2026年)。这是实现绿色航运和提高整体能源效率的重要技术进步。港口水域的航行受到多种复杂因素的影响,包括水文气象、水道限制和调度,这些因素表现出强烈的非线性和非平稳动态特性,给准确预测带来了巨大挑战(Hsu,2012年;Rakhsha等人,2021年)。
目前,船舶速度预测主要有两种方法:基于传统物理学的模型和数据驱动模型。基于物理学的模型主要通过流体力学和船舶运动学方程描述船舶的动力学,具有清晰的理论可解释性。这种模型在预测特定类型船舶的速度时可以结合路线和气象等物理因素(Liu等人,2025年)。在准确计算实际海况下船舶的阻力变化时,使用三种不同的方法数值模拟特定风浪条件下的额外阻力,然后估计由此产生的速度损失(Kim等人,2017年)。Holtrop-Mennen阻力模型也可以用来开发基于回流方法的效率性能分析模型,根据给定船舶的速度曲线计算船舶的阻力和功率需求(Hong等人,2024年)。然而,尽管这些基于物理的方法在机制分析和设计方面具有优势,但在大规模、实时预测方面存在局限性。如CFD模拟或经验公式计算等过程的高计算复杂性使得它们不适用于实时场景。这使得实现实时预测、调度和避碰变得困难。同时,物理模型所需的船舶自身几何参数、推进器等数据难以获得,这也限制了基于物理模型的应用。此外,物理模型的一个关键局限性在于它严格依赖于确定的船舶运行参数,如实时轴功率、螺旋桨转速(RPM)和特定发动机模式。在复杂的港口环境中,这些运行模式具有高度动态性,由导航员和驾驶员根据当地交通和水道限制进行实时决策。正如近期文献所强调的(Oh等人,2021年),航运公司和运营商很少披露此类敏感的运营数据,这使得相关参数对外部预测系统来说几乎是不可预测的。因此,当物理模型应用于缺乏连续机械输入的实际港口场景时,其预测可靠性会大大降低。相比之下,数据驱动模型为这个问题提供了实用的解决方案。通过挖掘大规模的历史轨迹数据,这些模型可以间接捕捉这些隐藏的运营因素。它们不需要依赖明确的发动机参数,而是通过统计方法(如实际加速度、减速度和停泊行为)捕捉人类操作和决策的最终运动结果,从而真实反映海上运营的实际规范,而无需依赖未公开的机械数据(Abebe等人,2020年)。第二种方法是数据驱动模型。以深度学习方法为代表的数据驱动模型主要从大量AIS数据中学习复杂的时空模式(Chen等人,2025a)。这类模型具有很强的非线性拟合能力,并在端到端预测准确性方面取得了重大突破。该领域已经从经典的循环神经网络(RNNs)和图卷积网络(GCNs)——这些网络可以捕捉多艘船舶的相互作用——发展到基于自注意力机制的主流Transformer架构(Chen,2026年;Zhao等人,2022年,2024年;Hao等人,2022年)。这些模型逐渐成为当前研究的主流。然而,无论是LSTM还是Transformer模型,它们本质上都是将输入序列映射到输出序列,缺乏对港口环境的理解。即使GNN模型可以将船舶建模为图中的节点,它也缺乏对海上运营的语义理解和知识。
为了解决这些挑战,我们提出了一种由海事知识图(MKG)增强的新型船舶速度预测框架。该框架将结构化的海事知识整合到模型中,以实现更准确的船舶速度预测。
相关工作
在过去十年中,船舶速度预测的范式已从传统的物理建模显著转向数据驱动方法。基于流体动力学(Hsu,2012年)和统计理论(例如ARIMA(Abebe等人,2022年)的传统物理模型虽然具有理论可解释性,但在复杂现实世界环境中往往计算成本高昂且受到参数不确定性的限制(Bassam等人,2022年)。随着全球AIS数据的增加,
概述
我们提出了一种名为MKG-GNN的新框架,其架构示意图如图1所示。该框架由四个主要部分组成:数据处理层、知识图构建层、知识图嵌入层和船舶速度预测层。首先,数据处理层作为基础,协调包括原始AIS轨迹、港口环境和环境变量在内的异构数据源。我们采用Bi-LSTM模型进行
结论
本研究提出了一种基于海事知识图的船舶速度预测框架MKG-GNN,旨在解决港口环境中船舶速度预测的关键挑战。通过构建知识图,将嵌入学习和图神经网络融合技术整合到一个统一的预测架构中。该框架取得了三个关键贡献。首先,引入知识图解决了传统时间模型的局限性
CRediT作者贡献声明
Xinqiang Chen:撰写——审阅与编辑、监督、形式分析、概念化。Peiyang Wu:撰写——初稿、可视化、验证、方法论、调查。Zichuang Wang:形式分析、概念化。Zhen Feng:数据管理、软件。Lijuan Luo:撰写——审阅与编辑、数据管理、概念化。Han Zhang:监督、软件。Salvatore Antonio Biancardo:监督、概念化。
利益冲突声明
作者声明他们没有已知的可能影响本文工作的财务利益或个人关系。
致谢
本工作得到了国家自然科学基金(编号:52472347、52331012、52071200)和国家航海技术与安全重点实验室开放基金的共同支持。