VT-EncNet:一种结合注意力机制的多模态卷积自编码器,用于血管轨迹表示和相似性计算

《TRANSPORTATION RESEARCH PART E-LOGISTICS AND TRANSPORTATION REVIEW》:VT-EncNet: A Multi-Modal convolutional autoencoder with attention for vessel trajectory representation and similarity computation

【字体: 时间:2026年04月08日 来源:TRANSPORTATION RESEARCH PART E-LOGISTICS AND TRANSPORTATION REVIEW 8.8

编辑推荐:

  船舶轨迹相似性计算在智能海事分析中至关重要,但传统方法受噪声和采样不规律影响显著。本文提出VT-EncNet框架,通过网格离散化将不规则轨迹转为四通道输入,双分支CNN分别提取空间结构和动态特征,结合交叉注意力机制融合多模态信息,最终压缩为低维向量实现高效相似性计算。实验表明该方法在奇亚娜海峡数据集上 Adjusted Rand Index达0.7955,显著优于传统距离 metric 和单模态深度学习模型,成功分离12类复杂交通流模式,并具备优异计算效率。

  
Xinyu Wang|Zhao Liu|Yang Chen|Mingyang Zhang|Wengang Mao
武汉理工大学导航学院,中国武汉

摘要

船舶轨迹相似性计算在海洋数据挖掘、交通安全控制和智能航运管理中具有重要意义。然而,现实世界的自动识别系统(AIS)数据受到噪声、不规则采样和高度多样化的航行行为的影响,这严重降低了传统点匹配或基于几何的相似性度量的性能。此外,现有的深度学习方法通常依赖于单一模态表示——要么将轨迹视为空间图像,要么视为时间序列——未能明确捕捉全局空间拓扑和局部运动动力学之间的互补耦合。为了解决这些限制,本文提出了船舶轨迹编码网络(VT-EncNet),这是一种用于鲁棒轨迹相似性计算的多模态卷积表示学习框架。该方法采用基于网格的离散化策略来构建整合位置、速度和航向的多通道输入。双分支架构利用2D和1D卷积神经网络(CNN)独立提取空间结构特征和动态运动属性。随后,交叉注意力机制明确融合这些空间和运动模态,通过自编码器将它们压缩成具有区分性的低维潜在向量。在琼州海峡的真实世界客船轨迹上的广泛实验证明了VT-EncNet的优越性。从定量上看,它在无监督聚类中实现了0.7955的先进调整Rand指数(ARI),成功地将复杂的、空间重叠的交通流分离为12个细粒度的行为模式。此外,该框架表现出卓越的可扩展性,在计算上显著加速了传统的穷举距离度量方法。这些发现突显了该模型在大型智能海洋交通管理中的强大模式识别能力和实际价值。

引言

作为全球贸易的核心载体,船舶轨迹数据是智能海事事务的基本资源(Zhao等人,2025年)。船舶轨迹数据包含丰富的时空信息,对智能航运、海事监督、航线优化和海事安全管理具有重要意义(Jiang等人,2024年)。随着自动识别系统(AIS)和卫星导航技术的广泛采用,全球每天生成数千万条船舶轨迹记录(Yu等人,2025年)。这些记录包含了船舶的实时位置、航向和速度等多维时空信息。这些数据不仅描述了船舶的动态过程(“从何处来,往何处去”),还揭示了航运网络的拓扑结构、船舶行为模式和海洋环境的相关特征。这些数据有助于全面了解船舶的移动性、航行意图和行为语义,从而为深入分析海上交通和船舶行为提供了宝贵的数据驱动基础(Yu等人,2024年)。
从复杂且庞大的船舶轨迹数据中提取有价值的见解已成为海事交通管理和智能分析领域的一个关键研究主题(Liu等人,2024a)。作为海事数据挖掘的核心任务之一,船舶轨迹相似性测量和聚类旨在通过挖掘轨迹之间的潜在相似性来辨别船舶群体的运动模式和行为规律(Liang等人,2021年;Zheng,2015年)。准确快速地测量船舶轨迹之间的相似性可以捕捉船舶之间的运动相关性,从而支持各种下游任务,如交通模式分析、行为识别和轨迹聚类。特别是在海事治理中,有效的轨迹相似性测量方法不仅有助于揭示船舶的群体行为和识别异常活动,还可以为分析历史交通模式、识别常规航线和支持战略海事管理提供坚实的基础(Luo和Zeng,2023年)。
然而,船舶轨迹数据本质上具有高维度、强时间依赖性和非线性演变的特点,这对相似性测量提出了重大挑战(Liang等人,2024年)。AIS数据的传输过程不可避免地受到信号干扰、网络延迟和设备故障等因素的影响。这导致采样间隔极不规则、噪声丰富以及轨迹长度不一致(Zhang和Li,2022年)。这些特点对传统的基于距离的相似性测量方法(如动态时间规整—DTW、Fréchet距离等)构成了严峻挑战。这些方法通常依赖于点对点匹配,使得计算成本高昂且对采样不一致性非常敏感。此外,它们主要关注几何接近性,忽略了速度和航向等关键动态特征,因此难以全面描述船舶行为的真实相似性(Ji等人,2025年;Shen等人,2022年)。
尽管深度序列模型(如循环神经网络(RNN)和Transformer)在时间建模方面表现出强大的能力,但将它们直接应用于原始AIS数据存在特定限制。首先,它们的建模范式主要将船舶轨迹视为一维时间信号,其中空间坐标和运动属性被嵌入到一个统一的序列中,并通过时间排序隐式学习空间关系。然而,船舶轨迹不仅仅是时间过程;它们本质上受到底层水道拓扑和航行走廊的约束,形成了随时间持续存在的结构化空间模式。其次,全局航线几何和局部运动演变对应于不同的信息结构层次。当轨迹仅表示为序列时,由于缺乏明确的机制来保持空间拓扑,共享相似空间路线的不同航行行为可能会相互混淆。未能区分这些层次限制了模型同时捕捉走廊级组织和细粒度行为变化的能力。因此,现有方法往往无法同时捕捉全局空间拓扑和船舶行为的细粒度动态演变,从而限制了它们在复杂海事治理任务(如识别高风险行为或优化港口交通组织)中的有效性。
为了解决这些挑战,本文提出了VT-EncNet,这是一种基于卷积自编码器的多模态轨迹表示学习框架。与传统的序列建模不同,我们的方法明确针对空间和运动特征的互补性。具体来说,船舶轨迹首先通过基于网格的栅格化方法进行处理。这种转换将不规则的时间序列转换为标准化的空间矩阵,从而对采样不规则性和局部噪声具有固有的鲁棒性。随后,采用双分支架构:2D-CNN提取全局空间拓扑和几何形状,而平行的1D-CNN专门捕捉速度和航向的动态演变。为了有效桥接这些异构模态,引入了交叉注意力机制来语义上对齐船舶的“位置”和“运动方式”。最后,通过自编码器将融合的特征压缩成低维潜在向量,从而实现高效的相似性计算和聚类。
总之,本文提出了一种创新的船舶轨迹相似性计算方法,并做出了以下贡献:
  1. 我们引入了VT-EncNet,这是一种基于卷积自编码器的轨迹表示方法。利用卷积神经网络在提取局部时空特征方面的优势,VT-EncNet有效地将高维时间特征(如位置、速度和航向)嵌入到紧凑的低维潜在空间中,从而捕捉轨迹演变的内在结构和动态特征。
  2. 设计了一个基于网格的轨迹离散化模块,将不规则采样的船舶轨迹数据转换为固定维度的四通道输入矩阵。该模块不仅增强了模型表示空间结构和航行状态的能力,还为深度学习模型提供了标准化的输入格式,提高了训练稳定性和泛化能力。
  3. 基于VT-EncNet,我们建立了一个完整的轨迹表示和相似性评估流程,包括特征提取、潜在表示生成和相似性计算等关键组件。该流程有效地揭示了船舶轨迹中的时空结构和语义信息,并通过聚类任务验证了所提出表示的区分能力和实际应用性。
  4. 在琼州海峡的真实世界船舶轨迹数据集上的广泛实验表明,VT-EncNet在轨迹相似性计算和聚类任务中显著优于现有的传统和深度学习基线方法,表现出更高的准确性、鲁棒性和泛化能力。
本文的其余部分组织如下:第2节回顾了船舶轨迹表示和相似性测量的相关工作。第3节详细介绍了提出的VT-EncNet方法,包括数据预处理、模型设计、特征融合、损失函数和训练。第4节展示了在琼州海峡数据集上的实验,比较了VT-EncNet在相似性测量和聚类方面的性能。第5节总结了本文并概述了行为建模和多模态融合的未来研究方向。

节选

船舶轨迹相似性计算方法

船舶轨迹相似性计算是海洋智能分析中的基础技术,是轨迹聚类、行为识别、异常检测和交通模式建模等任务的先决条件(Liang等人,2024a)。合理有效的相似性测量方法有助于挖掘船舶轨迹之间的内在联系,从而揭示潜在的群体行为模式和航行规律(Li等人,2020年)。

VT-EncNet框架概述

图1展示了VT-EncNet的总体框架,该框架由三个不同的阶段组成:轨迹表示学习、相似性计算和聚类分析。(1)在轨迹表示阶段,为了充分利用卷积神经网络在提取时空特征方面的能力,首先通过网格化过程对原始船舶轨迹数据进行处理,将不规则的轨迹序列

数据集描述和统计

为了评估VT-EncNet在处理真实世界海事复杂性方面的性能,本研究使用了从琼州海峡收集的AIS数据集,该水域以交通量巨大而闻名。该数据集特别关注客船,它们在航行模式上表现出独特的二元性:一方面,由于固定的时刻表和航线,它们表现出时空规律性;另一方面,它们表现出多维复杂性

讨论

第4节中提出的综合评估证实,VT-EncNet在轨迹相似性计算和聚类方面显著优于传统的距离度量和单模态深度学习基线。这种优越的性能主要由两项架构创新驱动。首先,与点对点距离度量(如DTW和Fréchet)不同,我们的基于网格的离散化有效地

CRediT作者贡献声明

Xinyu Wang:撰写——原始草稿、软件、方法论、概念化。Zhao Liu:监督、资源、项目管理、资金获取。Yang Chen:可视化、验证。Mingyang Zhang:验证、方法论、数据整理、概念化。Wengang Mao:监督、调查、概念化。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

本研究得到了国家自然科学基金(编号52571410、52171351)和国家重点研发计划(编号2024YFB4303600)的资助。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号