基于掩码感知与边缘学习变换器的斜拉索帧级重建与振动频率识别

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Engineering Applications of Artificial Intelligence》：Frame-level reconstruction and vibration frequency identification of stay cables using mask-aware and edge-learning transformer

【字体：大中小】 时间：2026年06月18日 来源：Engineering Applications of Artificial Intelligence 8

编辑推荐：

　　黄永辉|詹从伟|余汉国|袁成|李远文中国广州，广州大学风工程与工程振动研究中心摘要桥梁斜拉索的索力状态与结构安全及施工控制密切相关。尽管基于视觉的非接触式方法为传统的接触式测量提供了有希望的替代方案，但现有的视频技术仍存在时间跟踪不连续、位移观测缺失以及在复杂

　　黄永辉|詹从伟|余汉国|袁成|李远文
中国广州，广州大学风工程与工程振动研究中心

摘要
桥梁斜拉索的索力状态与结构安全及施工控制密切相关。尽管基于视觉的非接触式方法为传统的接触式测量提供了有希望的替代方案，但现有的视频技术仍存在时间跟踪不连续、位移观测缺失以及在复杂背景和动态光照条件下主频识别不稳定等问题。本研究提出了一种用于斜拉索振动识别与索力估算的集成非接触式框架。该框架采用基于U-Net的线条结构检测模型提取索线特征，基于匈牙利算法的时空关联策略获取连续的位移序列，再通过基于掩码和边缘学习的Transformer模型修复缺失或受干扰的位移观测数据。随后利用重构得到的位移时序数据进行主频识别与索力估算。该框架通过桥模试验以及洪岐沥水道铁路公路两用桥的现场试验得到了验证。结果表明，该方法提升了位移的连续性，抑制了异常波动，并增强了低阶频率识别的稳定性。在桥模试验中，基于视觉与基于加速度的索力估算结果的平均相对误差和最大相对误差分别不超过1.260%和3.067%；在现场试验中，相应的平均相对误差和最大相对误差分别为1.263%-1.850%和2.157%-3.245%，充分体现了该方法在非接触式斜拉索监测中的应用潜力。

引言
作为大跨度桥梁的关键承重构件，斜拉索直接影响结构的性能、线形控制及使用安全，因此对索力进行监测具有重要意义（Ko等人，2026；Sun等人，2026；Zhao等人，2022）。现有的索力监测方法大致可分为接触式与非接触式两类（Lu等人，2024）。接触式方法主要包括液压千斤顶法、磁通量法、应变法、光纤传感以及基于振动频率的方法。然而，液压千斤顶法主要适用于施工阶段（Cho等人，2013），磁通量法易受磁场干扰（Duan等人，2016），而应变法和光纤传感技术虽然精度较高，但安装复杂、维护成本高，且长期稳定性不足（Nguyen和Kim，2012；Yao等人，2021；Kim等人，2015；Zheng等人，2018）。尽管基于振动频率的方法应用广泛，但它仍依赖接触式传感器，且易受边界条件不确定性和环境干扰的影响（Zhang等人，2016；Stromquist-LeVoir等人，2018；Qin等人，2022）。

为克服这些局限性，非接触式索力监测越来越受到重视（Liu等人，2024；Yanhao等人，2025）。早期的非接触式方法主要依靠微波雷达、激光雷达等设备（Che等人，2024；Lin等人，2024），但其应用受到高昂成本和较差抗干扰能力的限制。随着计算机视觉的快速发展，基于视频的非接触式索力识别方法因成本低、部署方便，且能够实现远距离多目标同步监测，成为一种有前景的替代方案。现有研究主要采用光流法、基于特征点的方法、边缘检测以及区域匹配技术（Chen等人，2015；Feng等人，2017；Xu等人，2018；Ma等人，2022；Lucas和Kanade，1981；Tomasi和Kanade，1991；Belongie等人，2002；Corona等人，2023；Zhan等人，2026）。然而，在复杂的环境条件下，这些方法极易受到光照变化、遮挡、曝光波动和噪声的影响，从而导致数据漂移、突变以及累积误差。此外，由于斜拉索表面纹理较弱、边界平滑，基于特征点的方法往往无法提取稳定特征，进而限制了其在远距离无目标条件下的长期监测应用。

考虑到斜拉索作为细长线状结构的几何特性，近年来人们越来越关注基于线条检测的视觉测量方法。Jiang等人（2020）将改进后的线条检测算法应用于架空接触线的动态位移识别。Tian等人（2021）提出了一种结合线条检测与刚体位移补偿的无人机方法，用于索力识别。Luo等人（2024）则将基于相位的运动放大技术与线条跟踪相结合，无需人工标记即可实现微振动增强与频率提取。尽管基于线条检测的方法在提取索振信息方面具有一定优势，但传统的线条段检测器、霍夫变换以及边缘绘制线等方法仍对图像质量、噪声水平及环境变化敏感，因此在风致干扰、光照变化、雨雾干扰以及复杂背景条件下稳定性较差。而且，这些方法大多仅关注单帧检测，缺乏时间一致性约束，难以直接获得稳定连续的位移序列。

近年来，深度学习的发展为在复杂场景中检测线状目标提供了新的技术途径。Tran等人（2024）提出了线条段网络2.0版本（LSNetv2），通过引入二分匹配机制提升了复杂背景中细长线条检测的准确性与稳定性。Du等人（2024）将Swin Transformer与LaneNet相结合，开发出了ST-LaneNet。Wang等人（2024）和Ma等人（2021）分别从语义分割和增强分割模型的角度，进一步提高了复杂环境中线状结构的识别精度。Zhang等人（2026）针对复杂背景下电力线等细长且纹理较弱的目标检测问题，提出了一种融合形状感知表示与特征增强的检测网络，从而提升了线状结构的提取性能。这些研究表明，基于深度学习的线条检测在静态任务中表现良好，但在桥梁斜拉索振动识别方面仍面临若干关键挑战。首先，由于画面丢失、帧率不足以及曝光不同步，提取的位移序列往往存在不连续性和缺失段，进而影响频率识别的准确性。其次，大多数现有模型仅为单帧推理设计，缺乏有效的时空关联机制，导致相邻帧容易出现端点抖动、漂移以及目标线条跟踪混乱。第三，深度网络通常缺乏明确的几何和时间约束，难以在斜拉索振动监测中保持稳定的位移轨迹和时间一致性。

为提升基于深度学习的线条检测在视频振动识别中的应用能力，仍需对输出序列进行时间补全与重构。近年来，视频帧插值和时间序列重构方面的进展为此提供了新思路。Zhang等人（2023）提出了一种基于帧间注意力机制的运动与外观特征提取方法，实现了高效的视频帧插值。该方法通过捕捉连续帧之间的运动信息和视觉特征，提升了精细动态结构的插值精度，为视频分析及结构动态监测提供了有力支持。Jin等人（2023）开发了一种统一的金字塔递归网络用于视频帧插值，通过在不同尺度上递归建模连续帧间的运动信息，提升了插值精度与计算效率。Du等人（2023）提出了基于自注意力的时间序列插补方法（SAITS），该方法能有效捕捉长期依赖关系，提高不完整序列的重构精度。Chowdhury等人（2022）介绍了任务感知重构网络（TARNet），这是一种能够根据不同任务自适应恢复序列信息的任务感知型时间序列重构框架，提升了时间序列预测与分析的准确性。Wu等人（2021）提出了Autoformer，这是一种用于长期预测的Transformer模型，通过结合渐进分解机制与自相关模块，有效捕捉周期性与时序趋势成分，从而提升了长序列预测的稳定性与准确性。Yu等人（2024）开发了Robformer，这是一种基于稳健分解的长时间序列预测方法，通过分解时间信号并建模长期依赖关系，提升了长时序预测的精度。Nie等人（2023a）提出了一种将时间数据映射为固定长度表示向量的长期时间序列预测方法，便于对长序列进行高效建模与预测，为时间序列分析及结构健康监测提供了有益启示。

上述研究为视频插值、时间序列插补以及长序列预测提供了有益参考。但从工程监测的角度来看，仅仅提升重构精度是不够的，物理一致性、可靠性以及置信度评估对于获得可信的结构响应信息同样重要。因此，近期关于人工智能在工程应用中的研究越来越重视在结构健康监测与振动分析中采用基于物理原理且具备不确定性意识的建模方法。例如，通过将控制微分方程嵌入网络训练过程，物理信息神经网络已被应用于梁体振动模拟与动力参数识别（S?yleyici等人，2025）。物理信息机器学习也被用于结构部件的近实时应力预测，展现出其在面向数字孪生的结构监测中的潜力（Zhu等人，2025）。此外，基于贝叶斯学习与不确定性量化策略的不确定性意识神经网络方法也被用于在数据不确定条件下为工程预测提供置信度信息（Fernández等人，2022）。

在此背景下，现有的基于视频的测量方法仍难以满足在复杂环境条件下对桥梁斜拉索进行高稳定性动态响应分析的需求，尤其是在位移时序的连续重构、异常跳变的抑制以及主频的精准识别方面。需要指出的是，在复杂条件下视觉位移序列的缺陷并不总表现为频率识别完全失败。对于局部质量较好的视频片段，原始序列可能仍能保留主要的振动信息。但从工程监测的角度而言，基于视觉的测量方法不仅应当具备可识别性，还必须在多个时间周期、测量点以及长期观测中保持连续性、稳定性与一致性。因此，对于局部缺失数据、异常跳变以及噪声污染所导致的时间重构，不应仅仅视为对无效数据的被动补救，而应视为提升基于视觉的测量方法在复杂环境条件下的稳健性及工程适用性的关键步骤。

总之，本研究通过构建一个集成线条检测、时空轨迹跟踪、位移序列重构、频率识别与索力估算的框架，解决了复杂环境条件下斜拉索监测中视觉检测不稳定、时间跟踪不连续以及位移信号缺失等问题。该框架结合了深度视觉感知、时空关联机制以及基于掩码和边缘学习的Transformer重构模型，实现了斜拉索的主振动频率识别与索力估算，为在复杂环境条件下对桥梁斜拉索进行非接触式测量提供了一种新的技术途径。

方法论
为解决复杂环境条件下桥梁斜拉索视觉识别不稳定、时间检测不连续以及位移信号缺失等问题，本研究基于MAELT开发了一种基于帧级重构的斜拉索振动识别方法。该框架由三个主要部分组成：基于深度视觉感知的U-Net线条结构检测模型（ULSD）、基于匈牙利算法的时空轨迹跟踪，以及……

实验设备
图像采集采用尼康D3500相机，加速度数据采集则使用京明无线加速度测量系统（JM5843A）。相应的软件用于数据的初步处理与提取。具体设备型号与参数详见表1。

数据集构建与样本准备
为训练斜拉索视觉检测模型，本研究基于桥梁斜拉索的振动测试视频构建了训练数据集。原始数据主要来自……

测试概况与目标
为进一步验证所提方法在实际桥梁中的适用性与稳定性，本研究以深圳至江门铁路上的洪岐沥水道铁路公路两用桥作为工程对象。开展了斜拉索振动监测与索力识别的现场试验，并将该方法应用于施工阶段的监测工作。洪岐沥水道铁路公路两用桥是一座铁路公路两用双层斜拉桥，其……

结论
本研究通过结合线条结构检测、时空关联以及基于MAELT的位移重构技术，提出了一种用于斜拉索振动识别与索力估算的集成视觉框架。该框架通过桥模试验以及洪岐沥水道铁路公路两用桥的现场监测得到了验证，测试涵盖了不同的背景条件、自然光照变化以及真实的桥梁施工场景。主要……

关于手稿格式与图表质量的说明
本手稿采用Microsoft Word编写与排版。由于未使用LaTeX进行准备或排版，故未提供相应的LaTeX源文件。所有正文、公式、表格及参考文献均整合在同一个Word文档中，以此确保结构清晰、格式统一，便于审核、修改和最终输出。我们已对所有图表的质量进行了严格检查，以保证其清晰度。照片、流程图以及线条检测结果均已插入文档中。

CRediT作者贡献声明：
黄永辉：概念设计、监督、写作——审稿与编辑。
詹从伟：方法论、软件、写作——初稿撰写。
余汉国：概念设计、资源获取、验证。
袁成：数据整理、研究工作、写作——审稿与编辑。
李远文：数据整理、资源获取。

利益冲突声明：
作者们声明不存在任何可能影响本文研究结果的已知财务利益或个人关系。

致谢：
本项工作得到了广州市工程集团有限公司的科技规划项目（项目编号2024-SZKJ03）以及“111计划”（项目编号D21021）的财政支持。

联系信箱：

粤ICP备09063491号

热点排行