基于边缘计算赋能的无人机图像拼接系统采用新型B-SIFT-ILS算法

《Algorithms》:An Edge Computing-Enabled UAV-Based Image Mosaicing System Using a Novel B-SIFT-ILS Algorithm

【字体: 时间:2026年06月19日 来源:Algorithms 2.1

编辑推荐:

  在基于无人机(UAV)的遥感中,准确高效的图像拼接对于实现实时监测至关重要。然而,传统的以云为中心的处理范式面临高延迟、带宽瓶颈和有限自主性等核心科学挑战,使其不足以应对动态实时场景。为解决这些问题,本文提出了一种边缘计算(Edge Computing)赋能的

  
在基于无人机(UAV)的遥感中,准确高效的图像拼接对于实现实时监测至关重要。然而,传统的以云为中心的处理范式面临高延迟、带宽瓶颈和有限自主性等核心科学挑战,使其不足以应对动态实时场景。为解决这些问题,本文提出了一种边缘计算(Edge Computing)赋能的无人机图像拼接系统。该系统由无人机遥感平台和边缘计算终端组成,核心是研究人员提出的新型B-SIFT-ILS算法。该算法首先使用地理坐标进行统一注册,构建高斯尺度空间(Gaussian Scale Space)以实现多分辨率表示,随后在差分高斯(Difference of Gaussian, DoG)空间中使用三维二次函数精确定位极值点。接着采用BANSAC(Bayesian Network for Adaptive Sample Consensus)算法精炼特征点并提取稳定的SIFT(Scale-Invariant Feature Transform)特征,最后使用迭代最小二乘(Iterative Least Squares, ILS)实现无缝拼接。实验结果表明,与经典RANSAC(Random Sample Consensus)相比,所提方法实现了更高的特征采样精度(旋转:0.879,平移:0.877)和更低的延迟。基于ILS的平滑阶段有效消除了噪声和鬼影,且未引入梯度反转,性能与深度学习方法相当,同时显著优于直接平均和高斯分布方法。在NVIDIA Jetson Orin NX边缘终端上,单个处理实例仅需1124毫秒,展示了其在实时、低延迟和自主拼接任务中的强大潜力。未来研究将侧重于将该方法扩展到非平面地形,并为BANSAC算法实现自适应参数调整。
**基于边缘计算赋能的无人机图像拼接系统:采用新型B-SIFT-ILS算法**
**论文解读**

**研究背景与科学问题**
在无人机(Unmanned Aerial Vehicle, UAV)遥感应用中,图像拼接是实现大面积连续场景重建与实时监测的关键技术。然而,传统以云为中心的处理模式面临三大科学挑战:第一,将海量原始图像数据传输至云端会带来巨大的带宽压力和存储成本;第二,边缘相机与云数据中心之间的往返延迟难以满足灾害响应、农业监测和自主导航等应用中毫秒级的实时性要求;第三,野外环境中网络连接不稳定甚至中断,使得依赖云的计算方案在实际部署中不可行。这些瓶颈限制了无人机遥感在动态、实时场景中的应用,因此迫切需要一种能够在资源受限的边缘终端上高效运行的图像拼接系统。针对上述问题,本研究提出了一种边缘计算(Edge Computing)赋能的无人机实时图像拼接框架,旨在同时实现高精度特征提取、低延迟处理和高质量无缝融合。该研究发表在《Algorithms》期刊上。

**研究内容与结论**
研究人员开发了一套完整的、面向边缘部署的无人机图像拼接系统,核心是提出的B-SIFT-ILS算法。该系统由无人机机载采集平台(含K510控制板和内置OV7725摄像头)和地面边缘计算终端(基于NVIDIA Jetson Orin NX处理器)组成。数据来自果园和玉米田的无人机航拍视频(飞行高度约25米,速度约1米/秒,帧率29帧/秒,分辨率1920×1080,每5帧提取1帧,共3500张图像,部分数据可从Zenodo公开获取)。实验结果表明:与经典RANSAC(Random Sample Consensus)相比,BANSAC(Bayesian Network for Adaptive Sample Consensus)在固定迭代次数下将旋转精度提升至0.879、平移精度提升至0.877,且运行时间更短;基于迭代最小二乘(Iterative Least Squares, ILS)的平滑方法在12次迭代内将目标函数能量降低72%,有效消除噪声和鬼影且无梯度反转,在信息熵、标准偏差、空间频率、平均梯度、信噪比和峰值信噪比等指标上优于直接平均和高斯分布方法,虽略逊于深度学习方法,但处理速度提高近3倍;完整流水线在NVIDIA Jetson Orin NX上每对图像仅需1124毫秒,满足亚2秒实时性需求。该研究成果表明,边缘原生拼接策略可实现在同一飞行任务中完成近实时决策,显著降低通信开销,对精确农业、森林边界测绘和灾害评估等低延迟遥感应用具有重要实践价值。

**关键技术方法(不超过250字)**
研究人员主要通过以下核心技术构建系统:(1)基于参考帧的单应性估计,采用归一化直接线性变换(Normalized Direct Linear Transformation, NDLT)减少几何畸变,并通过直接计算新图像与参考图像之间的单应性矩阵(Homography)避免误差累积;(2)改进的SIFT(Scale-Invariant Feature Transform)特征提取,首先利用地理坐标预对齐图像重叠区域,随后构建高斯尺度空间(Gaussian Scale Space)和差分高斯(Difference of Gaussian, DoG)空间,通过三维二次函数精确定位极值点;(3)BANSAC自适应采样算法,基于动态贝叶斯网络(Dynamic Bayesian Network)加权采样特征点,迭代更新内点概率以精炼匹配集,最终提取32维SIFT描述子;(4)迭代最小二乘(Iterative Least Squares, ILS)平滑算法,采用加性半二次最小化方法迭代优化目标函数,在固定正则化参数(λ=1.0)和范数幂(p=0.8)下实现快速全局能量下降。

**研究结果**
**3.1 重叠区域SIFT特征提取结果**
通过无人机实拍图像的SIFT特征提取实验,研究人员发现检测到的特征点主要聚集在图像重叠区域。为验证BANSAC(Bayesian Network for Adaptive Sample Consensus)的优越性,设计了固定迭代次数(0至10000次)的单应性估计对比实验。结果显示:BANSAC的最高旋转精度达到0.879,最高平移精度达到0.877,均优于RANSAC(Random Sample Consensus);在运行时间方面,BANSAC因无需遍历所有数据点更新得分而更快,且迭代次数越大优势越明显。经过4000次迭代后,更新概率约为0.087,成功实现了果园和玉米田图像的特征匹配与多帧拼接。

**3.2 基于ILS的图像平滑迭代结果分析**
为评估迭代最小二乘(Iterative Least Squares, ILS)的平滑有效性,研究人员分析了不同范数幂p(0.2, 0.5, 0.8, 1.0)和正则化参数λ(0.1, 0.5, 1.0, 5.0, 10.0)下目标函数能量的下降趋势。结果发现:当p和λ取值较大时,经过10次迭代(N=10)能量显著下降;特别地,当N=8时总能量降至初始值的21%~61%,当N=10、λ=1、p=0.8时能量降低72%,并在12次迭代后趋于稳定。因此后续实验固定迭代次数N=12,并设置λ=1.0、p=0.8以实现快速能量降低与最优边缘保持。

**3.3 不同平滑算法的对比分析**
为了验证ILS方法在遥感图像拼接中的优势,研究人员与直接平均(Direct Averaging, DA)、高斯分布(Gaussian Distribution, GD)以及基于U-Net架构的深度学习(Deep Learning, DL)基线进行了视觉和定量对比。视觉对比显示:DA方法存在明显光晕伪影且噪声去除效果差;GD方法过度平滑导致图像模糊;而ILS和DL方法均成功消除了噪声和车辆区域的鬼影,未见梯度反转或光晕现象。定量评价采用信息熵、标准偏差、空间频率、平均梯度、信噪比(Signal-to-Noise Ratio, SNR)和峰值信噪比(Peak Signal-to-Noise Ratio, PSNR)六项指标。ILS在全部六项指标上均优于DA和GD;与DL相比,ILS仅在标准偏差指标上稍逊,但PSNR和SNR接近。在NVIDIA Jetson Orin NX平台上的计算时间对比显示:B-SIFT-ILS总处理时间为1124毫秒,比B-SIFT-DA快约34%,比B-SIFT-GD快约54%,而B-SIFT-DL时间达到3165毫秒。这表明B-SIFT-ILS在拼接精度与计算效率之间取得了最优平衡,更适合资源受限的边缘部署。

**讨论与结论**
讨论部分总结:提出的B-SIFT-ILS系统在边缘设备上实现了1124毫秒的处理时间,满足亚2秒实时性要求,适用于作物健康评估、病虫害检测和灌溉管理等农业监测任务。BANSAC通过贝叶斯推理指导特征采样,将旋转和平移精度分别提升至0.879和0.877,优于传统RANSAC。ILS基于半二次正则化在12次迭代内实现72%能量下降,有效平滑拼接痕迹,尽管DL在PSNR略高,但处理时间接近3倍,凸显了在边缘场景中效率与质量的实用权衡。局限性包括:当前系统假设稳定飞行条件和平坦场景,在恶劣天气、低光照和非平面地形下未充分验证;BANSAC仍需手动参数配置。未来工作将聚焦自适应参数优化、多平面单应性估计、轻量级深度学习集成及更广泛环境下的验证。

研究结论部分翻译如下:以云为中心的无人机图像拼接由于通信延迟、带宽限制和网络依赖,对于实时现场应用仍然不切实际。为了解决这些限制,本文开发了一种基于边缘的无人机图像拼接系统,基于提出的B-SIFT-ILS算法,该算法在资源受限的边缘计算环境中集成了特征提取、单应性估计、图像配准和无缝图像融合。提出的框架在三个方面做出贡献:(1)基于BANSAC(Bayesian Network for Adaptive Sample Consensus)的特征精炼策略被整合到SIFT(Scale-Invariant Feature Transform)特征提取过程中,提高了无人机遥感影像特征匹配的鲁棒性。实验结果显示旋转精度为0.879,平移精度为0.877,优于传统RANSAC(Random Sample Consensus)方法。(2)开发了一种迭代最小二乘(Iterative Least Squares, ILS)平滑方法,实现了无缝图像融合。所提优化策略在12次迭代内将目标函数能量降低高达72%,同时有效抑制了鬼影伪影且未引入梯度反转。(3)完整的B-SIFT-ILS流水线成功部署在NVIDIA Jetson Orin NX边缘计算平台上,每对图像处理时间为1124毫秒。该延迟满足通常与实时无人机监测任务相关的亚2秒要求,并证明了直接在网络边缘执行图像拼接的可行性。结果进一步表明,所提框架在拼接质量与计算效率之间取得了有利平衡。尽管基于深度学习方法产生了略高的PSNR(Peak Signal-to-Noise Ratio)和SNR(Signal-to-Noise Ratio)值,但其显著更长的处理时间使其不太适合资源受限的边缘平台。相比之下,所提出的B-SIFT-ILS框架在保持实时部署所需低延迟的同时提供了有竞争力的图像质量。除了技术贡献外,所提系统对低延迟遥感应用具有实际价值,包括作物监测、森林边界测绘和灾害评估等。通过消除对云端处理的依赖,该框架减少了通信开销,并实现了同一飞行任务中的近实时航拍图像分析。此外,第2节中提供的可重复性协议以及算法描述和伪代码,为希望部署边缘原生图像拼接系统的研究人员和从业者提供了清晰的实施路径。仍然存在若干局限性:基于参考帧的单应性估计框架和BANSAC增强的特征匹配虽然对中等程度的图像漂移和飞行扰动具有鲁棒性,但该系统尚未在强风扰动、大幅姿态变化、恶劣天气条件或高度非平面地形下进行系统评估。此外,BANSAC目前需要手动参数配置。未来工作将聚焦自适应参数优化、IMU(Inertial Measurement Unit)辅助运动补偿、多平面单应性估计以及针对边缘计算平台优化的轻量级深度学习模型的集成。数据集和源代码将在最终发表前通过提供的存储库公开,以进一步支持可重复性和未来研究。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号