DPSSNet:一种双路径状态空间架构,用于解决高分辨率红树林制图中的上下文与细节之间的矛盾

《Expert Systems with Applications》:DPSSNet: a dual-path state space architecture for resolving the context-detail dilemma in high-resolution mangrove mapping

【字体: 时间:2026年04月28日 来源:Expert Systems with Applications 7.5

编辑推荐:

  王世库|陈永功|龚建洲|孟玲仪|吴梦泉|刘龙星|郭明斌|袁海伟 中国广州大学地理与遥感学院,广州510006 **摘要** 高分辨率红树林测绘面临着一个固有的挑战:如何在需要对全球范围进行建模以实现稳健的红树林与非红树林分类的需求与保留精确空间细节以准确划分边界的要

  王世库|陈永功|龚建洲|孟玲仪|吴梦泉|刘龙星|郭明斌|袁海伟 中国广州大学地理与遥感学院,广州510006 **摘要** 高分辨率红树林测绘面临着一个固有的挑战:如何在需要对全球范围进行建模以实现稳健的红树林与非红树林分类的需求与保留精确空间细节以准确划分边界的要求之间找到平衡。传统的单路径架构,如卷积神经网络(CNN)、视觉变换器(ViT)和视觉曼巴(ViM),在平衡这些相互冲突的要求时存在困难。我们提出了DPSSNet,这是一种创新的双向状态空间架构,通过双路径协作框架解决了上下文建模与细节保留之间的权衡问题。DPSSNet将特征提取分为两个专门且相互加强的分支:全局上下文路径(GCP)和空间细节上下文路径(SCP)。全局路径基于新设计的双曼巴块(Dual Mamba Block)构建,该块结合了频率感知扫描策略,以捕捉长期的全局依赖关系,并增强对结构和边缘信息的响应能力。空间路径保持高分辨率特征图,以提取细粒度的局部纹理特征。一个可学习的多尺度特征融合模块(Learnable Multi-Scale Feature Fusion Module)动态地聚合来自两个路径的多尺度特征,从而在语义完整性和空间精度之间实现最佳平衡。此外,我们整合了现有的红树林分布产品,结合了实地验证和像素级精细化的真实标注,构建了一个高精度的增强型红树林遥感基准数据集。在该数据集上进行的比较实验表明,DPSSNet的性能显著优于现有的CNN、ViT和ViM模型。视觉评估、消融研究和跨区域泛化评估进一步验证了其在边界保持和碎片化斑块检测方面的优势。这些结果共同确立了DPSSNet作为基于遥感的复杂红树林测绘任务的强大且可扩展的架构范式的地位。代码和数据可访问地址:https://github.com/WangShiK/DPSSNet **引言** 精确的红树林遥感测绘对于保护其生态功能至关重要,包括碳循环调节、海岸侵蚀控制和生物多样性维护(Maurya等人,2021年;Clüsener-Godt等人,2016年;Duke等人,2007年)。当前的测绘方法主要分为两类,每种方法都有其明显的优势和局限性。传统方法操作简单,不需要大规模的标注数据集,但它们严重依赖于专家定义的先验知识,仅提取低级别的光谱和纹理特征。在红树林与潮滩、潮沟和河口草本植被共存的复杂海岸环境中,这些方法常常导致分类错误,无法满足实际对准确性和效率的要求(Yang等人,2022年)。深度学习方法通过数据驱动的学习显著提高了特征提取能力,减少了对领域特定知识的依赖(Gao等人,2025年;Maurya等人,2021年)。特别是语义分割在划分红树林边界和量化冠层覆盖方面表现良好(Guo等人,2021年)。然而,高精度测绘仍受到两个核心挑战的限制。 第一个挑战是模型适应性的不足。尽管主流架构如CNN、ViT和ViM在遥感特征提取中得到广泛应用(Lv等人,2025年;Wang等人,2025年),但它们都无法有效适应红树林栖息地的独特特征(图1)。CNN模型受限于其局部感受野(Wu等人,2025年),往往无法捕捉红树林带的全局空间连续性,导致连续的红树林斑块被分割成散落的片段,以及沿潮沟分布的狭窄红树林带被频繁遗漏。ViT模型通过自注意力机制整合了全局信息,但常常丢失了重要的局部细节。红树林、潮沟和草本植被之间的边界变得模糊,模型难以区分冠层间隙和单个植物结构。ViM模型在局部和全局层面都面临限制,它们无法充分捕捉精细的植被纹理,也无法整合更广泛的分布模式,导致红树林与河口灌木丛之间的区分能力较差。从根本上说,这些架构无法平衡全局上下文和局部细节,也无法有效融合多尺度特征。因此,它们难以处理红树林所在的高度混合和空间复杂的潮间带环境。 第二个挑战是数据集支持的不足。常用的全球红树林分布图的空间分辨率为10米(Jia等人,2026年),只能提供粗略的空间模式,无法满足高精度测绘的要求,也无法作为深度学习模型的可靠训练参考。尽管Gaofen-2影像提供了米级空间分辨率(Wang等人,2023年),并在农业监测和城市规划中显示出有效性(Wang等人,2023年;Zhou等人,2025年),但专门用于红树林测绘的标注数据集仍然严重不足。缺乏仅包含红树林和背景类别的数据集直接限制了训练质量,限制了可实现的测绘精度。 为了解决上述两个主要技术挑战,本文介绍了双路径状态空间架构(DPSSNet)和一个米级分辨率的红树林基准数据集,为在高分辨率红树林测绘中平衡上下文信息和细节提供了基础解决方案。DPSSNet通过全局路径和局部路径的协调整合提高了模型的适应性。全局路径围绕双曼巴块(Dual Mamba Block,DMB)构建,该块结合了频率感知视觉曼巴(FAVMamba)和标准曼巴(Standard Mamba),有效捕捉红树林分布中的长期全局依赖关系,增强了结构感知能力,从而减少了误判和碎片化。局部路径保持高分辨率特征图,准确捕捉微纹理,减少了边界模糊。此外,一个可学习的多尺度特征融合模块(LMFFM)动态地整合来自两个路径的特征,实现了全局语义和局部细节之间的最佳平衡(图1(d))。所提出的米级分辨率基准数据集解决了高质量训练资源的短缺问题,为模型开发和评估提供了坚实的基础。本研究的主要贡献如下: 1. 我们提出了DPSSNet,这是一种专为高分辨率红树林测绘设计的双路径状态空间架构,通过紧密耦合全局语义和空间路径,解决了全局上下文建模与局部细节保留之间的固有权衡问题。 2. 我们设计了双曼巴块(DMB),将FAVMamba与标准曼巴结合,能够有效捕捉各向异性的长期全局依赖关系,同时保留对精确红树林测绘至关重要的细粒度空间表示。 3. 我们开发了一个可学习的多尺度特征融合模块(LMFFM),能够自适应地聚合层次化特征,从而显著提高了红树林提取任务中语义一致性和空间精度之间的平衡。 4. 我们构建了一个高精度、增强型的红树林遥感数据集。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号