基于SAR的轻量级孪生U-Net与差分注意力机制的洪泛区制图

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Earth》：SAR-Based Flood Extent Mapping with a Lightweight Siamese U-Net and Differential Attention Mechanism

【字体：大中小】 时间：2026年06月09日 来源：Earth 3.4

编辑推荐：

　　洪水是全球最具灾难性的自然灾害之一，对生命和基础设施造成重大损害。因此，快速准确地评估淹没区域对于有效的应急响应至关重要。虽然光学遥感通常用于洪水评估，但在活跃洪水事件期间，由于持续的云层覆盖和降水，光学遥感常常失效。为解决此问题，本研究开发了一种利用合成孔径

洪水是全球最具灾难性的自然灾害之一，对生命和基础设施造成重大损害。因此，快速准确地评估淹没区域对于有效的应急响应至关重要。虽然光学遥感通常用于洪水评估，但在活跃洪水事件期间，由于持续的云层覆盖和降水，光学遥感常常失效。为解决此问题，本研究开发了一种利用合成孔径雷达（SAR）的深度学习方法，SAR具有全天候、24小时成像能力。具体而言，研究人员开发了一种基于注意力的差分孪生U-Net，用于检测洪水事件前后获取的双时相SAR影像（如Sentinel-1）中的时间变化。该方法在S1GFloods数据集上进行了评估，该数据集包含来自六大洲46次洪水事件的5360对双时相Sentinel-1 SAR影像对。实验结果显示，洪水交并比（IoU）为92.43%，F1得分为96.07%，召回率为97.64%。这些指标使所提出的方法在该数据集的顶尖方法中总体排名第三。值得注意的是，高召回率表明该模型特别有利于应急响应，因为它最小化了未被检测到的洪水区域数量。尽管采用的基础架构（基于CNN）比Vision Transformer模型简单，但该方法取得了与最先进的DAM-Net相当的结果，性能差异仅为0.77%。

**基于SAR的轻量级孪生U-Net与差分注意力机制的洪泛区制图研究解读**

**研究背景与问题**

洪水是全球最具破坏性的自然灾害之一，每年造成大量人员伤亡、基础设施损毁和经济损失。快速准确地绘制洪泛区范围对于应急响应协调、疏散规划、损害评估和灾后恢复至关重要。传统地面调查方法在洪水期间面临现场人员无法进入、风险高、覆盖范围有限且难以高频次更新数据等严重障碍。卫星遥感提供了大范围、高频次的监测手段，光学卫星（如Sentinel-2、Landsat）的多光谱影像适合水体边界识别，但洪水发生时往往伴随厚重云层，导致大量光学影像被云污染（研究表明高达80%），严重限制了其可用性。合成孔径雷达（SAR）作为主动微波传感系统，能够穿透云层、降雨和气溶胶，且不受太阳光照影响，具备全天候、昼夜成像能力，成为洪水监测的理想数据源。Sentinel-1任务（C波段SAR，10 m空间分辨率，6天重访周期）以其免费开放数据和系统化采集模式，被广泛应用于全球洪水监测服务（如哥白尼应急管理服务的全球洪水监测产品GFM）。

然而，基于SAR的洪泛区制图面临多项技术挑战：一是斑点噪声（speckle noise），由相干成像系统产生，造成影像“颗粒感”，干扰边界识别和阈值分割；二是某些地物（如光滑沥青、机场跑道、山地阴影、湿润裸土）的雷达后向散射与水体相似，导致虚警；三是城市地区洪水检测困难，因为街道与建筑物之间的二面角散射（dihedral scattering）使洪水区域在SAR影像中表现为更亮而非更暗，违背了“暗水”假设。深度学习技术通过学习洪水信号的复杂特征表示，能够区分真实洪水信号与噪声或混淆因素，已在SAR洪水检测中取得显著进展，但现有方法（如Vision Transformer ViT）虽精度高但复杂度和计算成本也高。

**研究内容与结论**

为解决上述问题，研究人员提出了一种结合差分注意力机制（Differential Attention）的轻量级孪生U-Net（Siamese U-Net）架构，用于双时相SAR影像的洪水变化检测。该方法利用变化检测范式，比较洪水事件前后影像对，识别新淹没区域同时抑制永久水体与虚假源。研究在S1GFloods数据集上进行评估，该数据集包含46次洪水事件、5360对双时相Sentinel-1 SAR影像对（来自六大洲，时间跨度2015–2022年），标签由半自动阈值（σ⁰ = –18 dB）结合专家修正生成。实验结果显示：洪水IoU为92.43%，背景IoU为96.13%，平均IoU为94.28%；F1得分为96.07%；召回率高达97.64%，表明模型对真实洪水区域高度敏感，最小化漏检，特别适合应急响应场景。在S1GFloods数据集现有方法的对比中，该方法总体排名第三，仅次于DAM-Net（差0.77%）和Siam-NestedUNet（差0.27%），但取得了最高的召回率。模型参数为34.0M，推理速度在单张A100 GPU上每幅影像（256×256）为15.34 ms（批处理可达1.33 ms/幅），满足实时操作需求。消融实验验证了差分注意力模块的有效性：相比简单拼接（91.68% IoU）和纯差减（90.48% IoU），该方法（92.43% IoU）分别提升0.75和1.95个百分点。该研究发表在《Earth》。

**关键技术与方法**

（1）**孪生编码器（Siamese Encoder）**：采用ImageNet预训练的ResNet34作为共享权重编码器，分别处理泛洪前后影像，提取五个尺度的特征图（通道数[64,64,128,256,512]），仅使用VV极化通道（单通道复制为三通道以匹配预训练输入）。（2）**差分注意力模块（Differential Attention Module）**：在每个编码层级计算双时相特征图的绝对差，并与泛洪后特征拼接，经卷积层和Sigmoid激活生成注意力权重，最后通过逐元素乘法得到加权的变化特征图，实现对洪水变化信号的强调和对噪声/伪变化的抑制。（3）**U-Net解码器（U-Net Decoder）**：采用转置卷积进行上采样，通过跳跃连接融合编码器低级空间信息与高级语义特征，最终输出二分类（背景/洪水）分割图。（4）**损失函数**：结合Dice损失（优化区域重叠）与Focal损失（关注难分类像素），权重各0.5。优化器采用AdamW，学习率调度为带热重启的余弦退火，训练82个epoch（最佳epoch 62）。数据增强包括水平/垂直翻转、随机90度旋转、高斯模糊和高斯噪声。训练在单块NVIDIA A100-SXM4-40GB GPU上使用混合精度（FP16）完成。数据集来自S1GFloods（Saleh et al., 2024），划分为3472对训练、1083对验证、805对测试（随机抽样，非事件独立划分）。

**研究结果**

**4.1 定量结果（Quantitative Results）**：在S1GFloods测试集上，模型洪水IoU为92.43%，背景IoU为96.13%，平均IoU为94.28%；精确率为94.55%，召回率为97.64%，F1为96.07%。逐样本平均洪水IoU为87.71%（95% CI: [86.76%, 88.60%]），平均F1为92.70%（95% CI: [91.98%, 93.45%]）。IoU与洪泛覆盖率的弱正相关表明，小洪泛区域样本的IoU较低。

**4.2 训练动态（Training Dynamics）**：训练82个epoch，最佳模型在epoch 62（最小验证损失）。验证IoU和F1均稳定在0.90以上，余弦退火学习率调度促进了收敛。

**4.3 与最先进方法比较（Comparison with State-of-the-Art Methods）**：该方法在S1GFloods上排名第三（洪水IoU 92.43%），仅低于DAM-Net（93.20%）和Siam-NestedUNet（92.70%）。但召回率（97.64%）最高，超过DAM-Net（95.60%）2.04个百分点。

**4.4 模型复杂度分析（Model Complexity Analysis）**：模型参数量34.0M（ResNet34编码器贡献主要部分），FLOPs为89.0G。单幅影像（256×256）推理时间15.34 ms（批处理1.33 ms/幅），可满足近实时操作。

**4.5 融合策略消融研究（Ablation Study on Fusion Strategy）**：对比拼接（Variant A, 91.68% IoU）、纯差减（Variant B, 90.48% IoU）和差分注意力（Variant C, 92.43% IoU）。差分注意力通过重新引入泛洪后特征补偿了纯差减丢失的绝对后向散射信息，性能最优。

**4.6 误差分析（Error Analysis）**：假阳性率高于假阴性率，表明模型偏向于检测洪水区域，这在应急响应中可接受（漏检成本更高）。

**4.7 定性分析（Qualitative Analysis）**：可视化结果显示模型能准确识别各类环境（乡村、城市、河流）下的洪水边界，误差图显示真阳性（绿色）、假阳性（红色）、假阴性（蓝色）。

**4.8 大规模操作演示（Large-Scale Operational Demonstration）**：在512×512全分辨率Sentinel-1影像上采用基于瓦片的推理（256×256窗口，64像素重叠，Hann窗融合）与直接全图推理结果一致，确认模型可处理任意大尺寸影像，单景Sentinel-1 IW场景（约25000×16500像素）可在单块A100上5分钟内处理完毕。

**讨论与结论**

**讨论**：局限性包括：（1）数据划分采用随机抽样而非按洪水事件地理分割，导致同一次洪水的样本可能分布在训练和测试集，引起空间自相关；（2）城市洪水检测中双弹跳散射使洪水区变亮，尽管注意力机制部分缓解，但未显式处理；（3）大卫星影像切块时边界处的洪水可能被分割，影响检测；（4）仅使用VV单极化通道，未利用VH极化互补信息。未来工作方向：（1）采用留一事件（leave-one-flood-out）的地理分割策略评估泛化能力；（2）融合Sentinel-2光学数据以增强复杂环境（如淹没植被、城市）的制图质量；（3）在S1GFloods数据集中大尺度案例（如内布拉斯加和伊朗）上进行大规模制图验证（参考F1分别为89.3%和87.2%）。

**结论（翻译原文）**：本研究提出了一种结合差分注意力的孪生U-Net架构，用于基于SAR的洪泛区制图。该方法在S1GFloods数据集上测试，获得洪水IoU为92.43%，F1得分为96.07%，召回率为97.64%。所提出方法的结果与其他顶尖方法相当（仅比DAM-Net基准低0.77%）。此外，与DAM-Net采用的Vision Transformer骨干相比，该方法使用了更基础的架构（CNN编码器）。该方法的高召回率证明了其在应急响应场景中的优异性能，这些场景强调检测所有洪水区域。差分注意力机制通过强调洪水引起的变化并抑制噪声和伪变化，提供了一种可解释的双时相洪水变化检测方式。总体而言，报告的指标表明该模型在识别洪泛区方面表现可靠，具有跨类别的强泛化能力和良好的精确率-召回率平衡。这些结果表明该分割方法非常适合实际部署于洪水监测和快速损害评估工作流。

联系信箱：

粤ICP备09063491号

热点排行