为遥感图像生成文本描述

《IEEE Access》:Generating Textual Descriptions for Remote Sensing Images

【字体: 时间:2026年05月28日 来源:IEEE Access 3.6

编辑推荐:

  ``` 摘要:为遥感图像生成描述性且具有语义意义的标题是一项具有挑战性的任务,因为空中场景本身具有复杂性,表现为多样的空间排列、Scale变化以及模糊的语义。为应对这些挑战,本研究提出了一个混合深度学习框架,该框架整合了卷积神经网络(CNN)、transformer编码器和长短

  ```

摘要:

为遥感图像生成描述性且具有语义意义的标题是一项具有挑战性的任务,因为空中场景本身具有复杂性,表现为多样的空间排列、Scale变化以及模糊的语义。为应对这些挑战,本研究提出了一个混合深度学习框架,该框架整合了卷积神经网络(CNN)、transformer编码器和长短期记忆(LSTM)解码器。在所提出的架构中,使用ResNet50提取层次化视觉特征,而Transformer编码器则建模长距离空间依赖性和全局上下文关系。通过融合机制对这些特征表示进行优化,随后由基于LSTM的解码器生成连贯且具有上下文意识的文本描述。该方法的有效性通过在UCM和RSICD等基准遥感数据集上进行了评估。实验结果表明,该模型取得了有竞争力的性能,BLEU-4分数分别为0.74和0.54,CIDEr分数分别为3.32和3.49。这些发现证明了所提框架能够为复杂的航空图像生成准确且与上下文相关的标题。本研究强调了混合架构在提高自动化遥感图像理解和标题生成方面的潜力。
```
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号