《Journal of Volcanology and Geothermal Research》:An efficient network with dual-path feature enhancement and dual-attention bottlenecks for spatial image steganalysis
编辑推荐:
DDE-Net提出了一种高效轻量级图像隐写分析网络,通过双路径特征增强模块和双注意力瓶颈模块在严格参数预算下实现检测性能提升,模型参数量仅为0.083M,较现有基线模型减少88.3%-71.6%。
邹伟平|李浩军|谢伟|黄志鹏|刘成奇
南昌大学数学与计算机科学学院,中国南昌学府路999号,330031
摘要
本文提出了一种高效轻量级网络,称为双路径双注意力高效网络(DDE-Net),用于在严格参数预算下进行图像隐写分析。DDE-Net结合了双路径多尺度特征提取和双注意力引导的精细化处理,以增强复杂纹理覆盖图像中隐写痕迹的表示能力。所提出的双路径特征增强模块(DP-FEM)通过两个并行分支捕获局部细节和上下文线索,并采用高效的基于连接的融合方法。双注意力瓶颈模块(DABM)使用深度可分离卷积作为高效瓶颈,随后进行顺序轻量级空间注意力和高效通道注意力以精细化特征。DDE-Net仅包含0.083百万个参数,与SiaStegNet、LWENet和TSNet相比,分别减少了88.3%、78.1%和71.6%的参数数量。实验结果表明,在相同的评估设置下,DDE-Net的性能优于这些代表性的轻量级基线模型,表明它在模型复杂性和隐写分析准确性之间取得了良好的平衡。
引言
隐写技术将隐藏信息嵌入到数字载体(如图像和音频)中,已被广泛用于机密通信和数字版权保护。然而,它也可能被用于秘密通信、未经授权的数据传输和信息泄露,对信息安全构成潜在威胁。作为对策,隐写分析旨在确定给定图像是否包含隐藏信息,其发展一直与隐写技术的演变保持同步。在各种媒体类型中,数字图像隐写分析是最广泛研究的方向之一。随着自适应隐写方案(如WOW [1]和S-UNIWARD [2])的广泛应用,嵌入修改与图像内容的关联日益增强,使得隐写痕迹变得更弱且更难以检测。
深度学习的最新进展显著提升了图像隐写分析的能力。代表性模型(如SRNet [3]和Zhu-Net [4])通过利用深度卷积特征提取和层次化表示学习提高了检测精度。然而,这些模型通常计算成本高且参数量大。例如,SRNet包含4.77百万个参数,这限制了其在内存、计算或延迟预算受限的应用场景中的适用性。在实际应用中,轻量级隐写分析特别适用于设备端检测、边缘侧图像筛查、嵌入式安全系统等资源受限的环境,其中高效的推理和紧凑的模型大小至关重要。因此,设计具有强大检测能力的轻量级隐写分析网络已成为一个重要的研究课题。
尽管已经报道了几种轻量级方法,但在严格模型复杂性约束下保持隐写分析性能仍然具有挑战性。例如,SiaStegNet [5]通过结构简化和参数共享减少了模型大小。然而,过于激进的轻量化设计往往削弱了对细微和空间分散的隐写伪迹的建模能力。当参数预算被压降到极低水平时,网络的特征表示能力可能会显著下降,从而导致明显的性能损失。在图像隐写分析中,这个问题尤为关键,因为目标信号本身就很弱,且容易被图像内容所掩盖。因此,在极低的参数预算下保持区分能力是轻量级隐写分析的核心问题。
更具体地说,现有的轻量级隐写分析方法仍存在明显局限性。大多数方法依赖于单路径架构,多尺度交互有限,难以同时捕获局部不规则性和更广泛的上下文线索。此外,尽管一些模型引入了注意力机制,但它们通常以相对浅层或孤立的方式应用,这不足以弥补在严格参数约束下的表示能力损失。
基于上述观察,仍存在三个挑战。首先,当主流模型被压缩或重新设计为极小的参数规模时,它们保持对弱隐写扰动的区分能力往往会受到损害。其次,特征提取架构的局限性仍然存在。传统的单路径卷积网络(即具有单一特征流和有限多尺度交互的顺序堆叠模型)受到固定感受野演化和单向特征传播的限制,难以同时捕获局部异常和更广泛的上下文线索。这一限制降低了它们对抗自适应隐写的有效性,因为自适应隐写中的嵌入变化高度依赖于内容且空间上非常微妙。第三,轻量化设计与检测精度之间存在根本性的权衡。在许多现有的轻量级方法中,参数减少伴随着表示多样性的降低和特征精化的减弱,虽然提高了效率,但并未完全保持检测性能。
为了解决这些问题,本文提出了一种用于空间图像隐写分析的高效轻量级网络DDE-Net,它在严格的参数预算下整合了双路径特征增强和双注意力瓶颈。该设计旨在在保持紧凑模型复杂性的同时,提高弱隐写痕迹的表示能力。具体而言,引入了双路径特征提取策略来同时捕获局部细节和上下文信息,并使用轻量级注意力引导的瓶颈以最小的额外成本精细化信息特征响应。通过这种方式,DDE-Net有助于减轻模型规模缩小到极紧凑程度时常见的性能下降。
本文的主要贡献总结如下:
(1) 提出了双路径特征增强模块(DP-FEM)。DP-FEM采用两个并行特征提取分支以及残差连接,使网络能够同时捕获局部不规则性和更广泛的上下文信息。在有限的参数开销下,它增强了多尺度特征交互,并在一定程度上缓解了传统单路径架构的感受野限制。
(2) 设计了双注意力瓶颈模块(DABM)。通过顺序集成深度可分离卷积与空间注意力和通道注意力,DABM在保持低计算复杂性的同时,提高了与隐写扰动相关的特征精细化能力。
(3) 通过DP-FEM和DABM的协同作用,所提出的DDE-Net在模型紧凑性和检测能力之间取得了良好的平衡,为在严格资源约束下的空间图像隐写分析提供了轻量级解决方案。
本文的其余部分组织如下。第2节回顾相关工作。第3节详细介绍了所提出的模型。第4节展示了在代表性自适应隐写算法和不同负载设置下的实验结果。第5节总结了本文并讨论了局限性和未来研究方向。
相关工作
相关工作
图像隐写技术通过将信息嵌入到数字载体(如图像)中实现秘密通信,而图像隐写分析作为其对策,旨在检测给定载体中的隐藏信息。这两项任务通过持续的对抗性互动不断发展,共同构成了多媒体安全领域的一个重要研究方向。
早期的图像隐写分析主要依赖于手工制作的特征提取,检测模型基于图像处理构建
概述
本文提出了一种用于图像隐写分析的轻量级双路径双注意力高效网络(DDE-Net)。DDE-Net遵循一个包含预处理、浅层特征提取、深度特征优化和分类的四阶段流程(图1)。在浅层特征提取阶段,使用双路径特征增强模块(DP-FEM)实现高效的多尺度表示和特征交互。深度特征优化阶段建立在双
实验设置
用于训练和评估的主要数据集是BOSSBase 1.01,其中包含10,000张自然灰度图像,在图像隐写分析研究中广泛使用。为了统一输入大小并遵循常见协议,所有图像在输入网络之前都使用双线性插值缩放到256 × 256
。
使用了三种代表性的自适应空间域隐写算法,即WOW [1]、S-UNIWARD [2]和MiPOD [34],在0.1的负载下生成隐写图像
结论
为了解决现有基于深度学习的隐写分析方法的高复杂性和有限效率问题,本文提出了一种轻量级双路径双注意力高效网络(DDE-Net)。DDE-Net的核心架构由双路径特征增强模块(DP-FEM)和双注意力瓶颈模块(DABM)组成。通过结合并行多尺度特征增强和双注意力瓶颈精细化,DDE-Net提高了对弱隐写信息的区分能力
CRediT作者贡献声明
邹伟平: 写作 – 审稿与编辑、可视化、资源管理、调查、数据整理、概念化。李浩军: 写作 – 原始草稿、可视化、验证、方法论、调查、形式分析。谢伟: 验证、调查、数据整理。黄志鹏: 验证、调查、数据整理。刘成奇: 监督、项目管理。
资助
本工作得到了温州理工学院机构研究基金(人才引进研究启动计划)的支持,资助编号为RC202604。
代码可用性
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。