《Engineering Applications of Artificial Intelligence》:A hierarchical domain adaptive explainable vulnerability detection scheme for power systems based on dynamic slicing enhancement
编辑推荐:
针对电力系统代码漏洞检测中存在的领域偏移、语义碎片化和解释性不足问题,本文提出HDAvul框架,通过动态切片机制增强语义完整性,采用节点-切片-图三层次对抗学习进行多粒度领域适应,并集成可解释性模块自动生成漏洞触发路径。实验表明其在真实电力系统数据集上F1值达85.2%,解释稳定性达89.0%,显著优于基线方法。
Fangfang Dang|Jiyu Zhang|Kehe Wu|Shuai Li|Ying Zhu
华北电力大学控制与计算机工程系,北京,102206,中国
摘要
使用图神经网络进行自动化漏洞检测展现了巨大的潜力,然而在通用源代码上训练的模型在应用于专门的电力系统代码时,由于严重的领域差异,常常会出现较高的误报率。为了弥合这一差距,本文提出了一种新颖的层次化领域自适应和可解释的漏洞检测框架(HDAvul),该框架专为电力系统设计,其核心创新在于三个关键组成部分。首先,引入了一种动态切片机制,并增强了与电力相关的语义边,以适应性地捕获漏洞的完整功能上下文,从而克服了传统固定窗口方法固有的语义碎片化问题。其次,开发了一个层次化领域适应模块,采用多粒度对抗学习在节点、切片和图三个层面上同时对齐特征分布,确保在知识转移过程中保持复杂的结构逻辑。第三,集成了一种透明解释模块,能够自动生成触发漏洞的结构路径(VTP),为安全关键环境中的专家验证提供可追溯的证据。在真实世界的电力系统项目上的实验结果表明,HDAvul的F1分数峰值达到了85.2%,优于现有的无领域和单层适应基线模型,并且具有89.0%的优异解释稳定性,证明了其在保护关键任务电力基础设施方面的可靠性和高保真分析能力。
引言
将数字控制系统和信息技术整合到关键基础设施中,从根本上将传统电网转变为高度互联的智能网络,通常称为智能电网(Mitra等人,2024年)。这种数字化实现了前所未有的效率和可再生能源的整合,但同时也为物理基础设施引入了显著且不断扩大的网络威胁(Mohanty等人,2023年)。在管理电力生成、传输和分配的工业控制系统(ICS)和运营技术(OT)中的软件漏洞代表了切实存在的即时威胁。2015年对乌克兰电网的网络攻击清楚地展示了这一点,该攻击表明利用软件漏洞使对手能够远程操控工业控制系统,导致数十万人遭受停电(Presekal等人,2025年)。除了历史先例之外,随着电网架构的演变,安全性的紧迫性进一步加剧。特别是,去中心化架构(如孤岛式微电网)的迅速普及,要求对控制分布式发电和负荷削减的逻辑进行严格的安全防护,以防止协调失败(Cai等人,2023年;Tan等人,2025年)。此外,实现复杂故障诊断分析的代码的完整性同样至关重要,因为这些算法中的漏洞可能会掩盖物理退化或触发误报(Wang等人,2025年;Mishra等人,2025年)。因此,自动化和准确的漏洞检测已成为国家安全和能源韧性的关键目标。
为了解决这个问题,研究人员将大量注意力集中在深度学习(DL)在自动化漏洞检测方面的应用上,并取得了显著的成功(Xu等人,2025年)。例如Devign(Zhou等人,1909年)和ReVeal(Chakraborty等人,2022年)等模型,在庞大的开源软件(OSS)仓库上训练,展示了从代码属性图(CPGs)中学习通用模式的强大能力。然而,这些基于图的模型经常遇到可扩展性问题,并且通常将代码视为通用图,忽略了嵌入在关键控制操作中的电力特定语义依赖性。此外,像SySeVR(Li等人,2022年)和IVDetect(Li等人a)这样的框架引入了基于序列和子图的方法来进一步提高检测粒度。尽管这些方法具有很高的精度,但它们通常严重依赖于预定义的固定切片规则,缺乏适应电力系统独特的长距离、复杂控制逻辑的灵活性,从而无法保持漏洞的语义完整性。为了减轻通用代码和专门电力系统代码之间的“领域差异”造成的性能下降(Jiang等人,2025年),提出了领域适应(DA)技术,如CPVD(Zhang等人,2023年)、CDAN(Nguyen等人,2019年)和CD-VulD(Liu等人,2022年)。虽然这些DA方法通过对抗学习帮助减少了分布差距,但它们通常侧重于全局的、单层特征对齐(例如,功能层),无法捕捉定义关键任务电力操作的层次化结构细节。此外,现有的可解释检测方法通常仅提供粗略的基于注意力的“热图”,无法生成安全关键电力环境中风险评估所需的结构化、可追溯的证据。
尽管取得了这些进展,现有的漏洞检测方案在应用于高度专业化和安全关键的电力系统环境时仍面临三个关键挑战。首先,现有方案缺乏多粒度语义对齐。现有的DA方法通常在单一的、粗略的粒度上操作——例如功能级特征向量——无法捕捉电力系统漏洞经常隐藏的细粒度结构细节和功能子结构。因此,这种粗略的对齐不可避免地在传输过程中导致领域特定语义信息的重大损失,从而在目标电力领域导致检测准确性不佳。其次,标准预处理方法(如固定窗口切片(Li等人,2024a)通过以固定长度截断代码段来损害数据表示的语义完整性。这种碎片化限制了模型的感知范围,使其无法识别跨越多个不连续代码块的复杂漏洞。最后,在安全关键环境中仍然存在重大的信任差距,因为大多数DL模型作为“黑盒”仅提供二进制预测,而现有的可解释工具(如基于注意力的热图(Mao等人,2025年)仍然过于模糊,无法提供进行根本原因诊断和人类验证所需的结构化、可追溯的证据。如果没有具体的漏洞传播路径,电力安全操作和维护人员无法有效地优先处理修复工作,可能导致关键任务基础设施长时间暴露于被利用的漏洞中。
为了解决这些多方面的挑战,本文提出了一种专为电力系统设计的新层次化领域自适应漏洞检测框架(HDAvul)。HDAvul通过多粒度对抗学习策略在三个不同层面对齐特征:节点级(单个语法元素)、切片级(与特定操作相关的语义连贯代码子集,称为切片)和图级(程序的整个功能逻辑)。为了确保数据完整性,它采用了一种增强了与电力相关的语义边的动态切片机制,以捕获漏洞的完整功能上下文,从而避免了静态方法中常见的关键逻辑丢失。最后,该框架通过引入一个透明解释模块来解决信任差距,该模块自动生成触发漏洞的路径(VTP)——一种逐步的代码执行结构,追踪潜在缺陷如何从初始输入传播到系统故障,为专家验证提供了精确的基础。
本工作的主要贡献总结如下:
- 1)
提出了HDAvul框架,这是一个新颖的端到端解决方案,集成了电力特定语义、层次化领域适应性和结构可解释性,用于专门电力系统代码中的漏洞检测。
- 2)
引入了一种动态切片机制,该机制基于电力关键节点的识别,并适应性地捕获漏洞的完整语义上下文,显示出其优于传统固定窗口方法的优越性。
- 3)
设计了一种层次化领域适应策略,在节点、切片和图三个层面同时对齐特征分布。这种多粒度方法在减轻领域差异方面明显优于单层适应基线。
- 4)
开发了一种新颖的解释模块,能够自动生成完整的VTP,提供结构和可追溯的证据。这些基于路径的解释的质量使用定量VTP中心指标与现有可解释方法进行了严格评估。
- 5)
在精心挑选的真实世界电力系统项目数据集(GridLAB-D(GridLAB-,2023年),OpenDSS(OpenSSD,2025年),libIEC61850(libIEC61850,2025年)上进行了广泛实验,结果表明HDAvul在检测准确性方面显著优于无领域和标准领域适应的现有技术模型,并提供了更可靠的解释。
本文的其余部分组织如下。第二节回顾了漏洞检测和领域适应的相关工作。第三节详细介绍了HDAvul框架。第四节提出了全面的实验评估和结果分析。最后,第五节总结了本文。
部分摘录
基于DL的漏洞检测
最初的研究工作集中在传统的静态分析方法上,这些方法依赖于预定义的规则和模式匹配(Huang等人,2024年;Li等人,2024b)。虽然这些方法在识别已知漏洞和简单代码缺陷方面非常有效,但它们通常受到高误报率的困扰,并且缺乏发现零日漏洞所需的泛化能力。
研究人员已大幅转向基于DL的代码分析方法。
HDAvul框架
本节将介绍所提出的层次化领域自适应电力专用漏洞检测框架HDAvul。该方法分为四个阶段:代码预处理、图嵌入、层次化领域适应和漏洞解释。代码预处理模块将源代码转换为包含电力语义的图结构表示。图嵌入将图结构转换为节点级、切片级的向量化特征
研究问题
提出了五个研究问题,以全面验证HDAvul在检测性能和结果可解释性方面相对于现有方案的优越性。
研究问题1(RQ1):超参数如何影响HDAvul模型在目标领域的性能?
这个问题旨在量化HDAvul框架对四个阶段中特定超参数设置的敏感性,例如基本切片窗口大小、电力代码复杂性系数、模型
结论
本文介绍了HDAvul,这是一种新颖的层次化领域自适应框架,旨在为专门的安全关键电力系统软件提供强大且可靠的漏洞检测。HDAvul的独特之处在于它能够通过多粒度视角直接弥合由领域差异引起的严重性能差距。广泛的实验验证了两个核心发现:首先,引入了利用电力关键语义的动态切片机制
CRediT作者贡献声明
Fangfang Dang:撰写 – 审稿与编辑,项目管理,概念化。Jiyu Zhang:撰写 – 原始草稿,可视化,方法论,形式分析,概念化。Kehe Wu:监督,项目管理,调查。Shuai Li:资源,调查,数据管理。Ying Zhu:验证,资源,调查,数据管理。
利益冲突声明
作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。