《Neural Networks》:XAI-DTBD: Explainable Dynamic Threshold-based Backdoor Detection in Graph Neural Networks
编辑推荐:
阿迪尔·艾哈迈德(Adil Ahmad)|安瓦尔·沙阿(Anwar Shah)|穆罕默德·阿德南(Muhammad Adnan)|周元(Chau Yuen)摘要在神经网络中检测后门是一种新兴的研究领域,其中通过注入后门触发器来改变模型的输出。例如,通过修改某些节点的特征和结构来在
阿迪尔·艾哈迈德(Adil Ahmad)|安瓦尔·沙阿(Anwar Shah)|穆罕默德·阿德南(Muhammad Adnan)|周元(Chau Yuen)
摘要
在神经网络中检测后门是一种新兴的研究领域,其中通过注入后门触发器来改变模型的输出。例如,通过修改某些节点的特征和结构来在引用网络中注入触发器。每当模型遇到这样的触发器时,它就会错误地分类这些节点。在本文中,我们提出了一种用于检测图神经网络(GNNs)中后门的新方法,该方法利用模型激活聚类和动态阈值技术。所提出的模型XAI-DTBD(可解释的基于动态阈值的图神经网络后门检测)首先选择模型中最重要的层进行激活聚类。通过聚类度量来评估簇的质量以及数据集的敏感性。对于动态阈值设置,我们使用了簇度量、数据敏感性和被污染的数据点百分比。在找到特定数据的动态阈值后,将其与其他后门检测指标进行比较。此外,还使用了可解释AI 2.0方法(如SHAP和Grad-CAM)来识别异常节点和子图,从而使检测过程更具可解释性和可信度。在Cora、CiteSeer、PubMed和MUTAG等基准数据集上进行的详细实验表明,与当前最先进的GNN后门检测算法相比,XAI-DTBD在各种后门攻击场景下实现了较高的平均检测率和较低的误报率。