编辑推荐:
Jiayu Wang|Jinyan Wang|Zeming Gan|Xianxian Li|De Li摘要图联邦学习(Graph Federated Learning,GFL)作为图神经网络的重要组成部分,在现实世界场景中得到了广泛应用。然而,由于数据标记错误或恶意攻击等因素,现
Jiayu Wang|Jinyan Wang|Zeming Gan|Xianxian Li|De Li
摘要
图联邦学习(Graph Federated Learning,GFL)作为图神经网络的重要组成部分,在现实世界场景中得到了广泛应用。然而,由于数据标记错误或恶意攻击等因素,现实世界的图数据常常存在标签噪声问题。现有的处理标签噪声的方法主要集中在集中式方法上,这些方法在分布式环境中表现不佳,且难以有效处理大规模数据集。为了解决GFL中的标签噪声问题,我们提出了一种名为FedEBM的新方法。首先,我们认识到在样本稀疏或标签不平衡等不利条件下,GFL中的客户端往往具有次优的学习能力,因此创新性地应用了基于能量的模型(Energy-Based Model,EBM)来解决标签噪声问题。EBM根据样本的能量分数来区分干净样本和噪声样本。即使干净样本较少,它也能通过提高噪声样本的能量分数来隐式地划分能量区域边界,从而将干净样本和噪声样本分开。此外,EBM中各类别的能量分数变化不会影响其他类别的能量分数,避免了少数类之间的概率竞争,并提高了对少数类特征的敏感性。在多个公共数据集上的对比实验表明,FedEBM在各种噪声率、噪声类型和客户端数量下均优于六种基线方法。具体来说,在小规模数据集上,FedEBM的平均性能优于第二种方法5.43%;在大规模数据集上,这一优势提升到了12.58%。