联邦学习中的好坏区分：一种基于原型学习和变分自编码器的新型数据欺诈检测方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Decision Support Systems》：Distinguishing good from bad in federated learning: A novel data fraud detection method using prototype learning and variational autoencoder

【字体：大中小】 时间：2026年06月01日 来源：Decision Support Systems 6.8

编辑推荐：

　　联邦学习（Federated Learning）实现了隐私保护的协作建模，并已在金融风险管理和医疗分析等数据驱动决策场景中广泛应用。然而，其“数据可用但不可见”的固有特性引入了关键漏洞：恶意参与者可能操纵本地数据或模型更新进行欺诈，从而降低模型性能并损害决策可

联邦学习（Federated Learning）实现了隐私保护的协作建模，并已在金融风险管理和医疗分析等数据驱动决策场景中广泛应用。然而，其“数据可用但不可见”的固有特性引入了关键漏洞：恶意参与者可能操纵本地数据或模型更新进行欺诈，从而降低模型性能并损害决策可靠性。由于数据透明度有限、更新异构以及缺乏可解释和鲁棒的检测机制，应对此类欺诈尤其具有挑战性。为解决这些挑战，本研究提出了一种新颖的方法：基于分布式协作表示的数据欺诈检测（Distributed-Collaborative-Representation-Based Data Fraud Detection, DcrDFD）。首先，研究人员开发了基于原型学习的表示构建机制，将参与者更新转换为代表性原型，从而可解释地识别正常、噪声和欺诈模式。其次，设计了基于多变分自编码器（Variational Autoencoder, VAE）的互评估机制，其中原型被协作重构和评估，显著增强了对复杂和动态数据欺诈的鲁棒性。第三，引入了一个联合优化框架，将欺诈检测与联邦学习训练相结合，实现模型学习和欺诈预防之间的动态协调。在四个真实数据集上的实验表明，DcrDFD在模型性能、欺诈检测准确性和鲁棒性方面优于现有方法，同时在有效性和计算开销之间保持了良好平衡。总体而言，本研究增强了联邦学习的可解释性、鲁棒性和可靠性，为安全可信的分布式决策支持系统提供了重要启示。

联邦学习作为一种隐私保护的分布式机器学习框架，允许多个数据持有者在数据本地存储的前提下协作训练全局模型，广泛应用于金融、医疗和电子商务等领域。然而，该框架的“数据可用但不可见”特性带来了一个关键问题：恶意参与者可能通过伪造数据或上传恶意模型更新进行数据欺诈（Federated Learning Data Fraud），这会降低模型性能、损害决策可靠性，并威胁整个系统的信任基础。特别是在水平联邦学习（Horizontal Federated Learning, HFL）场景中，参与者共享相同属性空间但样本不同，欺诈行为更容易实施且动机更强，因此数据欺诈检测成为HFL中亟待解决的挑战。现有检测方法常缺乏可解释性或鲁棒性，难以应对复杂动态的欺诈模式，无法有效协调检测与训练过程。为此，研究人员在《Decision Support Systems》上发表了本论文，旨在提出一种新型数据欺诈检测方法，以增强联邦学习的安全性和可信度，从而支撑分布式决策支持系统。

研究人员开展了一项创新性研究，提出名为DcrDFD的新型数据欺诈检测方法。该方法联合应用了原型学习（Prototype Learning）和变分自编码器（Variational Autoencoder, VAE），从三个层面提升检测性能：首先，基于原型学习构建可解释表示，将参与者更新转化为代表性原型，以识别正常、噪声和欺诈模式；其次，利用多变分自编码器设计互评估机制，通过原型间的协作重构增强鲁棒性；最后，通过联合优化框架实现欺诈检测与联邦学习训练的动态协调。研究得出结论：DcrDFD在多个真实数据集上均优于现有方法，在模型性能、检测准确性和鲁棒性方面表现优异，同时保持了计算与通信开销的合理平衡。这项研究的意义在于显著提升了联邦学习的可解释性、鲁棒性和可靠性，为构建安全可信的分布式决策支持系统提供了重要理论和技术支持。

为开展研究，研究人员采用了几个主要关键技术方法。核心方法包括原型学习和变分自编码器（VAE），其中原型学习用于从参与者模型更新中提取代表性模式，以增强检测的可解释性；多变分自编码器（Multi-VAE）用于实现原型间的互重构和评估，以提升检测的鲁棒性。此外，研究人员设计了一个联合优化框架，将欺诈表示学习损失、互评估重构损失与联邦学习训练损失相结合，实现检测与训练的动态协同。研究基于四个真实世界数据集（MNIST、CIFAR-10、HMEQ、HC）进行实验验证，这些数据集涵盖了手写数字识别、彩色图像识别和金融违约预测任务，确保了方法的广泛适用性。

研究结果部分基于多个实验分析，得出以下结论。在原始任务性能方面，研究人员通过对比DcrDFD与七种基准方法在不同数据分布（IID和非IID）下的表现，发现即使没有欺诈行为，DcrDFD也能有效完成联邦学习原始任务，模型性能与基准方法相当或更优。在欺诈防御性能方面，研究人员在不同欺诈比例和数据分布条件下评估了DcrDFD，结果显示其在欺诈检测准确率和模型性能上均显著优于现有方法，表明该方法能有效识别并抑制恶意参与者的干扰。消融分析通过对比DcrDFD与两个消融版本（DcrDFD-P：移除原型表示构建；DcrDFD-A：移除基于VAE的互评估），验证了原型学习和多变分自编码器互评估机制的独立贡献：两者均对提升检测性能和鲁棒性起到了关键作用。通信效率分析和计算效率分析表明，DcrDFD在增强检测能力的同时，保持了可控的通信与计算开销，实现了有效性与效率之间的良好平衡。可视化案例研究进一步展示了DcrDFD的检测过程，通过原型生成和互评估机制直观解释了欺诈模式的识别路径。

总结讨论部分指出，DcrDFD方法有效解决了联邦学习中数据欺诈检测的可解释性、鲁棒性以及检测与训练协同问题。通过原型学习，该方法实现了对模型更新的可解释模式挖掘，避免了直接使用更新信息带来的模糊性；通过基于多变分自编码器的互评估机制，实现了原型间的全面评估，增强了对抗复杂欺诈的鲁棒性；通过联合优化框架，将欺诈检测与任务训练动态结合，改变了传统“先训练后检测”的静态模式。研究结论部分翻译如下：为解决联邦学习中的数据欺诈问题，本论文提出了一种新颖的检测方法DcrDFD。该方法从三个方面改进现有检测方法：引入原型学习以增强可解释性，引入基于变分自编码器的互评估以增强鲁棒性，并实现欺诈检测与联邦学习任务的协同。在四个真实数据集上的实验表明，DcrDFD在原始任务和欺诈检测中均表现良好。DcrDFD具有可解释性、鲁棒性和有效性，为联邦学习在决策支持系统中的安全应用提供了重要支持。

联系信箱：

粤ICP备09063491号

热点排行