CKDP-PINNFed:融合上下文K-匿名与差分隐私的物理信息联邦学习双层隐私框架用于可解释众包道路异常检测

《Green Energy and Intelligent Transportation》:CKDP-PINNFed: Dual-Layer Privacy Framework Combining Contextual K-Anonymity and Differential Privacy with Physics-Informed Federated Learning for Explainable Crowdsourced Road Anomaly Detection

【字体: 时间:2026年05月25日 来源:Green Energy and Intelligent Transportation 16.4

编辑推荐:

  研究人员提出CKDP-PINNFed,一种双层隐私保护联邦学习框架,以解决基于智能手机的众包道路状况监测中的隐私障碍。原始传感器数据会暴露精确位置、速度违规及行为模式,导致用户因监视、重识别及被当局或保险公司滥用的风险而不愿参与。现有联邦学习(FL)方法仅保护

  
研究人员提出CKDP-PINNFed,一种双层隐私保护联邦学习框架,以解决基于智能手机的众包道路状况监测中的隐私障碍。原始传感器数据会暴露精确位置、速度违规及行为模式,导致用户因监视、重识别及被当局或保险公司滥用的风险而不愿参与。现有联邦学习(FL)方法仅保护模型梯度,而原始数据在本地仍面临暴露风险;独立的隐私技术(如k-匿名与差分隐私(DP))通常需要集中式聚合,引入单点故障,且无法在道路异常检测中平衡隐私与效用。研究人员在本地存储前应用上下文k-匿名结合DP对原始传感器数据进行匿名化处理,与单独使用DP相比,复合隐私损失得分降低78.4%,唯一性风险降低99.1%。研究人员采用FedProx算法,结合混合物理信息神经网络与随机森林(PINN-RF)架构,在匿名化数据上进行去中心化训练。该轻量级框架(0.19M参数,0.73 MB)实现实时处理,单样本总延迟为0.0322 ms,其中CK-DP预处理占0.0199 ms,PINN-RF推理占0.0123 ms,支持实际设备端部署。在RoadSens-4M数据集上的实验结果表明,F1得分为89.94% ± 0.35%,准确率为89.93% ± 0.19%,在极端非独立同分布(non-IID)条件下优于FedAvg 1.64%,且优于所有其他联邦基线。消融研究证实了各组件的协同效应,SHAP(SHapley Additive exPlanations)分析验证了具有物理意义的特征可解释性,外部验证在独立数据集上达到84.23% ± 1.18%的准确率。这些结果确立了CKDP-PINNFed作为一种实用且安全的解决方案,可在保护个人隐私的同时实现可信赖的众包道路监测。
本研究针对众包道路异常检测中的隐私与数据异构性挑战展开。传统道路巡检依赖专用车辆,成本高昂且覆盖范围有限,而智能手机传感器虽能低成本实现大规模监测,却因原始数据包含精确时空轨迹、速度及行为特征,引发用户对监视、重识别和保险歧视的担忧,严重阻碍参与意愿。现有隐私方案中,联邦学习仅保护梯度传输,本地原始数据仍裸存;单一匿名技术需集中式处理,存在单点故障且难以兼顾检测精度。为此,研究人员设计CKDP-PINNFed双层隐私框架,首次将上下文K-匿名与差分隐私融入联邦学习全流程,并结合物理信息约束提升模型鲁棒性,最终在保障隐私前提下实现高精度实时检测,为智能交通系统提供可信解决方案。
关键技术方法上,研究人员使用两个数据集:主数据集RoadSens-4M包含103次驾驶会话的1,034,526条记录,采集自三星Galaxy S24手机,覆盖375.5公里城乡道路;外部验证集由Xiaomi Poco X2手机在丰田AE110车辆上采集,经GIS高程数据增强。核心方法包括:第一层为上下文K-匿名与差分隐私(CK-DP)本地预处理,对GPS坐标进行三位小数四舍五入(约111米分辨率),速度分四档离散化,水平惯性轴添加高斯噪声实现(ε=0.3, δ=10-5)-DP,总隐私预算εtotal=0.8;第二层采用FedProx算法应对非独立同分布数据,结合物理信息神经网络(PINN)嵌入四分之一车辆动力学模型约束,提取64维物理特征后输入随机森林分类器。整个框架参数量仅0.19M,支持端侧实时运行。
研究结果部分,首先通过联邦学习算法对比证实FedProx在异构数据上的优越性。在PINN-RF架构下,FedProx准确率达89.93% ± 0.19%,较FedAvg提升1.64个百分点,FedNova提升3.01个百分点,且置信区间最小,证明其有效抑制客户端漂移。其次,客户端数量影响分析显示,参与客户端从5增至15时,准确率由89.93%降至85.83%,其中坑洞类别下降最显著,反映数据碎片化的负面影响。第三,分类性能可视化表明,混淆矩阵中减速带召回率最高(92.58%),坑洞召回率88.15%,ROC曲线下面积(AUC)均超0.975,证明匿名化数据未损害特征可分性。第四,隐私效用权衡分析显示,CK-DP较单独DP使复合隐私损失得分降低78.4%(从0.981降至0.216),唯一性风险降低99.1%,且保持89.93%的检测精度。第五,唯一性分析进一步验证CK-DP实现91.9%非单例分组与0.9%记录唯一性,彻底阻断关联攻击。第六,SHAP可解释性分析揭示,方向四元数分量与磁力计信号是两类异常的核心判别特征,水平加速度贡献最低,印证了隐私策略保留垂直轴信号的合理性。第七,计算效率评估显示,框架总处理延迟仅0.0322毫秒/样本,模型大小0.73 MB,满足车载实时预警需求。第八,外部验证在独立数据集上取得84.23% ± 1.18%准确率,较内部测试下降5.7个百分点,体现跨设备跨地域泛化能力。第九,消融研究证实,物理约束、深层网络、随机森林与FedProx近端正则各自贡献1%-3%精度提升,完整配置达到最优性能。
讨论与结论部分指出,CKDP-PINNFed填补了现有研究空白:首次实现本地数据匿名化与联邦学习的端到端集成,消除集中式存储风险;物理信息约束有效克服设备异质性,避免纯数据驱动模型的过拟合;自定义复合隐私指标为移动感知场景提供量化评估工具。研究人员强调,当前工作尚未集成安全聚合与梯度级差分隐私,未来需进一步防御成员推断与梯度反转攻击。最终结论认为,该框架以极低计算开销达成强隐私保护与高精度检测的均衡,其双重防护机制(本地匿名化+联邦协作)与物理可解释性,为众包智能交通系统的大规模部署扫清了隐私障碍,推动道路安全监测向可信赖、可持续方向发展。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号