在高维稀疏数据发布中保持相关性,并利用局部差分隐私技术

《Knowledge-Based Systems》:Correlation preservation in high-dimensional sparse data publication with local differential privacy

【字体: 时间:2026年05月29日 来源:Knowledge-Based Systems 7.6

编辑推荐:

  彭顺顺|王文豪|李明浩|李浩奇|杨梦梦|郭涛林摘要在局部差分隐私(LDP)保护下释放个体用户数据,并分析来自全局扰动用户数据的数据相关性,这一研究受到了广泛关注。然而,随着数据维度的增加,扰动数据的效用会降低,因为扰动高维稀疏数据会引入大量错误。本研究提出了LDP-CHSP方法,

  
彭顺顺|王文豪|李明浩|李浩奇|杨梦梦|郭涛林

摘要

在局部差分隐私(LDP)保护下释放个体用户数据,并分析来自全局扰动用户数据的数据相关性,这一研究受到了广泛关注。然而,随着数据维度的增加,扰动数据的效用会降低,因为扰动高维稀疏数据会引入大量错误。本研究提出了LDP-CHSP方法,该方法利用高斯随机投影将高维稀疏数据映射为低维密集数据,同时保持原始数据记录之间的欧几里得距离。它通过扰动维度化数据而非原始数据来减少噪声对数据相关性的影响。由于降维数据对噪声较为敏感,使用LDP机制进行数据扰动往往会导致效用降低。我们利用隐私损失概率函数建立了隐私损失与隐私泄露风险之间的关系,确定了满足这一关系并保持数据相关性的最小噪声方差,从而减少了噪声数据的大小。此外,我们从理论上证明了LDP-CHSP的隐私性和效用性。通过对四个真实数据集使用五种比较方法进行实验验证,结果表明LDP-CHSP在准确性和噪声方差方面优于其他比较方法。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号