在无线传感器网络中,利用可解释的自组织映射技术进行分布式聚类,以用于环境数据分析

《Environmental and Ecological Statistics》:Distributed clustering with interpretable self-organizing maps in wireless sensor network for environmental data analysis

【字体: 时间:2026年03月28日 来源:Environmental and Ecological Statistics 1.8

编辑推荐:

  自组织地图(SOM)改进算法DiSOM实现无线传感器网络分布式聚类,减少通信开销与数据隐私风险,并在7个环境监测数据集上验证其优于传统算法的性能,通过拓扑误差、量化误差及聚类指标等证明有效性。

  

摘要

自组织映射(Self-Organizing Map, SOM)是一种流行的无监督学习技术,用于将数据组织成结构化的二维或三维地图,从而帮助用户识别高维数据空间中的簇和异常值。可解释自组织映射(Interpretable Self-Organizing Map, iSOM)是一种先进的算法,旨在克服传统SOM实现中常见的折叠和自交问题。在空气质量与水质监测或气候模式识别等环境应用中,数据通常来自远程地理位置的多样化来源。分布式聚类允许对这些环境数据集进行本地处理,减少通信开销并保护数据隐私。在本文中,对iSOM进行了适当修改,使其仅使用获胜神经元(winner neurons)在无线传感器网络(Wireless Sensor Network, WSN)中执行分布式聚类。这种改进后的算法被称为分布式可解释自组织映射(Distributed Interpretable Self-Organizing Map, DiSOM),它通过协作模式与邻近传感器节点共享获胜神经元。这有助于将高维未标记数据转换为有意义的簇,从而更容易解释和可视化数据趋势。该算法在七个真实的WSN数据集上进行了测试,用于执行分布式聚类:(a) 德里空气质量管理数据集,(b) 加拿大气象站监测数据集,(c) 泰晤士河水质监测数据集,(d) 华盛顿库克农学农场数据集,(e) 阿尔及利亚森林火灾数据集,(f) 英特尔伯克利研究实验室数据集,以及(g) 地雷检测数据集。为了评估DiSOM的学习质量,使用了地形误差(Topographic Error, TE)和量化误差(Quantization Error, QE)作为性能指标。模拟结果显示,所有七个数据集的TE和QE收敛曲线均较低,可视化的权重位置折叠较少,获胜神经元在二维网格图上更加分散。聚类质量通过轮廓系数(Silhouette Index)和邓恩指数(Dunn Index)进行评估,结果表明DiSOM的性能优于DSOM、分布式PSO(DPSO)和K均值(DK-means)算法。此外,基于Kruskal–Wallis和Wilcoxon秩和的非参数统计测试表明,DiSOM算法的结果支持原假设,优于现有的三种基准算法。

自组织映射(Self-Organizing Map, SOM)是一种流行的无监督学习技术,用于将数据组织成结构化的二维或三维地图,从而帮助用户识别高维数据空间中的簇和异常值。可解释自组织映射(Interpretable Self-Organizing Map, iSOM)是一种先进的算法,旨在克服传统SOM实现中常见的折叠和自交问题。在空气质量与水质监测或气候模式识别等环境应用中,数据通常来自远程地理位置的多样化来源。分布式聚类允许对这些环境数据集进行本地处理,减少通信开销并保护数据隐私。在本文中,对iSOM进行了适当修改,使其仅使用获胜神经元(winner neurons)在无线传感器网络(Wireless Sensor Network, WSN)中执行分布式聚类。这种改进后的算法被称为分布式可解释自组织映射(Distributed Interpretable Self-Organizing Map, DiSOM),它通过协作模式与邻近传感器节点共享获胜神经元。这有助于将高维未标记数据转换为有意义的簇,从而更容易解释和可视化数据趋势。该算法在七个真实的WSN数据集上进行了测试,用于执行分布式聚类:(a) 德里空气质量管理数据集,(b) 加拿大气象站监测数据集,(c) 泰晤士河水质监测数据集,(d) 华盛顿库克农学农场数据集,(e) 阿尔及利亚森林火灾数据集,(f) 英特尔伯克利研究实验室数据集,以及(g) 地雷检测数据集。为了评估DiSOM的学习质量,使用了地形误差(Topographic Error, TE)和量化误差(Quantization Error, QE)作为性能指标。模拟结果显示,所有七个数据集的TE和QE收敛曲线均较低,可视化的权重位置折叠较少,获胜神经元在二维网格图上更加分散。聚类质量通过轮廓系数(Silhouette Index)和邓恩指数(Dunn Index)进行评估,结果表明DiSOM的性能优于DSOM、分布式PSO(DPSO)和K均值(DK-means)算法。此外,基于Kruskal–Wallis和Wilcoxon秩和的非参数统计测试表明,DiSOM算法的结果支持原假设,优于现有的三种基准算法。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号