结构感知的细粒度球形超图学习

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

结构感知的细粒度球形超图学习

《Engineering Applications of Artificial Intelligence》：Structure-aware granular-ball hypergraph learning

【字体：大中小】 时间：2026年06月19日 来源：Engineering Applications of Artificial Intelligence 8

编辑推荐：

　　倪金源|夏淑音|王冠|杨萌|陈龙|刘毅|王毅中国重庆邮电大学计算机科学与技术学院摘要随着现实世界系统日益复杂，传统的图模型难以捕捉高阶交互和多尺度依赖关系。虽然超图学习被视为一种有前景的解决方案，但现有框架往往依赖于静态的超边构建或基于特征的动态更新，而这些方法容易受到人工阈值和

　　倪金源|夏淑音|王冠|杨萌|陈龙|刘毅|王毅中国重庆邮电大学计算机科学与技术学院摘要随着现实世界系统日益复杂，传统的图模型难以捕捉高阶交互和多尺度依赖关系。虽然超图学习被视为一种有前景的解决方案，但现有框架往往依赖于静态的超边构建或基于特征的动态更新，而这些方法容易受到人工阈值和特征空间漂移的影响。为了解决这些问题，本文提出了结构感知的颗粒球超图学习（SAGHL）框架，该框架从拓扑驱动的角度来处理超边的演化。与那些依赖特征相似性的传统可演化超图方法不同，SAGHL的创新之处在于采用自适应的颗粒球分解策略，通过生成分层超边来保留多尺度的结构语义。这一策略以结构上重要的枢纽节点为指导，以确保高阶关系的完整性，并通过多尺度融合和对比增强训练目标来提升表示的鲁棒性。在基准引文数据集和社交媒体数据集上的大量实验表明，与现有最先进方法相比，SAGHL具有更出色的性能和更强的鲁棒性，能够有效捕捉复杂的层次化结构依赖关系并减轻标签噪声。代码可在https://anonymous.4open.science/r/SAGHL-4266获取。引言随着社交网络和生物网络等现实世界系统日益复杂，传统的图模型往往无法捕捉到超出二元交互的高阶关系。超图学习作为一种解决方案，能够表示节点之间的多向交互，从而解决了这一问题。这种方法扩展了图神经网络（GNNs）的功能，允许超边编码任意数量节点之间的交互，而不仅仅是成对节点，因此非常适合用于建模具有多样性和多模态交互的现实世界系统的复杂性（Kim等人，2024年；Lee等人，2025年）。通过构建能够传播超出二元连接之外的语义信号的超图拉普拉斯矩阵（Zhou等人，2006年），这种范式能够实现更丰富的上下文表示，并在节点分类（Bai等人，2021年）和跨领域推荐（Wang等人，2020年）等任务中取得最先进的性能。然而，现有的超图学习框架，如超图卷积网络（HyperGCN）（Yadati等人，2019年）和超图神经网络（HGNN）（Feng等人，2019年），仍然面临一个关键瓶颈：它们的性能在很大程度上取决于底层超图结构的质量，尤其是超边的构建和自适应更新，以支持有效的学习。为了实现有效的超图学习，先前的研究探索了各种超边构建策略，如在HyperGCN中的k最近邻k-NN超边（Yadati等人，2019年）和在HGNN中的基于特征的团扩展（Feng等人，2019年）。这些策略通常可以分为三类：基于相似性的方法，如HyperSAGE中的k-NN（Arya等人，2020年）；基于结构的方法，如UniGNN中的k跳扩展（Huang和Yang，2021年）；以及基于语义的框架，如HyperGAT中的标签传播（Ding等人，2020年）。尽管这些方法很有效，但它们往往依赖于手动设置的参数，如固定的邻居规模或跳数扩展，需要大量的超参数调整。这种对预定义阈值的依赖限制了它们的灵活性，以及捕捉复杂网络中固有的层次化、多粒度结构的能力，使得难以保持跨尺度的拓扑模式和复杂的结构角色。此外，像HyperGCN这样的现有模型通常使用一跳邻居超边来传播信息，这就导致了仅限于直接邻居的刚性连接性。这种方法无法捕捉不同粒度级别上的更广泛的结构关系，从而限制了在图中表示复杂层次化关系的能力，如图1所示。为了解决这些问题，本文提出了一种结构感知的颗粒球超图学习框架，该框架以从粗到细的方式动态生成分层超边。这种方法避免了固定跳数扩展和手动阈值，从而实现了跨尺度的语义和结构保留。尽管现有方法已经取得了一些进展，但仍有几个关键挑战。首先，许多方法依赖于特征空间相似性或固定跳数扩展来构建超边，这往往会导致特征空间漂移，并忽视了底层拓扑结构。实验观察表明，这种单尺度构建对噪声和手动阈值极为敏感，无法捕捉不同尺度上的层次化关系。其次，缺乏自适应的多尺度融合机制，往往导致浅层拓扑信号在深层语义层中丢失，从而使模型在复杂环境中的性能不佳。为了全面解决这些限制，本研究引入了结构感知的颗粒球超图学习（SAGHL），它将范式从基于特征的构建转变为基于拓扑的演化。首先，该模型采用基于结构的方法动态生成超边，通过选择具有高介数中心性的枢纽节点，并利用模块度-密度指标指导分层划分，以防止在稀疏区域过度分割。其次，它采用基于残差设计的多尺度特征融合架构，该架构具有三个并行通道，通过门控注意力和跳跃连接整合局部和全局结构特征，从而保留浅层拓扑信息和深层语义信息。第三，它通过结合超边信息的正负采样以及根据超边规模和密度调整的动态温度策略来增强对比学习，共同优化分类和对比目标，以提高在有限监督条件下的泛化能力。SAGHL的设计正是出于上述挑战的考虑，其主要贡献总结如下：•所提出的结构感知超边生成策略侧重于枢纽节点，采用自适应的颗粒球分解技术在多个粒度层面构建超边。该策略消除了对手动阈值的需求，并保留了多尺度的结构语义。•本研究开发了一种具有门控注意力的多尺度特征融合网络，能够有效地整合不同尺度上的结构信号，克服了传统一跳传播的刚性连接性。•本研究引入了一种对比正则化机制，该机制明确地将高阶拓扑信号和动态温度缩放纳入训练过程，提高了模型在有限监督条件下的泛化能力。本文的其余部分安排如下：第2节回顾了超图学习和颗粒计算的相关工作。第3节详细描述了所提出的SAGHL框架。第4节展示了实验结果和分析。最后，第5节对本文进行了总结，并探讨了未来的研究方向。片段超图神经网络超图神经网络通过超边模拟数据实体之间的高阶关系，从而提升了传统图神经网络的表现能力，超边可以同时连接两个以上的节点（Jiang等人，2019年）。与表示二元关系的标准图不同，超图能够自然地捕捉现实世界数据中普遍存在的多向交互，包括社交网络中的共享属性（Antelmi和Cordasco，2023年）以及结构感知的颗粒球超图学习（SAGHL）结构感知的颗粒球超图学习（SAGHL）框架由三个关键组件构成：基于颗粒球的、受结构引导的超边构建模块，多尺度超图特征融合架构，以及对比增强训练模块。如图2所示，第一个组件，即基于颗粒球的、受结构引导的超边构建模块，通过识别结构上重要的枢纽节点，自适应地生成分层超边。实验本节通过一系列实验来评估所提出的SAGHL框架的有效性，这些实验是围绕以下研究问题展开的：•RQ1：在多个基准数据集上，SAGHL与现有的最先进超图学习模型的表现如何？•RQ2：SAGHL的各个组件对其整体性能的贡献程度如何，哪些模块对其成功最为关键？•RQ3：不同的超参数设置会对性能产生怎样的影响？面向复杂网络的适用范围和扩展性虽然目前SAGHL的实现主要针对同质且静态的无向图，但其背后的颗粒球图表示框架具有天然的扩展性，可用于更复杂的网络架构。对于异构信息网络（HINs），可以通过引入基于元路径的PageRank或类型感知的聚类系数来调整基于中心性的分割机制，以考虑节点和边之间的多样化语义。关于时间动态性结论与未来工作本文提出了一种名为SAGHL的新型超图学习框架，该框架整合了基于颗粒球的自适应超边构建、多尺度特征融合以及对比增强训练。在多个基准数据集上的大量实验表明，SAGHL的性能始终优于现有的最先进方法，在准确率和宏观F1分数方面平均比强大的基线方法高出3%和5%，在大型数据集上的准确率最高可提升7%。CRediT作者贡献声明倪金源：写作——审阅与编辑，写作——初稿，项目管理，正式分析，数据整理，概念构思。夏淑音：监督，软件开发。王冠：监督，软件开发。杨萌：软件开发，调查研究。陈龙：软件开发，资源准备，方法设计。刘毅：监督。王毅：监督。利益冲突声明作者声明他们没有已知的财务利益或个人关系可能影响到本文所报告的工作。致谢衷心感谢所有为完成这项工作付出努力和奉献的人士。本研究部分得到了中国国家自然科学基金的支持，项目编号分别为62222601、62176033、62221005和61936001；得到了中国重庆市教育委员会的重点合作项目的支持，项目编号为HZ2021008；还得到了中国重庆市教育委员会的科技研究计划的支持，项目编号为。

联系信箱：

粤ICP备09063491号

热点排行