HIP:通过距离中心性融合和神经常微分方程实现模型无关的超图影响力预测

《Expert Systems with Applications》:HIP: Model-Agnostic Hypergraph Influence Prediction via Distance-Centrality Fusion and Neural ODEs

【字体: 时间:2026年04月08日 来源:Expert Systems with Applications 7.5

编辑推荐:

  预测超图中用户影响力,无需依赖扩散模型或轨迹数据。HIP框架融合多维中心性指标与时间语义重构的距离矩阵,结合多跳超图神经网络捕捉高阶结构依赖,并利用LSTM-ODE混合模型建模动态传播。实验表明HIP在14个真实数据集上准确率、鲁棒性和关键节点识别均优于基线,验证了其通用性和模块化优势。

  
张苏苏|谢金峰|陈阳|高敏|李聪|刘创|詹秀秀
杭州师范大学复杂性科学研究中心,中国杭州,311121

摘要

在社交网络中预测用户影响力是一个关键问题,而超图作为一种普遍的高阶建模方法,为这一任务提供了新的视角。然而,由于缺乏明确的级联或感染概率数据,因此在超图中推断影响力特别具有挑战性。为了解决这个问题,我们引入了HIP,这是一个统一且与模型无关的影响力预测框架,无需知道底层的传播模型。HIP将多维中心性指标与时间重新解释的距离矩阵结合起来,有效地表示了在缺乏可观察传播的情况下的节点级扩散能力。这些表示进一步通过多跳超图神经网络(HNN)进行处理,以捕捉复杂的高阶结构依赖性,同时使用结合长短期记忆(LSTM)网络和神经常微分方程(Neural ODEs)的混合模块来建模时间相关性。值得注意的是,HIP本质上是模块化的:用先进的DPHGNN替换标准HGNN,用xLSTM替换LSTM,也能获得类似的强大性能,这展示了其架构的通用性和鲁棒性。在14个真实世界的超图数据集上的实证评估表明,HIP在预测准确性、鲁棒性和识别顶级影响者方面始终优于现有的基线方法,而且这一切都不依赖于任何传播轨迹或对传播模型的先验知识。这些发现强调了HIP作为复杂超图环境中通用影响力预测解决方案的有效性和适应性。

引言

影响力预测的目标是根据用户特定特征和结构连通性来估计用户信息在社交网络中的传播范围(Shang,2025)。准确预测节点影响力在一系列下游任务中起着至关重要的作用,例如通过信息传播增加产品曝光度以实现商业收益(Yang等人,2024);提高谣言抑制技术的精度(Dai等人,2024;Guo等人,2025;Sun等人,2022);以及通过揭示群体级接触结构中的超级传播者来早期干预疫情控制(Mou等人,2024)。
传统成对网络中的现有影响力预测方法大致可以分为四类:蒙特卡洛(MC)模拟(Borgs、Brautbar、Chayes和Lucier,2014;Cheng、Shen、Huang、Zhang和Cheng,2013;Ohsaka、Akiba、Yoshida和Kawarabayashi,2014);概率推理模型(Jiang等人,2011);以及基于神经网络的算法(Aravamudan、Zhang和Anagnostopoulos,2023;Cheng等人,2024)。虽然MC模拟具有高准确性,但它们计算成本高昂,不适合大规模网络。为了提高效率,提出了基于抽样的方法,如基于快照的Lu、Zhang、Zhou、Liu和Gao(2015);Lu、Zhou和Wu(2016)以及反向影响力抽样Nguyen、Nguyen、Phan和Dinh(2017);Tang、Tang、Xiao和Yuan(2018),尽管它们在准确性和可扩展性之间存在权衡。受两跳影响力理论启发的概率推理方法(Pei、Muchnik、Andrade、Zheng和Makse,2014)在稀疏网络中表现良好,但在密集环境中往往精度会下降(Gong、Yan、Shen、Ma和Cai,2016)。为了解决结构复杂性和可扩展性问题,出现了基于神经网络的模型(Qiu等人,2018),尽管提取有意义的节点级影响力特征仍然具有挑战性。最近的进展包括基于中心性的方法(Kumar、Mallik和Panda,2023),基于随机游走的方法(Wang、Lin、Tang、Yuan和Zhang,2024),基于扩散的方法(Panagopoulos、Nikolentzos和Vazirgiannis,2021),以及基于感染概率的嵌入方法(Yuan、Shao和Chen,2024)。
尽管在传统网络上的影响力预测方面取得了进展,但仍然存在两个关键限制。首先,大多数模型忽略了高阶结构,而这些结构在现实世界系统中很常见(Battiston等人,2020;Sun等人,2023b)。超图自然能够捕捉这些多节点交互,这些交互显著改变了扩散动态(Ferraz de Arruda、Aleta和Moreno,2024;Wang、Zhao、Ding和Zhang,2025),但在现有模型中仍然未被充分探索。其次,传播轨迹和感染概率在实践中往往不可用。例如,在COVID-19大流行期间,尽管有病例数据,但接触者追踪仍然很困难。依赖此类详细信息的方法(Yuan等人,2024)适用性有限。这些挑战需要仅基于结构数据而不需要完整传播轨迹的预测模型。
为了解决上述挑战,我们提出了HIP(超图影响力预测),这是一个新颖的通用框架,用于在不知道底层传播模型的情况下进行超图中的影响力预测。HIP包括四个关键组成部分:(1)距离-中心性特征融合,(2)通过多跳超图传播进行上下文编码,(3)通过LSTM-ODE集成进行时空动态建模,以及(4)扩散幅度预测。在第一个模块中,我们从时间角度重新解释节点距离矩阵,将每个条目视为信息传播所需的最小跳数,从而为结构距离赋予时间语义。此外,我们计算多维中心性指标,以基于高阶交互捕获从局部到全局的结构信息。在第二个模块中,我们利用经典的HGNN(Feng、You、Zhang、Ji和Gao,2019)来聚合节点两跳邻域的特征,通过建模节点和超边之间的消息传递。接下来,为了捕捉动态传播模式,我们整合了两个时间模型:LSTM(Hochreiter和Schmidhuber,1997;Yang和Esquivel,2024)和神经常微分方程(Chen、Rubanova、Bettencourt和Duvenaud,2018),这进一步细化了时间感知的表示。HIP当前的实现采用HGNN和LSTM作为其默认组件,可以无缝替换为更先进的架构。最后,在扩散幅度预测模块中使用多层感知器来估计每个节点的最终影响力。我们在14个实证超图上评估了HIP,并与一系列SOTA基线进行了比较。实验结果表明,HIP在预测准确性、有影响力节点识别和鲁棒性方面始终表现出色。这项工作的主要贡献总结如下:
我们提出了超图上影响力预测的新问题,由于存在复杂且不可观察的高阶传播模型,这对传统方法构成了重大挑战。
  • 我们开发了一个端到端的预测框架(HIP),基于HNN和神经常微分方程来预测节点影响力,有效地捕捉了高阶结构依赖性和影响力传播的时间动态。
  • 在真实世界和合成超图上的广泛实验表明,HIP在准确性、鲁棒性和有影响力节点识别方面始终优于最先进的基线方法,而无需明确的扩散数据。
  • 部分摘录

    初步介绍

    定义1(超图) 超图定义为H=(V, E),其中V={v1, v2, ?, vN}表示节点集,E={e1, e2, ?, eM}表示超边集。每个超边对应于涉及多个节点的基于组的交互。为了描述节点和超边之间的关联,我们构建了一个关联矩阵IRN×M,其中Ii=1表示用户vi参与了超边ej,否则Ii=0。基于I,我们推导出相应的邻接矩阵ARN

    HIP框架的设计与实现

    在本节中,我们将详细介绍所提出的方法HIP,其整体架构如图1所示。HIP框架由四个主要组成部分构成,具体如下:
  • 距离-中心性特征融合旨在捕捉反映单个节点传播能力的信息特征。它整合了来自局部和全局视角的中心性和基于距离的特征,以构建一个综合的多层次
  • 实验

    在本节中,我们对提出的HIP算法与SOTA方法进行了全面的评估,比较了多个维度。具体来说,我们旨在解决以下关键问题:(1) 我们的方法在预测节点影响力方面表现如何,特别是在底层传播模型未知的情况下?(2) 基于距离和中心性的特征对影响力预测的准确性有多大贡献?(3) HIP框架是否可以

    排名一致性

    为了评估我们模型的有效性,我们在表2和表3中报告了不同传播场景下各种方法的Kendall’s τ。HIP在所有实证超图中的表现始终最高,比第二好的方法MPNN+LSTM高出7%到11%。DeepIM使用one-hot向量对节点进行编码,而不考虑超图结构,这限制了其预测能力。GBIM基于节点激活概率学习了一个扩散替代模型,但其

    讨论

    为了明确HIP在现有影响力估计框架中的位置,我们从三个互补的维度总结了它的贡献:
    问题表述:我们在一个最小可观察的设置中研究了超图上的影响力预测,其中没有扩散轨迹或感染概率。与之前的基于级联或模型依赖的方法不同,HIP纯粹基于静态的高阶拓扑结构进行操作。这种表述扩展了影响力

    结论与未来工作

    节点影响力预测对于传播动态至关重要,但传统网络经常忽略了超图捕获的高阶交互,这些交互也带来了新的挑战。为此,我们提出了HIP,这是一个端到端的通用框架,它将结构特征编码与时间建模结合起来,以准确估计节点影响力。HIP利用了一系列中心性度量和时间重新解释的距离矩阵来捕获多尺度结构信息。

    CRediT作者贡献声明

    张苏苏:撰写——原始草案、可视化、方法论、形式分析、概念化。谢金峰:撰写——审阅与编辑、可视化、方法论、形式分析、概念化。陈阳:撰写——审阅与编辑、概念化、验证。高敏:撰写——审阅与编辑、方法论、形式分析。李聪:撰写——审阅与编辑、概念化、验证。刘创:撰写——审阅与编辑、资源获取、监督,

    利益冲突声明

    作者声明他们没有已知的财务利益或个人关系可能会影响本文报告的工作。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号