因子相关与载荷的替代贝叶斯正则化方法：Lasso、Spike-and-Slab与Horseshoe

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Structural Equation Modeling: A Multidisciplinary Journal》：Alternative Bayesian Regularizations for Factor Correlations and Loadings: Lasso, Spike-and-Slab, and Horseshoe

【字体：大中小】 时间：2026年05月28日 来源：Structural Equation Modeling: A Multidisciplinary Journal 3.2

编辑推荐：

　　研究人员将贝叶斯图形建模嵌入部分验证性因子分析（PCFA, Partially Confirmatory Factor Analysis）中，用于估计稀疏潜因子相关矩阵，从而克服逆威沙特（inverse-Wishart）先验的局限性。研究人员利用图形Lasso

研究人员将贝叶斯图形建模嵌入部分验证性因子分析（PCFA, Partially Confirmatory Factor Analysis）中，用于估计稀疏潜因子相关矩阵，从而克服逆威沙特（inverse-Wishart）先验的局限性。研究人员利用图形Lasso、Horseshoe和Spike-and-Slab先验对因子相关矩阵进行正则化，形成一个统一框架，同时对载荷与因子相关施加稀疏性约束。针对复杂结构，研究人员进一步引入多特质多方法（MTMM, Multitrait-Multimethod）及扩展双因子模型的部分正则化。仿真实验表明，在大样本、复杂或稀疏条件下，Spike-and-Slab先验在控制假阳性及提高准确性方面表现最优；Horseshoe先验在不同样本量下表现稳定但假阳性率较高；Lasso先验则呈现中等且稳定的性能。在模型识别方面，基于显著性的准则优于基于阈值的规则，尤其适用于复杂设计与实证分析。应用于人格量表数据的结果显示，部分正则化提升了因子相关与载荷估计的可解释性及模型拟合度。

该研究发表于《Structural Equation Modeling: A Multidisciplinary Journal》，聚焦于潜因子模型中因子相关矩阵的估计问题。传统方法多采用逆威沙特（inverse-Wishart）先验，但无法有效处理稀疏结构，易导致噪声相关增加、可解释性降低及过拟合。已有部分验证性因子分析（PCFA）虽可对载荷施加Lasso正则化，但对因子相关的先验仍缺乏稀疏诱导机制。为此，研究人员提出PCFAwRFC（PCFA with Regularized Factor Correlation）框架，将贝叶斯图形模型应用于潜因子相关矩阵，并扩展至复杂结构的PCFAwPRFC（PCFA with Partial Regularized Factor Correlation），分别针对一般因子与特殊因子采用不同正则策略。仿真结果显示，Spike-and-Slab先验在大样本与稀疏结构中具最佳假阳性控制能力，Horseshoe先验稳定性强但假阳性略高，Lasso先验表现均衡可靠。显著性识别准则优于阈值法。实证分析表明，该方法能改善人格量表的结构解释与拟合。

关键技术方法方面，研究人员基于贝叶斯图形建模，分别对因子相关矩阵施加图形Lasso、Horseshoe与Spike-and-Slab三种稀疏先验，并在复杂模型中结合逆威沙特先验与正则化策略。模拟数据涵盖不同样本量（N=250、500、1000）、因子数（K=3、5、10）及稀疏水平，使用马尔可夫链蒙特卡洛（MCMC）算法进行参数估计，并通过潜在尺度缩减因子（EPSR）检验收敛性。实证数据来自法国版DSM-5短式人格量表（PID-5-SF），包含2532名被试，涵盖5个一般因子与15个特殊因子，共60个项目。

研究结果分为四个仿真研究及一个实证应用。研究一在低维全相关结构中，各先验均能准确恢复参数，但小样本下Spike-and-Slab表现略有下降，逆威沙特因计算效率高仍为优选。研究二在高维稀疏结构中，正则化方法显著优于逆威沙特，Spike-and-Slab在极高稀疏条件下假阳性最低，显著性准则比阈值法稳健。研究三探讨载荷与因子相关正则化的交互作用，发现一致先验组合可提高收敛稳定性，非稀疏结构中Horseshoe与Spike-and-Slab在载荷估计上优于Lasso，稀疏结构中PCFAwRFC显著降低假阳性。研究四在复杂多因子结构中，PCFAwPRFC能有效区分一般因子与特殊因子的相关模式，Horseshoe对样本量和Q矩阵不敏感但假阳性较高，Lasso与Spike-and-Slab在更多未定载荷下稀疏性更强但可能低估非零相关。实证应用显示，部分正则化显著提高模型拟合度，并揭示特殊因子间的细微依赖关系。

在讨论部分，研究人员指出，因子相关正则化弥补了传统逆威沙特先验的不足，尤其在稀疏或部分稀疏结构中优势明显。Lasso表现稳健均衡，Spike-and-Slab适合大样本高精度场景，Horseshoe在稳定性上具优势但需警惕假阳性。显著性准则在识别零相关方面优于阈值法。未来研究可探索直接在相关矩阵层面施加稀疏性，并扩展至广义PCFA以处理分类与混合数据类型。该框架为贝叶斯正则化因子分析提供了灵活统一的先验选择基础，有助于在理论与实证研究中平衡解释性、简约性与结构复杂度。

联系信箱：

粤ICP备09063491号

热点排行