《Structural Equation Modeling: A Multidisciplinary Journal》:Alternative Bayesian Regularizations for Factor Correlations and Loadings: Lasso, Spike-and-Slab, and Horseshoe
编辑推荐:
研究人员将贝叶斯图形建模嵌入部分验证性因子分析(PCFA, Partially Confirmatory Factor Analysis)中,用于估计稀疏潜因子相关矩阵,从而克服逆威沙特(inverse-Wishart)先验的局限性。研究人员利用图形Lasso
研究人员将贝叶斯图形建模嵌入部分验证性因子分析(PCFA, Partially Confirmatory Factor Analysis)中,用于估计稀疏潜因子相关矩阵,从而克服逆威沙特(inverse-Wishart)先验的局限性。研究人员利用图形Lasso、Horseshoe和Spike-and-Slab先验对因子相关矩阵进行正则化,形成一个统一框架,同时对载荷与因子相关施加稀疏性约束。针对复杂结构,研究人员进一步引入多特质多方法(MTMM, Multitrait-Multimethod)及扩展双因子模型的部分正则化。仿真实验表明,在大样本、复杂或稀疏条件下,Spike-and-Slab先验在控制假阳性及提高准确性方面表现最优;Horseshoe先验在不同样本量下表现稳定但假阳性率较高;Lasso先验则呈现中等且稳定的性能。在模型识别方面,基于显著性的准则优于基于阈值的规则,尤其适用于复杂设计与实证分析。应用于人格量表数据的结果显示,部分正则化提升了因子相关与载荷估计的可解释性及模型拟合度。
该研究发表于《Structural Equation Modeling: A Multidisciplinary Journal》,聚焦于潜因子模型中因子相关矩阵的估计问题。传统方法多采用逆威沙特(inverse-Wishart)先验,但无法有效处理稀疏结构,易导致噪声相关增加、可解释性降低及过拟合。已有部分验证性因子分析(PCFA)虽可对载荷施加Lasso正则化,但对因子相关的先验仍缺乏稀疏诱导机制。为此,研究人员提出PCFAwRFC(PCFA with Regularized Factor Correlation)框架,将贝叶斯图形模型应用于潜因子相关矩阵,并扩展至复杂结构的PCFAwPRFC(PCFA with Partial Regularized Factor Correlation),分别针对一般因子与特殊因子采用不同正则策略。仿真结果显示,Spike-and-Slab先验在大样本与稀疏结构中具最佳假阳性控制能力,Horseshoe先验稳定性强但假阳性略高,Lasso先验表现均衡可靠。显著性识别准则优于阈值法。实证分析表明,该方法能改善人格量表的结构解释与拟合。
关键技术方法方面,研究人员基于贝叶斯图形建模,分别对因子相关矩阵施加图形Lasso、Horseshoe与Spike-and-Slab三种稀疏先验,并在复杂模型中结合逆威沙特先验与正则化策略。模拟数据涵盖不同样本量(N=250、500、1000)、因子数(K=3、5、10)及稀疏水平,使用马尔可夫链蒙特卡洛(MCMC)算法进行参数估计,并通过潜在尺度缩减因子(EPSR)检验收敛性。实证数据来自法国版DSM-5短式人格量表(PID-5-SF),包含2532名被试,涵盖5个一般因子与15个特殊因子,共60个项目。
研究结果分为四个仿真研究及一个实证应用。研究一在低维全相关结构中,各先验均能准确恢复参数,但小样本下Spike-and-Slab表现略有下降,逆威沙特因计算效率高仍为优选。研究二在高维稀疏结构中,正则化方法显著优于逆威沙特,Spike-and-Slab在极高稀疏条件下假阳性最低,显著性准则比阈值法稳健。研究三探讨载荷与因子相关正则化的交互作用,发现一致先验组合可提高收敛稳定性,非稀疏结构中Horseshoe与Spike-and-Slab在载荷估计上优于Lasso,稀疏结构中PCFAwRFC显著降低假阳性。研究四在复杂多因子结构中,PCFAwPRFC能有效区分一般因子与特殊因子的相关模式,Horseshoe对样本量和Q矩阵不敏感但假阳性较高,Lasso与Spike-and-Slab在更多未定载荷下稀疏性更强但可能低估非零相关。实证应用显示,部分正则化显著提高模型拟合度,并揭示特殊因子间的细微依赖关系。
在讨论部分,研究人员指出,因子相关正则化弥补了传统逆威沙特先验的不足,尤其在稀疏或部分稀疏结构中优势明显。Lasso表现稳健均衡,Spike-and-Slab适合大样本高精度场景,Horseshoe在稳定性上具优势但需警惕假阳性。显著性准则在识别零相关方面优于阈值法。未来研究可探索直接在相关矩阵层面施加稀疏性,并扩展至广义PCFA以处理分类与混合数据类型。该框架为贝叶斯正则化因子分析提供了灵活统一的先验选择基础,有助于在理论与实证研究中平衡解释性、简约性与结构复杂度。