
-
生物通官微
陪你抓住生命科技
跳动的脉搏
SARS-CoV-2与气候因素:一项基于纵向计数数据的线性回归与分位数回归模型研究
《BMC Public Health》:SARS-CoV-2 and climate factors: a study between linear regression and quantile regression model using longitudinal count data
【字体: 大 中 小 】 时间:2026年04月08日 来源:BMC Public Health 3.6
编辑推荐:
摘要背景回归是最常用的统计工具,用于评估预测变量和响应变量之间的关系。然而,SARS-CoV-2的感染人数通常呈右偏态、异方差性,并且会出现周期性激增。在纵向流行病学数据中,基于均值的线性回归——它依赖于同方差性和正态性的假设——可能无法完整地反映传播动态,尤其是在极端疫情爆发期
回归是最常用的统计工具,用于评估预测变量和响应变量之间的关系。然而,SARS-CoV-2的感染人数通常呈右偏态、异方差性,并且会出现周期性激增。在纵向流行病学数据中,基于均值的线性回归——它依赖于同方差性和正态性的假设——可能无法完整地反映传播动态,尤其是在极端疫情爆发期间对估计结果产生不成比例的影响时。分位数回归提供了一种灵活的替代方法,它允许协变量效应在响应变量的条件分布中发生变化,从而捕捉不同传播机制下的异质性效应。这一特性对于理解疫情极端情况尤其有用。本研究的目的是利用分位数回归确定SARS-CoV-2感染病例的预测因素,并在多个分位数上比较各种模型。
本研究使用的数据来自孟加拉国达卡的流行病学疾病控制与研究所(IEDCR)的网站。以每日温度和湿度以及每日感染病例数为预测变量,将每日SARS-CoV-2感染病例数作为响应变量,研究时间为2020年3月8日至2023年5月31日。我们进行了经典均值回归和分位数回归,以了解气候变量之间的关联,并在不同分位数上比较了结果。
在均值回归和分位数回归框架下,我们发现高温和高湿度对SARS-CoV-2的传播有显著影响(以对数尺度表示),这种影响在不同分位数水平上有所不同(0 < τ < 1)。随着感染分位数的增加,温度的效应逐渐减弱。在最高分位数(第95百分位数)时,温度效应从正向变为轻微负向(-1.8%),在第25百分位数时为10.2%。湿度在所有分位数上均呈正相关,但相关强度逐渐减弱。当τ = 0.25、0.50、0.75、0.90和0.95时,湿度效应随着分位数的增加而显著下降,分别为8.2%、3.9%、1.5%、2.1%和2.0%。我们还使用HQC、AIC、BIC值比较了条件分位数模型,发现当τ = 0.75时,分位数回归模型在所有条件分布下的拟合度相对稳定。
本研究结果表明,温度和湿度对孟加拉国的SARS-CoV-2传播有显著影响,且在不同感染强度水平上表现出异质性效应。通过建模条件分布的多个点,分位数回归比基于均值的方法提供了对疫情行为的更全面理解。回归模型还表明,即使在感染率较低的情景下,温暖和潮湿的条件也与较高的感染水平相关。然而,分位数回归对分布不具有选择性,这既是本研究的优势也是局限性。尽管如此,由于数据具有纵向特性且模型没有明确纳入动态时间结构,因此应将结果解释为关联关系而非因果关系。未来结合时间序列分位数或自回归框架的研究可能会进一步阐明气候在疫情发展中的作用。
回归是最常用的统计工具,用于评估预测变量和响应变量之间的关系。然而,SARS-CoV-2的感染人数通常呈右偏态、异方差性,并且会出现周期性激增。在纵向流行病学数据中,基于均值的线性回归——它依赖于同方差性和正态性的假设——可能无法完整地反映传播动态,尤其是在极端疫情爆发期间对估计结果产生不成比例的影响。分位数回归提供了一种灵活的替代方法,它允许协变量效应在响应变量的条件分布中发生变化,从而捕捉不同传播机制下的异质性效应。这一特性对于理解疫情极端情况尤其有用。本研究的目的是利用分位数回归确定SARS-CoV-2感染病例的预测因素,并在多个分位数上比较各种模型。
本研究使用的数据来自孟加拉国达卡的流行病学疾病控制与研究所(IEDCR)的网站。以每日温度和湿度以及每日感染病例数为预测变量,将每日SARS-CoV-2感染病例数作为响应变量,研究时间为2020年3月8日至2023年5月31日。我们进行了经典均值回归和分位数回归,以了解气候变量之间的关联,并在不同分位数上比较了结果。
在均值回归和分位数回归框架下,我们发现高温和高湿度对SARS-CoV-2的传播有显著影响(以对数尺度表示),这种影响在不同分位数水平上有所不同(0 < τ < 1)。随着感染分位数的增加,温度的效应逐渐减弱。在最高分位数(第95百分位数)时,温度效应从正向变为轻微负向(-1.8%),在第25百分位数时为10.2%。湿度在所有分位数上均呈正相关,但相关强度逐渐减弱。当τ = 0.25、0.50、0.75、0.90和0.95时,湿度效应随着分位数的增加而显著下降,分别为8.2%、3.9%、1.5%、2.1%和2.0%。我们还使用HQC、AIC、BIC值比较了条件分位数模型,发现当τ = 0.75时,分位数回归模型在所有条件分布下的拟合度相对稳定。
本研究结果表明,温度和湿度对孟加拉国的SARS-CoV-2传播有显著影响,且在不同感染强度水平上表现出异质性效应。通过建模条件分布的多个点,分位数回归比基于均值的方法提供了对疫情行为的更全面理解。回归模型还表明,即使在感染率较低的情景下,温暖和潮湿的条件也与较高的感染水平相关。然而,分位数回归对分布不具有选择性,这既是本研究的优势也是局限性。尽管如此,由于数据具有纵向特性且模型没有明确纳入动态时间结构,因此应将结果解释为关联关系而非因果关系。未来结合时间序列分位数或自回归框架的研究可能会进一步阐明气候在疫情发展中的作用。