肯尼亚干旱易发地区急性营养不良负担的预测：一项统计分析

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《PLOS Global Public Health》：Predicting the burden of acute malnutrition in drought-prone regions of Kenya: A statistical analysis

【字体：大中小】 时间：2026年04月13日 来源：PLOS Global Public Health 2.5

编辑推荐：

　　在干旱易发地区，及时且精细化的急性营养不良负担预测可为决策提供支持。研究人员探索了 routinely collected 和/或公开可用数据是否可以用于预测肯尼亚干旱和半干旱地区全球急性营养不良（global acute malnutrition, GAM）

在干旱易发地区，及时且精细化的急性营养不良负担预测可为决策提供支持。研究人员探索了 routinely collected 和/或公开可用数据是否可以用于预测肯尼亚干旱和半干旱地区全球急性营养不良（global acute malnutrition, GAM）和严重急性营养不良（severe acute malnutrition, SAM）的患病率，以及 mean weight-for-height Z-score（WHZ）和 middle-upper-arm circumference for age Z-score（MUACZ），该地区干旱预计将增加发生频率和强度。研究涵盖肯尼亚北部六个县份以及2015-2019年期间，其间发生了一次重大干旱。为验证模型，研究人员获取并整理了覆盖一个或多个次县的所谓 SMART（Standardised Monitoring and Assessment of Relief and Transitions）人体测量调查数据，共计79个明确调查层（explicit survey strata）和44,218个个体儿童观察值。研究人员将这些调查与在次县或县级层面指定的预测因子相关联，包括气候、粮食安全、观察到的营养不良、流行病发病率、卫生服务利用和其他社会条件。研究人员探索了广义线性或可加模型（generalised linear or additive models）以及随机森林（random forests），并使用交叉验证量化了它们的样本外表现。在大多数县份，调查估计的营养指标在2016年10月至2019年12月干旱期间最差；干旱期间还出现了不安全局势的峰值和疫苗接种的急剧下降。候选模型表现中等，随机森林略优于广义线性模型。最有希望的表现出现在全球急性营养不良患病率的预测上。该研究未能识别出可以非常准确预测营养不良负担的模型，但依赖更大数据集、包含更广泛预测因子并涵盖多个干旱时期的分析可能会产生足够的性能，考虑到预测模型替代假设或昂贵且滞后的地面数据收集的潜在效用和效率，这类研究是值得开展的。

**研究背景与问题**

急性营养不良（acute malnutrition）或消瘦（wasting）是儿童死亡和不良妊娠结局的主要潜在因素之一。过去几十年间，在受危机影响的人群中，特别是在急性粮食不安全时期，观察到极高的急性营养不良患病率。干旱条件对非洲之角干旱和半干旱地区（包括肯尼亚北部）的粮食安全构成重大威胁，且由于气候变化，预计该地区干旱将更频繁、更强烈地发生。了解急性营养不良的人群负担（患病率）具有多重目的，包括选择适当时机的粮食安全、营养和健康干预措施（如现金转移、普遍喂养分发、严重和/或中度营养不良管理）、资源动员、预期病例水平的物流规划以及对正在进行的应对措施的监测。在干旱影响环境中，测量急性营养不良患病率的主要手段是所谓标准化监测与救济过渡评估（Standardised Monitoring and Assessment of Relief and Transitions, SMART）调查，这是通常在二级或更低行政层面开展的高度标准化数据收集活动，目标人群为6-59个月龄（months old, mo）的主要风险儿童群体。过去十年间，SMART调查从技术支持和软件方面获益，质量有所改善，但其实施仍较为昂贵，全球估计每次调查成本为1-4万美元不等，且无法在所有可能受影响的地区持续开展。虽然基于哨点的方法也曾被尝试，且减少调查样本量的方法已被证明可行，但目前尚无能够高效、及时且具备地理精细化程度的估计方法。公共卫生不同领域中，基于多源现有或常规收集数据的统计分析已被用于仅通过二次、桌面分析提供估计。这种方法可为调查提供补充且更为廉价的替代方案，支持政府和人道主义行为体及时检测恶化状况并高效应对。

研究人员此前已证明，预测性小区域估计模型在南苏丹和索夫准确地预测急性营养不良患病率。本研究聚焦于肯尼亚干旱和半干旱县份，依赖略有不同的数据范围，开展类似研究。

**研究方法概述**

研究人员纳入肯尼亚北部Baringo、Garissa、Isiolo、Mandera、Marsabit、Samburu、Tana River、Turkana、Wajir和West Pokot十个县及其所有次县，分析时期为2015年1月至2019年12月，涵盖2016年10月至2018年底非洲之角急性干旱期。研究区域人口估计为817万。

数据来源方面，人体测量数据来自研究区域内所有可用的SMART调查原始数据集和报告，采用多阶段整群抽样设计，共79个明确调查层、44,536个儿童观察值，排除后44,218个（99.3%）纳入分析。预测因子选取遵循两个已发表的急性营养不良因果框架，涵盖气候（标准化归一化植被指数standardised normalised difference vegetation index, S-NDVI；归一化植被指数NDVI；降水和温度异常）、粮食安全（哨点市场价格、放牧区状况）、观察到的营养不良（中度急性营养不良moderate acute malnutrition, MAM和SAM治疗入院率）、流行病发病率（霍乱、麻疹病例）、卫生服务利用（五联疫苗DpT覆盖率、麻疹腮腺炎风疹疫苗measles, mumps, rubella vaccine, MMR覆盖率、安全助产分娩率）及其他社会条件（不安全事件和死亡数、夜间灯光指数作为贫困代理变量）共15类指标，均求取前3个月和前6个月的右对齐滚动均值。人口分母采用WorldPop 100m2像素年度估计值聚合至次县层面并插值为月度值。

统计分析方法上，研究人员开发了四类结局的模型：GAM、SAM（二分类，假设二项分布）以及WHZ、MUACZ（连续型，假设高斯分布）。模型类别包括：（i）广义线性或可加模型（generalised linear or additive models），使用R mgcv包，含预测因子组合、可加平滑项和/或县级随机效应；（ii）随机森林（random forests），使用ranger包，1000棵树、每节点最多5个分裂变量。通过单变量分析的Akaike Information Criterion（AIC）筛选最优滚动平均期（3个月 vs 6个月），并按AIC由低到高逐步纳入变量构建多变量模型，避免高度相关变量对。以调查明确层为单位进行留一交叉验证（leave-one-out cross-validation, LOOCV），评估样本外预测性能，指标包括绝对偏倚、平均绝对误差、给定精度边界的预测概率，以及对10%和15%危机严重阈值的灵敏度。

**研究结果**

**人体测量调查模式**

共44,536个儿童观察值，排除后44,218个纳入，每层平均560个。调查覆盖不均衡，Turkana次县观察值最多，Garissa最少。总体而言，2017年SAM/GAM患病率最高（WHZ/MUACZ最低），但同一县份内不同层间差异显著，Marsabit和Turkana县内变异大，而Samburu和Wajir县变异相对较小。

**预测因子模式**

县级预测因子趋势显示，干旱 onset 通过NDVI和标准化NDVI追踪较降水异常更为明显。所有哨点市场谷物价格上涨，Garissa和Mandera持续上升。干旱期间，Turkana和Marsabit的MAM和SAM入院率显著增加，Isiolo延迟达到峰值。干旱期通常与不安全事件和死亡峰值、疫苗接种产出急剧下降同时发生。霍乱和麻疹流行也发生于该时期，但主要出现在干旱期外，Tana River峰值最大。

**预测模型性能**

**广义线性或可加模型**：单变量分析中，(S)NDVI和近期SAM或MAM治疗入院率与各结局关联最强。多变量模型中，GAM和SAM患病率保留广义线性模型，WHZ和MUACZ的可加版本略优。所有模型偏倚可忽略，但仅少数预测落在较严格的误差边界内。模型对GAM≥15%、SAM≥2%阈值灵敏度较高，但提高至GAM≥20%、SAM≥5%时灵敏度降低。

**随机森林模型**：每节点最多3个分裂变量的随机森林在除MUACZ外所有结局上视觉略优于广义线性/可加模型，每节点5个分裂变量亦表现中等。

**讨论与结论**

**关键发现**

尽管肯尼亚营养监测系统近年更为系统化，但地面数据匮乏仍阻碍干旱营养和公共卫生应对的及时性与地理靶向性。本研究探索的预测建模方法未能产生令人信服的高性能模型。虽对较低阈值的灵敏度尚可，但该阈值包含大多数观察点估计值，在肯尼亚背景下检测从基线显著恶化的效用有限。仅GAM患病率的随机森林模型对≥20%阈值具有合理灵敏度，在此调查数据池中可识别异常升高的营养不良。

**研究背景中的发现**

肯尼亚模型表现虽令人失望，但基于不同预测变量，仍高于此前索马里和南苏丹研究。其他亚区域尺度儿童营养不良预测尝试结果不一：基于人口健康调查数据和遥感预测因子的发育迟缓模型在孟加拉国表现尚可但加纳不佳；一项非洲营养不良小区域估计标志性研究依赖大规模全国性调查和广泛静态及动态预测因子，对发育迟缓预测性能高、对消瘦合理，但其预测因子和数据可能无法提供预测干旱发展期内营养状况恶化所需的Temporal resolution。孟加拉国随机森林模型在预测孕产妇营养不良方面优于其他方法，但基于人口健康调查期间收集的个体层面预测因子，未能规避数据收集需求，更适用于个体筛查和病例识别。

**局限性**

主要受限于可开发和评估模型的数据数量和质量。SMART数据质量良好，但调查时期仅涵盖单次干旱期，且部分县份干旱与营养指标剧烈变化无显著相关，导致模型判别统计变异有限。预测因子范围亦受限，反映研究区域和时期内一致可用性和地理指定的数据集。更具体的粮食不安全数据（如贸易条件、家庭应对机制采纳率）可能改善预测性能，但无法在次县层面以足够时间粒度获取以与SMART调查层链接。研究未调查替代模型如lasso回归或神经网络，后者虽可能更适宜多协变量预测，但同样面临样本外预测挑战。预测因子与结局关系可能非时间恒定，模型在数据来源期内表现良好但后期可能下降。研究结果仅适用于肯尼亚情境。

**结论**

研究人员识别出广义线性及更具前景的机器学习（随机森林）模型，对肯尼亚不同儿童急性营养不良指标产生中等预测性能。特别是GAM模型可能替代经验猜测以支持实时态势感知和恶化营养决策，但其相对于专家判断的优势尚不明确，任何使用需伴随决策者培训以确保考虑模型不确定性。若可获取更长时序数据（关键应包含地面测量急性营养不良负担的多个峰谷，即更丰富的结局变异，如更新至当前以纳入2022-2023年干旱）以及更广泛一致可用的预测数据（包括更多发病率、卫生服务绩效指标及市场价格外的粮食不安全度量），这些模型或可改进。在干旱为已知威胁且持续初级数据收集成本与可行性严重制约监测的地区（如肯尼亚北部），预测建模方法仍具吸引力。

联系信箱：

粤ICP备09063491号

热点排行