《Current Developments in Nutrition》:A novel automated participant-recorded dietary data collection method using low-cost mobile phones and Interactive Voice Response (IVR) with low-literacy women: a validation study in rural Uganda
编辑推荐:
为解决中低收入国家膳食质量监测中资源密集型、面对面调查方法带来的数据缺口问题,研究人员在乌干达农村开展了一项探索性研究。他们评估了利用基本功能手机和互动语音应答(IVR)系统,由参与者自主记录的清单式24小时膳食回顾法,在收集妇女膳食多样性等关键指标方面的有效性。研究发现,与金标准称重食物记录法相比,该IVR方法在评估人群水平的妇女最低膳食多样性(MDD-W)、膳食多样性评分(WDDS)及不健康食物/饮料消费比例时,显示出中度一致性。这表明,该自动化、低成本的方法在资源匮乏的农村地区,为监测女性膳食质量、填补实时数据缺口提供了一种可行的补充工具。
在全球范围内,低膳食质量和营养不良仍然是导致疾病和死亡的主要风险因素,而低收入和中等收入国家(LMICs)的妇女和儿童受到的影响尤为严重。要监测和改善她们的营养状况,首先需要准确、及时地了解她们吃了什么。然而,现实情况是,在这些国家,尤其是在偏远农村地区,获取膳食数据面临巨大挑战。传统上依赖调查员入户的面对面访谈方法,不仅耗费大量人力物力,而且在基础设施薄弱、交通不便、甚至因冲突或疫情而行动受限的地区难以实施。这造成了严重的膳食数据缺口,限制了有效食品政策和营养项目的设计与评估。
与此同时,一场静悄悄的通讯革命正在发生。手机,特别是基本功能手机,已成为中低收入国家普及最快、覆盖最广的双向通讯工具。这为弥补数据缺口带来了新的希望。但现有的手机调查方法大多仍需调查员参与,或者依赖短信、网络,这无形中将大量低识字率人群排除在外。那么,能否开发一种方法,让农村的低识字率妇女也能利用她们熟悉或容易上手的基本手机,自主、便捷地报告自己的饮食情况,从而为公共卫生决策提供实时、低成本的数据支持呢?
为了回答这个问题,一个由Lydia O’Meara、Kate Wellard、Joweria Nambooze、Patrick Ongora、Paula Domínguez-Salas和Elaine Ferguson组成的研究团队,在乌干达北部的农村地区进行了一项开创性的验证研究。他们评估了一种全新的自动化数据收集方法:利用基本功能手机和互动语音应答(Interactive Voice Response, IVR)系统,由参与者自己按键回答“是/否”,完成一份清单式的24小时膳食回顾。研究旨在检验这种方法在评估农村妇女关键膳食质量指标方面的有效性,相关成果已发表在《Current Developments in Nutrition》期刊上。
为开展此项研究,研究人员运用了几个关键技术方法:1)基于IVR的自动化膳食回顾:研究改编了乌干达人口健康调查的膳食多样性模块,翻译成当地语言(Lleblango)并录制成音频问卷,通过engageSPARK平台编程实现自动化拨打、提问、记录按键回答(1=是,3=否),并具备断线重连功能,使用项目提供的Techno T301基本手机进行。2)金标准对照方法——观察性称重食物记录法:在IVR调查的同一天,由经过培训的女性调查员从早到晚(06:30-21:00)跟随参与者,使用精度为±1g的电子秤(Salter)称量并记录其所有食物和饮料的摄入量,包括在家和外食的部分,作为验证的“金标准”。3)两阶段随机抽样构建研究队列:研究在乌干达北部的Apac和Kwania地区,通过两阶段随机抽样,选取了156对18-49岁哺乳期或非孕非哺(NPNL)妇女及其12-23月龄幼儿的母子对,在2022年雨季(8月29日-11月3日)进行数据收集。4)多维度的统计效度分析:通过比较IVR与称重法得出的妇女膳食多样性评分(WDDS)、最低膳食多样性(MDD-W)及不健康食物/饮料消费比例,使用加权Cohen‘s kappa、Bland-Altman图、McNemar’s检验等多种统计方法评估两种方法间的一致性。
结果
样本特征
共有156名妇女参与研究,其中116人(74.4%)成功完成了IVR调查。未能完成的主要原因是网络信号差。参与者普遍生活在贫困和粮食不安全的环境中,大多数女性教育水平低(75%未完成小学教育),近三分之一是文盲,且28.5%的女性身体质量指数(BMI)<18.5 kg/m2,属于消瘦。绝大多数女性(69.8%)不拥有手机,但通常可以通过家庭成员(主要是配偶)接触到手机。
WDDS的方法间一致性
IVR估计的平均WDDS为3.3,与称重法记录的3.5(>0g阈值)和3.3(≥15g阈值)相比,无显著差异。根据加权Cohen‘s kappa值判断,IVR与称重法在WDDS上的一致性为“一般”(>0g时kappa=0.39;≥15g时kappa=0.30)。Bland-Altman分析显示两种方法之间不存在系统性的均值偏差,但一致性界限(LOA)较宽,且存在比例偏差,即在WDDS较低和较高时,两种方法的差异更大。0g (any) and B: ≥15g minimum requirements for rural Northern Ugandan women (n=116).">
MDD-W的方法间一致性
IVR估计的达到MDD-W(消费≥5个食物组)的妇女比例为21.6%,与称重法使用>0g阈值时的17.2%相比,无显著差异;但与使用≥15g阈值时的9.5%相比,则显著高估。IVR与称重法在MDD-W判断上的一致性百分比很高(>82%),Cohen’s kappa值显示为“中度”一致(>0g时kappa=0.48)和“一般”一致(≥15g时kappa=0.36)。
不健康食物和饮料的方法间一致性
IVR估计的消费不健康食物和含糖饮料的妇女比例分别为34.5%和32.8%。与称重法相比,含糖饮料的估计无显著差异,但不健康食物的估计显著偏高。两种方法在不健康食物和含糖饮料判断上的一致性均为75%,Cohen‘s kappa值显示为“中度”一致(均为0.43-0.44)。
食物组的一致性
IVR在报告鱼类/肉类/家禽、深绿色叶菜(DGLV)和奶类等营养丰富的食物时准确性较高。但它高报了富含维生素A的水果/蔬菜和不健康食物,低报了谷物/白色块根、豆类和“其他蔬菜”。当使用≥15g的最低消费量阈值时,食物组的误报率更高。
可接受性
绝大多数参与者报告了积极的IVR使用体验,超过95%的人愿意在未来研究中继续使用这种方法进行膳食报告。
结论与讨论
这项研究首次在撒哈拉以南非洲资源匮乏的农村地区,验证了基于基本手机和IVR的、由参与者自主记录的清单式24小时膳食回顾法,用于评估低识字率妇女膳食质量指标的可行性。研究表明,经过简短的培训,这种基于语音和按键应答的方法可以有效跨越识字障碍。与金标准称重食物记录法相比,其在评估人群水平的妇女最低膳食多样性(MDD-W)、膳食多样性评分(WDDS)及不健康食物/饮料消费比例时,显示出“一般”到“中度”的一致性,表明该方法可用于监测人群水平的膳食质量趋势和识别组间差异。
然而,研究也指出了重要局限。Bland-Altman图中宽的一致性界限表明,该方法在个体水平的评估上准确性有限,其结果不应被用于探究膳食多样性与健康结局之间的关联。IVR在报告某些食物组(如富含维生素A的食物、豆类)时存在特定的高报或低报模式,这可能是由于问题顺序、当地食物分类理解差异,以及清单式回忆法本身固有的提示效应所致。此外,使用≥15g的消费阈值比使用>0g阈值带来了更多误报,突显了在自动化工具中实施定量阈值的挑战。
这项研究的重要意义在于,它为解决中低收入国家长期存在的膳食数据收集难题,提供了一种低成本、自动化且易于推广的替代方案。在气候事件、冲突或公共卫生危机限制调查员活动的时期,这种方法能够实现对“哨点”人群的高频监测,及时捕捉膳食质量的季节性变化或突发冲击,为精准营养干预提供实时数据支持。尽管在操作的简易性和数据的精确性之间存在权衡,且对低识字率参与者进行培训是必要的,但IVR方法展现出作为传统大型营养调查有力补充的潜力。随着女性手机拥有率的不断提升,以及方法的进一步优化(如精炼问题措辞、确定当地“哨点食物”),这种工具有望在更广泛的低资源环境中推广应用,助力实现更公平、更及时的营养监测目标。