《The Journal of Nutrition》:Interpersonal Communication and Maternal Behavioral Practice: A Case Study of Explanatory Causal Machine Learning in Nepal
编辑推荐:
背景:当前关注的重点不仅在于项目是否产生了效果,还在于这些效果是通过何种机制产生的。营养干预研究经常强调营养教育干预的作用,但较少有研究考察这些干预实现效果的具体路径。
目的:评估母亲暴露于与一线工作者的人际传播(IPC)后,对行为实践的总效应,以及该效应通
背景:当前关注的重点不仅在于项目是否产生了效果,还在于这些效果是通过何种机制产生的。营养干预研究经常强调营养教育干预的作用,但较少有研究考察这些干预实现效果的具体路径。
目的:评估母亲暴露于与一线工作者的人际传播(IPC)后,对行为实践的总效应,以及该效应通过两个关键路径——意识提升与知识改善——发挥作用的程度。同时,研究还开展了比较性个案研究,考察机器学习(ML)方法与结构方程模型(SEM)方法之间的差异。
方法:研究使用准实验性Suaahara研究终线横断面调查数据,样本为2040名育有2岁以下儿童的母亲。研究采用机器学习(ML)与传统结构方程模型(SEM),估计母亲暴露于与一线工作者的人际传播(IPC)后对其营养相关实践的总效应,以及通过意识与知识改善产生的间接效应。模型对家庭、儿童和母亲因素以及家庭所在地进行了调整。
结果:母亲暴露于与一线工作者的人际传播(IPC)后,能够更多践行理想的、被推广的营养相关实践。两种方法得出的总效应相近——ML:0.58(置信区间(CI):[0.37,0.78]),SEM:0.60(CI:[0.49,0.72]);然而,ML模型将总效应中更大比例归因于通过意识和知识发挥作用的间接效应(ML:0.24,CI:[0.15,0.33];SEM:0.16,CI:[0.09,0.21])。
结论:暴露于人际传播(IPC)对于改善营养相关实践具有重要意义,部分原因在于其提升了个体的意识与知识。ML与SEM结果之间的差异提示,效应生成过程较简单线性模型所能捕捉的情况更为复杂,表现为意识、知识、干预及协变量之间更强的非线性和交互性关系。
该文发表于《The Journal of Nutrition》,聚焦尼泊尔母婴营养干预中人际传播(IPC,interpersonal communication)的作用机制问题。在全球营养不良负担依然沉重、2030年全球营养目标实现前景严峻的背景下,母亲教育与行为改变传播被视为改善母婴营养状况的重要抓手。既有研究虽然普遍认为社会与行为改变传播(SBCC,social and behavior change communication)特别是人际传播,能够改善喂养、膳食多样性、母婴保健与卫生行为,但对“为何有效、通过何种路径起效”的机制性证据仍然不足。尤其在营养干预评估中,研究往往停留于检验平均效果,而较少进一步识别干预是通过提升意识、增强知识,还是通过其他路径推动行为改变。因此,开展本研究的必要性在于:一方面验证Suaahara项目中人际传播是否真正促进母亲营养相关行为实践;另一方面检验项目理论路径中“意识—知识—实践”的中介链条是否成立,并比较传统结构方程模型与现代因果机器学习方法在机制识别上的差异。
研究人员基于尼泊尔Suaahara项目终线调查数据,围绕“母亲与一线工作者的人际传播暴露是否促进理想营养相关实践”这一核心问题展开分析。研究不仅估计总效应,还进一步分解直接效应与通过意识、知识传递的间接效应,从而判断行为改变理论中的关键中介机制是否得到经验支持。研究结果表明,母亲接受一线工作者的人际传播后,确实会更多采纳被倡导的理想营养相关行为;同时,这种作用部分通过提升母亲对关键营养信息的意识和知识而实现。更重要的是,机器学习方法识别出的间接效应明显大于结构方程模型,提示干预效果的生成并非简单线性过程,而更可能涉及意识、知识、干预暴露与个体背景因素之间复杂的非线性与交互关系。该研究的重要意义在于,它不仅为SBCC项目中IPC的行为改变机制提供了更坚实的经验依据,也说明在复杂公共卫生干预评估中,解释性因果机器学习方法可能较传统线性模型更适合揭示真实作用路径。
在技术方法上,研究利用Suaahara准实验影响评估终线横断面数据,对8个地区采用多阶段整群抽样,纳入2040名育有2岁以下儿童的母亲。暴露变量为是否接受Suaahara一线工作者入户访问或电话沟通;结局变量、意识变量和知识变量均依据11项营养相关理想实践构建0–11分连续量表。分析方面,研究在潜在结局(potential outcomes)框架下,采用靶向学习(targeted learning)与靶向最小损失估计(TMLE,targeted minimum loss estimation),结合超级学习器(super learner)整合广义加性模型、随机森林、极端梯度提升等算法估计总效应、纯直接效应和总自然间接效应;同时以结构方程模型(SEM)作为对照,并进行未观测混杂敏感性分析。
在结果部分,论文首先报告“Sample characteristics”。样本中儿童平均月龄为12个月,母亲平均年龄为26岁,约五分之一母亲未完成小学教育,略低于一半家庭来自Brahmin/Chhetri种姓群体。约三分之一母亲暴露于Suaahara的IPC。对于11项关键营养相关行为,母亲平均知晓约9项信息、准确掌握近7项理想实践知识、实际践行接近5项。这一结果说明,样本总体在意识层面相对较高,但知识与实践之间仍存在明显落差,也为后续分析“意识与知识是否构成从干预到实践的传递环节”奠定了基础。
随后,在“Descriptive statistics by maternal exposure status”相关结果中,研究比较了暴露组与未暴露组的无条件均值差异。结果显示,接受IPC的母亲在社会经济地位、教育水平和种姓结构上相对更具优势,且更少来自弱势社区,提示暴露并非随机分布,必须在分析中进行协变量调整。与此同时,暴露于IPC与意识提高1.05分、知识提高0.79分、实践提高0.91分相关。这一发现初步说明,IPC与中介变量及行为结果均呈正向关联,但仍需进一步通过因果估计方法识别调整后的净效应。
在“Effects by estimator and approach”部分,研究报告了最核心的效应估计结果。经调整家庭社会经济状况、种姓/族群、儿童年龄、母亲年龄、母亲教育、社会赞许性、家庭结构、弱势社区属性以及社区位置后,母亲暴露于一线工作者IPC对理想营养相关实践具有稳定正向总效应。TMLE估计总效应为0.60,95%置信区间为[0.49,0.72];SEM估计总效应为0.58,95%置信区间为[0.37,0.78]。这意味着,接受IPC平均可使母亲多采纳约0.6项理想行为实践,标准化效应约为0.35–0.36个标准差。更关键的是,二者在效应分解上存在差异:SEM认为约27%的总效应经由意识与知识中介实现,间接效应为0.16,直接效应为0.42;TMLE则认为约40%的总效应经由意识与知识传递,间接效应为0.24,直接效应为0.36。也就是说,机器学习方法识别出的中介作用较SEM大约高出50%。这一结果支持项目影响路径,也提示线性SEM可能低估了意识与知识的传递作用。
在“Cross-validated mean-squared error”部分,研究进一步比较两种方法对数据关系的拟合能力。交叉验证均方误差显示,弹性网络回归、广义加性模型和随机森林等算法通常优于线性SEM,而将多种算法加权整合后的超级学习器对意识、知识和实践三个变量的拟合表现最优。与SEM相比,超级学习器平均将意识、知识和实践模型的均方误差分别降低约2%、2%和4%,解释的方差分别增加约4%、5%和8%。该结果说明,行为实践与意识、知识及协变量之间确实存在SEM未充分捕捉的复杂函数关系,而TMLE结合超级学习器能够更好追踪这些非线性和交互模式,这也是其识别出更大间接效应的重要方法学原因。
在“Sensitivity analysis”部分,研究检验了间接效应对未观测混杂的稳健性。结果表明,如果遗漏变量的影响程度与已观测协变量大体相当,则原始间接效应推断总体较为稳健。例如,遗漏母亲社会赞许性后,间接效应估计变化有限;若存在一个与之关系相当的未观测变量,被遗漏后推导出的间接效应置信区间仍排除零效应。对社区位置变量的分析显示,其对结果的影响最大:若省略社区效应,间接效应将从0.24升至0.39;若存在与社区变量影响相当的未观测混杂,则原始间接效应可能降至0.09,但其置信区间仍勉强排除零值。该结果一方面支持中介推断具有一定稳健性,另一方面强调社区构成与社区过程在营养行为研究中的重要性。
在讨论部分,研究人员指出,本研究证实了尼泊尔Suaahara项目中IPC对母亲营养相关实践的促进作用,并且这种促进并非完全直接发生,而是有相当一部分通过提升母亲对关键信息的意识与知识实现。研究结果与其他国家关于IPC改善婴幼儿喂养知识和实践的发现一致,也支持多平台、多层级干预可能产生更强综合效果的既有认识。但本文特别强调,从分析角度看,总效应相近而中介效应差异明显,意味着SEM虽然可以近似估计总体影响,却可能遗漏中介路径中的关键非线性和交互项。研究人员据此认为,意识与知识之间可能并非简单相加关系,而可能存在协同效应或补偿效应。例如,对某项健康实践的重要性有所意识,若再结合具体操作知识,才可能共同推动行为采纳;而在某些行为上,仅有意识或知识之一也可能已足以促成实践。传统方法往往默认无交互或仅纳入少数交互项,因此难以充分揭示这类复杂机制;相较之下,数据自适应机器学习方法更适合在理论结构尚不完全明确时识别干预效果的真实生产过程。
研究结论部分可译为:暴露于人际传播(IPC)对于改善营养相关实践十分重要,其作用部分归因于个体意识和知识的提升。机器学习(ML)与结构方程模型(SEM)结果之间的差异提示,效果生成机制比简单线性模型所刻画的更加复杂,表现为意识、知识、干预以及协变量之间存在更强的非线性和交互性关系。
总体而言,该研究在公共营养与项目评估领域具有双重价值。其一,在实证层面,证实了母亲与一线工作者之间的人际传播能够促进理想营养行为,并验证了“意识—知识—实践”作为关键机制路径的合理性。其二,在方法层面,研究表明,当行为改变过程涉及多个相互依赖的中介变量时,基于潜在结局框架的TMLE与超级学习器等因果机器学习方法,可能比传统SEM更适合揭示复杂机制。这使该文不仅为尼泊尔母婴营养干预提供了证据,也为今后《The Journal of Nutrition》所关注的营养干预机制研究提供了具有方法启发性的范例。