《Precision Nutrition》:The precision nutrition recommendations based on genomic information
编辑推荐:
随着慢性病患病率持续上升,当前以生命科学为基础的医疗策略愈发强调早期预防而非治疗。传统基于饮食的干预方式常忽视个体对营养响应的遗传变异差异。本研究提出一种植根于中医“治未病”理念的精准营养框架,通过整合基因、分子及营养素关联,结合多基因风险评分(Polygen
随着慢性病患病率持续上升,当前以生命科学为基础的医疗策略愈发强调早期预防而非治疗。传统基于饮食的干预方式常忽视个体对营养响应的遗传变异差异。本研究提出一种植根于中医“治未病”理念的精准营养框架,通过整合基因、分子及营养素关联,结合多基因风险评分(Polygenic Risk Score, PRS)与基因注释,识别个体风险特征,实现基因组指导下的个性化营养干预。为落地该框架,研究人员利用英国生物样本库(UK Biobank)中8293名东亚参与者的全基因组关联研究(Genome-Wide Association Study, GWAS)汇总统计数据,构建了覆盖55种疾病的多阈值PRS模型。基于PRS分布界定高风险人群,并对相关位点进行注释以确定潜在风险基因。随后,整合STITCH数据库的150万条化合物-蛋白质互作数据、STRING数据库的180万条蛋白质-蛋白质互作数据,以及FooDB数据库的6500余种营养成分数据,构建营养素互作网络,并采用GeneRank算法进行营养素优先级排序。结果显示,PRS模型表现出优异的预测效能,其中胆囊癌的受试者工作特征曲线下面积(Area Under the Curve, AUC)达0.80,自身免疫性肝炎AUC达0.71。针对自身免疫性肝炎与牙周炎,排名前10位的推荐营养素中分别有8种和9种得到现有文献的预防性证据支持。在个体层面,对20名参与者的个性化推荐结果的杰卡德相似系数(Jaccard Similarity)介于0.5至1.0之间,体现了高度的个性化特征。在“治未病”队列的两名代表性个体中,排名前20位的推荐营养素分别有18种和17种被既往研究证实与疾病防控相关。上述结果凸显了基于基因组的个性化营养策略潜力。该策略通过定制化膳食建议优化“治未病”状态,降低疾病发生风险,为精准健康管理提供有效路径。
引言
慢性病已成为我国重大公共卫生挑战,心血管疾病、癌症及糖尿病导致的死亡占总死亡人数的80%以上。生命科学的进展为阐释慢性病与亚健康状态提供了新视角,推动干预策略向主动预防转型。国际学界已启动多项营养基因组学研究计划,如欧洲营养基因组学组织(NuGO)与美国国立卫生研究院(NIH)“精准营养营养学”项目,均聚焦于解析饮食与遗传变异的交互作用对疾病易感性与营养素代谢的影响。传统通用膳食模式,如地中海饮食、DASH饮食及生酮饮食,虽具广泛健康效益,但无法解释由遗传背景驱动的个体响应差异。典型例证为携带APOE ε4等位基因的阿尔茨海默病高风险人群,其从地中海饮食中获益的程度显著降低,凸显了一刀切营养方案的局限性。因此,本研究融合中医“治未病”理念与现代精准医学范式,提出将饮食优化、健康监测与遗传风险调控整合的动态健康管理体系,强调在疾病发生前通过基因组指导的精准营养干预阻断病理进程。
方法
研究设计
实验流程包含三个核心模块:基于PRS算法的个体疾病风险预测、高风险基因功能注释,以及面向个体遗传风险特征的精准营养推荐生成。
数据采集
研究人员整合群体水平GWAS汇总统计与个体基因型数据构建PRS模型。从GWAS Catalog、日本生物样本库(BBJ)及韩国基因组与流行病学研究(KoGES)中获取55种复杂慢性病的GWAS数据,纳入标准包括:东亚人群队列、总样本量大于10,000、具备单核苷酸多态性(SNP)效应估计值。经严格质控后,最终保留8293份样本及3,171,200个SNP位点用于下游分析。营养素互作网络数据来源于STITCH、STRING及FooDB数据库,经置信度过滤与去冗余处理后,获得1,532,335条化合物-蛋白质关系对、1,836,879条蛋白质-蛋白质互作(PPI)对,以及6518种独立营养素。此外,选取华中农业大学“治未病”队列中的两名个体作为案例研究对象。
PRS模型构建与高风险疾病识别
采用C+T(连锁不平衡修剪+阈值法)构建PRS模型。首先筛选P值小于1×10-5的疾病显著关联SNP,并进行LD修剪(r2>0.1)以消除冗余信号。通过PLINK软件计算每个个体的加权PRS值,公式为:PRSi=∑j=1MβjGij,其中Gij为第i个个体在第j个SNP位点的风险等位基因数目(编码为0、1或2)。随后将原始PRS值标准化为Z分数:Zi=(PRSi?μ)/σ,其中μ与σ分别为队列PRS均值与标准差。基于标准化Z分数的分布,将人群划分为高风险(>90百分位数)、中风险(10~90百分位数)与低风险(<10百分位数)。模型性能通过逻辑回归结合受试者工作特征曲线(ROC)及曲线下面积(AUC)进行评估。
高风险基因注释方法
基于GWAS效应等位基因频率(EAF)与效应值(β)对变异位点进行过滤与校正,确保遗传效应方向一致性。对关联SNP超过100个的疾病,剔除EAF>0.5且β为正,或EAF<0.5且β为负的位点。将剩余位点的效应值取绝对值并按降序排序,选取前100个位点进行下游分析。通过SnpEff软件进行基因组水平注释,并利用g:Profiler工具开展功能富集分析,以阐明潜在生物学通路。
精准营养素推荐算法
结合GeneRank、随机游走(RWR)与标签传播(Label Propagation)三种算法进行网络迭代评分。GeneRank基于全局拓扑结构识别稳定且广泛相关的营养素关联;RWR模拟信息扩散过程,捕获邻近关键基因的营养素;标签传播则将高风险基因注释扩散至相邻节点,增强弱信号关联的覆盖率。三种算法均采用阻尼因子d=0.85,邻接矩阵行归一化,节点分数标准化以确保可比性。最终选取同时出现在三种算法排名前端的营养素,实现90%~95%的个体间重叠率,保障推荐稳健性。
结果
个体疾病风险预测
PRS模型对55种疾病的预测AUC介于0.48至0.80之间,其中胆囊癌与自身免疫性肝炎表现最优。AUC较低的疾病主要受限于遗传度偏低、原始GWAS病例对照失衡或样本量不足,以及PRS模型难以捕捉罕见变异与非加性效应。基于90百分位数的高风险阈值,在“治未病”队列中,多数个体同时携带2~5种疾病的高遗传风险,提示需从单一疾病管理转向多病共防的综合干预模式。
高风险基因注释
以类风湿关节炎(RA)为例,注释获得HLA-DQA1、HLA-DOB、STAT4及PFKL等高风险基因。这些基因富集于抗原呈递、JAK/STAT信号通路及糖酵解过程,与RA已知发病机制高度一致。PPI网络显示这些基因通过直接与间接互作形成紧密连接的功能模块,进一步验证PRS模型识别功能性遗传变异的能力。
精准营养素推荐
参数优化结果显示,d=0.85在结果稳定性与收敛速度间达到最佳平衡,故选定GeneRank算法完成推荐。针对自身免疫性肝炎与牙周炎,GeneRank生成的Top10推荐食物中,分别有8种与9种得到文献证据支持。例如,荞麦、西兰花、西瓜及芒果等被证实具有抗炎、抗氧化及肝保护作用;大豆异黄酮、椰子油及大蒜提取物则显示出抑制牙槽骨吸收与抗微生物活性,适用于牙周健康管理。对20名高风险个体的推荐结果杰卡德相似系数主要分布于[0.5,1)区间,证明系统可实现差异化个性化推荐。
案例研究
个体A被预测为胰腺癌、心肌梗死、十二指肠溃疡及心绞痛高风险,个体B为桥本甲状腺炎、类风湿关节炎及2型糖尿病高风险。两人前5位高风险基因分别涉及免疫调节、离子通道与转录调控等功能。以排名第一的推荐食物荞麦为例,其生物活性化合物通过靶向高风险基因产物及相关PPI网络发挥调控作用。个体A与B的前20位推荐食物均以植物性食物为主,其中18种与17种分别被文献证实与对应疾病预防相关,印证了推荐系统的生物学合理性。
讨论
本研究构建的框架实现了PRS、基因注释与网络营养优先级排序的整合,从基因组层面践行“治未病”理念。该策略弥补了传统营养学忽视遗传异质性的短板,但仍存在局限:慢性病遗传贡献度有限,环境与生活方方式因素占主导;当前发现基于英国生物样本库东亚人群,需更广泛人群验证;营养数据库静态化,缺乏加工过程中的动态变化评估;推荐系统暂未实现特定营养素定量评分及多病冲突膳食指导。未来应整合蛋白质组、代谢组、肠道宏基因组及可穿戴设备实时监测数据,发展自适应动态推荐算法,并通过大规模前瞻性试验验证临床转化价值,最终实现精准健康管理从概念到实践的跨越。