《Genes》:In Silico Identification and Structural Characterization of High-Risk Missense SNVs in the Human IL23R Gene Relevant to Inflammatory Bowel Disease
编辑推荐:
背景/目的:IL23R编码IL-23/Th17信号轴的关键组分,并且是炎症性肠病(IBD)、银屑病和强直性脊柱炎已确认的遗传易感位点。尽管全基因组关联研究(GWAS)数据广泛,但IL23R错义单核苷酸变异(SNVs)全谱的功能后果尚未得到系统表征。本研究旨在通
背景/目的:IL23R编码IL-23/Th17信号轴的关键组分,并且是炎症性肠病(IBD)、银屑病和强直性脊柱炎已确认的遗传易感位点。尽管全基因组关联研究(GWAS)数据广泛,但IL23R错义单核苷酸变异(SNVs)全谱的功能后果尚未得到系统表征。本研究旨在通过多工具计算机流程识别高风险错义SNVs。方法:从NCBI dbSNP检索到723个错义SNVs,使用Ensembl VEP(GRCh38)对照转录本NM_144701.3/Q5VWK5-1(629个氨基酸)进行验证。采用SIFT、PolyPhen-2、PROVEAN、E-SNPs&GO、MutPred2和ConSurf(等级≥7)进行顺序过滤;AlphaMissense和FATHMM-MKL作为独立注释层。使用MuPro和DynaMut2(AlphaFold2 AF-Q5VWK5-F1-v6;pLDDT=68.19)评估蛋白质稳定性;使用Project HOPE进行结构表征,并使用STRING和GeneMANIA构建相互作用网络。结果:顺序过滤识别出37个高风险错义变异。MuPro预测36/37个变异具有去稳定效应,其中35/37与DynaMut2结果一致。Project HOPE识别出11个变异中的二硫键破坏、8个变异中的电荷改变替换以及11个变异中的甘氨酸/脯氨酸骨架构象改变。STRING分析确定IL12RB1(0.999)、IL23A(0.999)、JAK2(0.995)、IL12B(0.986)和STAT3(0.980)为主要的IL23R相互作用因子。保护性变异R381Q被PROVEAN(-1.16)和AlphaMissense(likely_benign)适当表征为中性,支持该流程的特异性。结论:全面的计算机分析识别出37个高风险IL23R错义候选变异,具有预测有害性的收敛计算证据,主要涉及半胱氨酸桥破坏、电荷改变以及甘氨酸/脯氨酸骨架构象变化。这些变异作为优先候选者供未来功能验证,并可能为后续IBD易感性和IL-23通路药物基因组学研究提供信息。
**研究背景与问题:**
白细胞介素-23(IL-23)/Th17免疫轴是宿主防御细胞外病原体以及免疫介导炎症性疾病发病机制中的关键调控节点。IL-23由独特的p19亚基(由IL23A编码)和共享的p40亚基(由IL12B编码,与IL-12共享)组成的异二聚体细胞因子,通过IL-23受体复合物驱动Th17细胞的分化和维持,促进下游效应细胞因子IL-17A、IL-17F、IL-22和IFN-γ的产生,共同调节黏膜免疫并在炎症性肠病(IBD)、银屑病、银屑病关节炎、白塞病、系统性红斑狼疮和强直性脊柱炎中导致组织炎症。IL-23受体(IL-23R)由位于染色体1p31.3上的IL23R基因编码,与IL-12受体β1(IL12RB1)形成异二聚体信号复合物,下游信号通过JAK2和TYK2激酶激活,导致STAT3和STAT4磷酸化以及随后的Th17效应程序转录调控。该通路的临床重要性体现在靶向其关键组分的生物制剂的治疗成功,如乌司奴单抗(抗p40/IL12B)、古塞库单抗、瑞莎珠单抗和替瑞奇珠单抗(抗p19/IL23A),这些药物已广泛获批用于IBD、银屑病及相关疾病。IL23R最初在一项里程碑式的全基因组关联研究(GWAS)中被确定为克罗恩病的易感位点,随后大量GWAS研究证实了IL23R变异与IBD、银屑病和强直性脊柱炎的关联。最受研究的变异rs11209026(R381Q;p.Arg381Gln)导致胞质精氨酸残基被谷氨酰胺取代,通过降低受体信号传导能力对IBD提供显著保护。然而,IL23R错义变异的完整图谱尚未在计算层面得到系统表征。
**研究内容与结论:**
研究人员通过多工具计算机流程(SIFT、PolyPhen-2、PROVEAN、E-SNPs&GO、MutPred2、ConSurf)对723个来自NCBI dbSNP的IL23R错义SNVs进行顺序过滤,并结合AlphaMissense和FATHMM-MKL两个独立注释层,最终鉴定出37个高风险错义变异。蛋白质稳定性分析(MuPro和DynaMut2)预测36/37个变异具有去稳定效应;三维结构表征(Project HOPE)发现主要破坏机制包括二硫键破坏(11个变异)、电荷改变替换(8个变异)以及甘氨酸/脯氨酸骨架构象改变(11个变异)。基因相互作用网络分析(STRING和GeneMANIA)确认IL23R与IL12RB1、IL23A、JAK2、STAT3等关键信号分子强相互作用。保护性变异R381Q被正确分类为中性,验证了流程的特异性。该项研究首次对IL23R全错义变异景观进行系统性计算机表征,提供了结构注释的可重复候选变异集,为后续功能验证和IBD易感性及IL-23通路药物基因组学研究奠定基础。论文发表在《Genes》。
**关键技术方法(不超过250字):**
研究人员从NCBI dbSNP检索IL23R错义SNVs,以UniProt规范亚型Q5VWK5-1(转录本NM_144701.3)为参考序列。采用Ensembl VEP(GRCh38.p14)进行注释和位置验证。顺序过滤包括:SIFT(score<0.05为有害)和PolyPhen-2(可能/很可能有害)同时预测有害的变异(158个)进入PROVEAN(score≤-2.5为有害;65个);E-SNPs&GO机器学习预测器识别致病性变异(44个);MutPred2(score>0.5)保留42个;ConSurf进化保守性评分≥7的37个变异被定为高风险。AlphaMissense和FATHMM-MKL作为独立注释层,不参与顺序排除。蛋白质稳定性使用MuPro(序列基SVM法)和DynaMut2(基于AlphaFold2模型AF-Q5VWK5-F1-v6,pLDDT=68.19)评估。三维结构分析用Project HOPE(参考PDB 5MZV或AlphaFold2模型)。基因相互作用网络用STRING v12.0(最小置信度0.700,10个一级相互作用因子)和GeneMANIA(20个相关基因)构建。
**研究结果:**
**3.1 变异过滤流程:** 从723个错义SNVs开始,经VEP确认524个对应参考序列。SIFT和PolyPhen-2共预测158个有害/损伤变异;PROVEAN过滤至65个;E-SNPs&GO识别44个致病性;MutPred2保留42个(score>0.5);ConSurf(等级≥7)最终得到37个高风险变异。已知保护性变异R381Q被PROVEAN评分为中性(-1.16),被AlphaMissense分类为likely_benign,证明了流程的特异性。FATHMM-MKL仅预测65个中的18个为损伤性,故仅作为注释层。群体等位基因频率显示多数变异极为罕见(gnomAD v4.1外显子组AF<10
-4),7个变异具有ClinVar意义不确定(VUS)注释。
**3.2 功能影响与致病性预测:** 所有37个高风险变异均被SIFT和PolyPhen-2预测为有害/损伤。AlphaMissense分类28个为likely_pathogenic,8个为ambiguous。PROVEAN评分范围为-2.515至-11.311,最极端为W265C(-11.311)、W265S(-11.228)和W307G(-10.853)。E-SNPs&GO致病性概率范围0.515-0.933,最高为C101W和C296R(均为0.933)。MutPred2评分范围0.522-0.940,14个变异超过0.8,最高为C296R(0.940)、C52F(0.913)和W307G(0.902)。
**3.3 蛋白质稳定性分析:** MuPro预测36/37个变异具有去稳定效应(ΔΔG<0),范围-0.096至-2.389 kcal/mol,最强去稳定为L202P(-2.389)、V218G(-2.290)、C115G(-2.206)、G116A(-1.811)和C115S(-1.733 kcal/mol)。仅W195L被MuPro预测增加稳定性(+0.198 kcal/mol)。DynaMut2与MuPro在35/37个变异上一致,W395R为唯一不一致(MuPro去稳定,DynaMut2 +0.33 kcal/mol)。10个变异表现为一致强去稳定(两者ΔΔG<-1.0 kcal/mol),包括W307G(DynaMut2 -3.10 kcal/mol)、V160A(-2.45 kcal/mol)、W265S(-2.27 kcal/mol)和V218G(-1.97 kcal/mol)。
**3.4 三维结构表征:** Project HOPE识别出四种主要去稳定机制:①二硫键破坏:11个变异(C52F、C59R、C101W、C101Y、C105W、C115R、C115G、C115Y、C115S、C253R、C296R),占高风险集的30%,其中7个位于结构域埋藏核心;②电荷改变替换:8个变异(C59R、C115R、C253R、C296R、S308R、W395R、G483R中性转正电,E254G负电转中性),引入正电荷精氨酸导致电荷排斥;③甘氨酸/脯氨酸骨架构象改变:11个变异,包括6个缺失天然甘氨酸(G116A、G149V、G203A、G203S、G483V、G483R),1个引入甘氨酸(V218G),4个涉及脯氨酸(L202P引入脯氨酸,P220S、P220T、P401S缺失脯氨酸);④氢键丢失:包括W35C(与Glu37接触丢失)、C101Y、C115Y、C115S、W195C、W265C、W265S、Y290F、W307G等。五个代表性变异(C52F、C59R、L202P、C296R、W307G)进行了详细三维可视化。
**3.5 基因-基因相互作用网络分析:** STRING网络(11节点,50边)显示IL23R最强直接相互作用为IL12RB1(综合评分0.999)、IL23A(0.999)、JAK2(0.995)、IL12B(0.986)、STAT3(0.980)、TYK2(0.979)、IL10(0.970)、IFNG(0.959)、IL22(0.947)和IL6(0.934)。IL12RB1-IL23R和IL23A-IL23R相互作用有实验和数据库支持。GeneMANIA网络(20个相关基因)额外识别出NFKBIA、SOCS3、BATF、STAT4、CXCL1、CCL2、IL18等,强调IL23R在NF-κB通路调控、Th17/Th1分化及IBD发病炎症信号中的作用。
**讨论与结论:**
该研究提供了IL23R错义变异的全景观系统性计算机分析,通过收敛计算证据识别出37个高风险候选变异。主要结构破坏机制包括二硫键破坏(11/37,30%)、电荷改变替换(8个)和甘氨酸/脯氨酸骨架构象改变(11个),这些机制在结构上具有一致性。半胱氨酸破坏变异占主导地位,这与二硫键在细胞因子受体胞外结构域中的关键稳定作用一致。Cys115在4个变异中重现(C115R、C115G、C115Y、C115S),提示其为结构突变热点。保护性变异R381Q被正确分类为中性,验证了流程的内部一致性。FATHMM-MKL的低敏感性使其仅作为注释层。STRING网络确认IL23R与IL12RB1、IL23A、JAK2、STAT3的强相互作用,支持其通过IL-23/Th17信号级联影响IBD发病。变异可能具有药物基因组学相关性,但需后续功能性研究验证。研究局限性包括所有发现均来自计算预测、预测工具不完全独立、AlphaFold2模型置信度中等(平均pLDDT=68.19),但33/37个变异位点评分>85。结论:该研究系统表征了人类IL23R基因的错义SNVs,识别出37个高风险候选变异,以二硫键破坏、电荷改变和骨架构象变化为主要机制。C296R、C52F、C59R、W307G和L202P成为最高优先级的候选者,供未来实验功能验证。对IBD遗传易感性或IL-23通路药物基因组学的任何意义仍有待确定,应视为后续功能和临床研究的假设。