《Frontiers in Genetics》:Preliminary examination of noncoding mutations of esophageal squamous cell carcinoma in African Americans
编辑推荐:
本研究针对食管鳞状细胞癌(ESCC)基因组复杂性及人群异质性,对10例非洲裔美国人ESCC患者外显子测序数据开展非编码突变分析,鉴定出3′UTR、5′UTR、剪切位点及启动子区域变异,发现DNA损伤修复(DDR)基因胚系变异富集,为揭示ESCC种族特异性分子机制及精准诊疗提供新线索。
食管鳞状细胞癌(ESCC)是一种高度致命的消化道恶性肿瘤,全球五年生存率仅约20%。它的发病呈现出鲜明的地理“热点”——东亚、南非等地的发病率比西方地区高出至少10倍,烟草、酒精、饮食习惯等环境因素被认为是重要推手。然而,除了环境,遗传背景的差异同样关键,尤其是不同人群的特异性风险位点,让ESCC的分子图谱显得格外复杂。
过去的研究更多聚焦于编码区的“明星基因”,比如TP53、NOTCH1等,但人类基因组中98%是非编码区域,它们包含了调控基因表达的“开关”——UTR(非翻译区)、启动子、剪切位点等。这些区域的突变虽不直接改变蛋白质序列,却可能通过影响转录结合、RNA稳定性等机制驱动肿瘤发生。遗憾的是,针对非洲裔美国人这一特定群体的ESCC非编码突变研究几乎处于空白状态,而这个群体往往面临着更高的疾病负担和更差的预后。
为了填补这一空白,研究人员对先前发表的10例非洲裔美国人ESCC患者(9男1女,年龄53-80岁,多为晚期,且有烟酒暴露史)的全外显子测序数据进行了重新分析。他们使用了Agilent SureSelect XT Human All Exon V6+UTR试剂盒捕获外显子文库,通过严格的质控流程,结合Variant Effect Predictor、CScape-somatic、HumanBase模块(包括DeapSea、Sei、ExPecto)和Opencravat等工具,系统解析了非编码区域的突变特征,并利用SIGNOR数据库和NDEx IQuery工具进行通路富集分析,同时评估了DNA损伤修复(DDR)基因的胚系变异情况。
UTR variations
研究发现,3′UTR是突变最密集的非编码区域,占所有原始非编码变异的46%。这些变异涉及的基因主要富集于金属离子结合、ATP结合等功能,参与细胞内信号传导、细胞间通讯、OCT4/SOX2/NANOG对多能干细胞的转录调控等通路。通过HumanBase Sei模块分析,3′UTR变异对CTCF-Cohesin(CCCTC结合因子-黏连蛋白)序列类的影响最为显著,例如chr1:1377151G>T(VWA1基因)的CTCF-Cohesin得分高达14.78,提示可能增强该调控元件活性;而部分变异则对E6弱上皮增强子、E12红母细胞样增强子等产生负向影响。此外,CScape-somatic预测3′UTR中ETV1、FOXO3、MSI2等48个基因的变异可能具有致癌效应,CScape评分均高于0.7的显著性阈值。
5′UTR变异占总非编码变异的9%,相关基因在DNA修复和应激反应通路中呈名义富集。Sei模块分析显示,5′UTR变异的CTCF-Cohesin序列类得分跨度极大(最高8.41,最低-18.68)。ExPecto模块进一步预测,APOBEC3A基因5′UTR的chr22:399353560 G>C变异可能通过增加H3K4me1(转录激活标记)和H3K27ac(活跃增强子标记)概率、降低H3K27me3(转录抑制标记)概率,从而促进基因表达;而PAPOLB(Poly(A)聚合酶β)基因的启动子上游变异则可能增强H3K27me3沉默效应,抑制基因活性。CScape-somatic预测ROBO2、KLF4等7个5′UTR变异具有致癌潜力。
Intronic variants
内含子变异主要富集于细胞器生物合成与维持、癌基因诱导的衰老、PI3Kγ信号、RHO GTP酶、NOTCH1调控信号及IL-33/IL-6炎症信号通路。其中,RAP1GDS1、STAT3等10个基因的内含子变异被预测具有肿瘤驱动作用,RAP1GDS1的CScape评分高达0.980。
Splice-site variants
剪切位点变异在本队列中较为罕见,仅占所有原始单核苷酸变异(SNVs)的0.87%-2.7%。研究发现,4例患者存在MAP4K5(丝氨酸/苏氨酸激酶,参与上皮-间质转化)的剪切位点突变,另有4例存在自噬相关基因C12orf44(又称ATG101)的剪切位点突变。此外,还观察到CD36、PBRM1基因的插入导致的剪切位点变异,以及TP53基因17:g.7576852C>T变异引起的剪切位点改变。
Promoter variants
研究关注了食管组织中高表达的435个特异性蛋白对应的基因,发现205个基因存在启动子区域突变,除白细胞介素信号和脂质代谢通路外,其他食管特异性蛋白功能均因突变受损。TFAP2A结合位点的变异占观察位点总数的14%。在转录起始位点20 kb范围内鉴定出的2900个变异中,TSPAN13(chr7:16793542 C>T)的Max ExPecto表达效应预测值最高(0.97),其H3K27me3(基因沉默标记)z-score为-18,提示可能促进该基因表达——TSPAN13在乳腺癌中被证实可抑制CD8+T细胞浸润,但在ESCC中的免疫逃逸作用尚未明确。
Germline variants
研究分析了21个DNA损伤修复(DDR)基因的胚系变异,发现RAD52、CHECK1、ATM、MBN、ATR、BRCA2等基因参与G2/M期转换通路,且在多个样本中高频出现。其中,RAD52、CHECK1、BRCA1、PMS2、ERCC5、FANCA在所有10例正常组织样本中均检测到变异。Bloom综合征解旋酶(BLM)蛋白的P493L错义突变CADD评分达34(最高),在2例患者的正常组织中检出。PARP1、ERCC5、MDC1等基因的罕见变异被预测具有有害功能效应,例如ERCC2的两个变异(chr19:45855524 C>T导致D633E/D711E,chr19:45867259 G>A导致D288Y)和PARP1的chr1:226555302 T>C导致V762G变异在所有对照样本中均被MutationTaster预测为有害。此外,所有患者对照组织中均检测到TP53的5个种系SNP,其中rs1042522导致Pro72Arg错义突变,其余位于非编码区。
讨论部分指出,本研究中非编码变异率与体细胞编码突变率趋势一致,符合非编码区域占基因组绝大部分比例的预期。3′UTR的高变异率与既往发现的ESCC中3′UTR普遍缩短的现象不同,提示可能存在不同的调控机制。3′UTR变异富集的FOXA1/AR/ESR1转录因子网络与雄激素受体(AR)高表达和不良预后相关,可能涉及AR驱动的侵袭转移及与IL6/STAT3的信号串扰。5′UTR和启动子区域的CTCF-Cohesin位点变异值得关注,CTCF作为染色质组织和基因调控的关键因子,其结合位点的突变可能破坏三维基因组结构,进而影响基因表达,但其在ESCC中的作用尚待探索。胚系DDR基因变异(如RAD52、BLM)可能是导致该队列高体细胞突变率的潜在原因,且与DNA错配修复缺陷和微卫星不稳定性相关,可能影响治疗敏感性。尽管样本量较小(n=10)且限于晚期患者,本研究仍为揭示非洲裔美国人ESCC的种族特异性分子特征提供了重要线索,未来需在更大队列中验证非编码变异的功能意义。