《Genes》:Establishment of a New-Generation National Reference Material System for Fragile X Syndrome Using Targeted Long-Read Sequencing
编辑推荐:
脆性X综合征(Fragile X Syndrome, FXS) 是最常见的单基因遗传性智力障碍疾病,主要由FMR1基因(fragile X messenger ribonucleoprotein 1, OMIM:309550)5'非翻译区的CGG三核苷酸重复扩
脆性X综合征(Fragile X Syndrome, FXS) 是最常见的单基因遗传性智力障碍疾病,主要由FMR1基因(fragile X messenger ribonucleoprotein 1, OMIM:309550)5'非翻译区的CGG三核苷酸重复扩增及其异常甲基化导致。根据CGG重复数,FMR1等位基因分为四类:正常型(5~44次重复)、中间型或灰区(45~54次重复)、前突变型(55~200次重复)及全突变型(>200次重复)。超过99%的男性全突变携带者会发展为FXS,而女性全突变携带者因X染色体随机失活表现出高度临床异质性,约50%发病且症状通常较男性轻。前突变携带者中,约40%男性和8%女性在50岁后可能出现脆性X相关震颤/共济失调综合征(Fragile X-Associated Tremor/Ataxia Syndrome, FXTAS),约20%女性携带者可能在40岁前出现脆性X相关原发性卵巢功能不全(Fragile X-Associated Primary Ovarian Insufficiency, FXPOI)。此外,AGG三核苷酸中断可稳定CGG重复序列,降低扩增风险,对遗传咨询具有重要价值。然而,传统分子诊断技术存在明显局限:三联引物PCR(Triplet-Primed PCR, TP-PCR)难以准确定量长重复序列且无法解析AGG中断模式;Southern印迹法操作繁琐、通量低、分辨率有限且无法提供AGG中断信息;短读长基因组测序亦难以跨越GC富集的长重复区域。
长读长测序(Long-Read Sequencing, LRS)技术为FXS检测带来突破,其中靶向长读长测序如脆性X综合征综合分析(Comprehensive Analysis of Fragile X Syndrome, CAFXS)可同时检测CGG重复数、AGG中断模式、罕见基因内变异及嵌合比例。然而,现有国家FXS参考品主要基于传统方法标定,分子信息有限,无法为CAFXS等新技术提供准确的校准标准。为此,研究人员开发了靶向长读长测序FMR1综合分析方法(targeted LRS for comprehensive FMR1 characterization, tLRS-FMR1),并应用于国家FXS参考品的全面精确表征,旨在建立新一代参考品体系。
在方法学层面,tLRS-FMR1的核心策略是长程PCR(Long-Range PCR, LR-PCR)扩增与后续LRS的有机结合。研究人员设计了覆盖FMR1基因外显子1的引物对,采用高保真DNA聚合酶进行LR-PCR扩增,通过添加DMSO和甜菜碱增强GC富集区域的扩增效率。PCR产物经条形码接头连接、外切酶消化去除未连接产物、纯化定量后,等摩尔比混样并转化为单分子实时哑铃状(Single-Molecule Real-Time Dumbbell, SMRTbell)文库,于Sequel II CNDx平台进行环化共识测序(Circular Consensus Sequencing, CCS)。原始下机数据经处理获得高质量CCS读长,通过BLAST+提取包含CGG重复区及其两侧100 bp侧翼序列的读长,经质量控制和核密度估计确定等位基因特异性重复长度,并以瀑布图可视化CGG与AGG基序的分布特征。
tLRS-FMR1方法展现出优异的分析性能:与TP-PCR标准方法相比达到100%一致性;实现了全突变等位基因的精确定量,克服了传统技术仅能报告">200重复"的局限;成功解析所有样品的AGG中断模式,包括女性杂合子和嵌合样本;批内和批间重复性实验显示100%基因分型一致性;检测限(Limit of Detection, LOD)低至3 ng/μL,优于国家药品监督管理局(National Institutes for Food and Drug Control, NIFDC)推荐的10 ng/μL阈值。
研究人员从31份候选样本中遴选出22份作为最终参考品,包括14份阳性(P1~P14)和8份阴性(N1~N8)。阳性样本涵盖中间型、前突变型、全突变型及两种以上基因型嵌合的复杂样本,来源包括Coriell细胞库、山东大学附属生殖医学中心及人工制备的嵌合样本;阴性样本包括Coriell正常对照和非人源性大肠杆菌DNA。所有样本均经TP-PCR和tLRS-FMR1平行检测。
研究结果部分,"参考品的系统分析与比较验证"显示:tLRS-FMR1与TP-PCR/reference values达到100%阳性和阴性一致性;对男性全突变样本P8精确测定为311次重复,而TP-PCR仅报告>200次;在人工嵌合样本P11(98/311)和P12(29/505)及真实嵌合样本P13(23/134/209)和P14(336/664)中成功解析多等位基因;特别值得关注的是,样本P9的全突变等位基因经Southern印迹估计为931~940次重复,而tLRS-FMR1直接序列计数为900次,提示Southern印迹因大分子DNA在凝胶电泳中非线性迁移可能导致高估。
"CGG重复的精确定量"部分进一步展示了该方法在全突变精确定量方面的优势。女性杂合样本P7中,tLRS-FMR1准确识别29/309的重复模式,而TP-PCR仅报告29和>200次重复;各嵌合样本的精确重复模式均被成功解析。需要指出的是,较长CGG重复更易产生扩增背景噪声,可能导致检测值与实际值之间存在微小波动,如P10为508次重复,而由其制备的人工嵌合样本P12中全突变等位基因测定为505次重复。
"tLRS-FMR1揭示既往未表征的AGG中断模式"部分表明,该方法成功解析了所有参考样本的AGG中断模式。读长支持数中位数为2444(范围49~30,815),显示高分析可靠性。样本P1显示中间型等位基因的9A36中断模式(即(CGG)9AGG(CGG)36);样本P5的正常等位基因为典型的9A9A9模式,前突变等位基因则为10A46模式;样本N1呈现三种不同的中断模式。特别重要的是,全突变等位基因中仍保留AGG中断,如P7和P11。这些精细特征在等位基因水平上被清晰解析,而Coriell数据库完全缺乏此类中断信息,传统TP-PCR亦无法准确检测。
"分析稳健性与检测限评价"部分显示:批内重复性于Sequel II CNDx系统上进行三次重复运行,批间重复性在不同仪器上进行;正常型和中间型等位基因完全一致性,前突变型有微小变异,全突变型变异稍大但均在可接受范围内,所有重复均维持100%基因分型一致性;LOD确定为3 ng/μL,显著优于NIFDC推荐阈值。
讨论部分,研究人员系统比较了tLRS-FMR1与传统方法及长读长基因组测序的优劣。TP-PCR虽操作简便但无法准确定量长重复和解析AGG中断;Southern印迹可检测全突变和甲基化状态,但流程繁琐、通量低、分辨率有限且无法定义AGG中断模式;长读长基因组测序虽能解析重复扩增和中断模式,但需要更高的测序通量和成本。相比之下,tLRS-FMR1通过靶向设计将测序深度集中于FMR1位点,降低了不必要的全基因组测序,提高了成本效益。研究人员指出,靶向长读长测序在其他遗传复杂性疾病如先天性肾上腺皮质增生症和地中海贫血中已展现优势,并应用于国家基因组DNA参考品的表征,支持了该技术在复杂变异分析和遗传参考品开发中的广泛应用前景。
从方法学验证角度,研究人员强调tLRS-FMR1批次内和批次间重复性实验证实了该方法的高度稳健性,尽管较长CGG重复引入一定扩增背景噪声,但100%基因分型一致性得以维持。3 ng/μL的低检测限表明即使临床样本DNA输入量有限也能获得可靠结果,这是将tLRS-FMR1作为新一代参考品赋值方法的重要前提。
新一代国家FXS参考品体系的建立对FXS分子诊断标准化具有重要意义。现有参考品分子注释有限,特别是缺乏AGG中断模式信息,而AGG中断与重复稳定性和母系传递风险密切相关。本研究通过整合精确CGG重复定量和等位基因水平的AGG中断特征,为新兴FXS检测技术提供了更全面的分析验证框架,特别是实现了现有参考品无法充分评估的AGG中断分辨率评价。该体系可作为临床实验室验证基于PCR、NGS和LRS的FXS检测工作流程的可追溯基准,支持检测标准化、实验室间可比性及跨技术平台的结果协调。
本研究的局限性在于:尽管评估了31份候选样本并纳入两例真实重复大小嵌合样本,总体样本量仍有限,尤其是罕见FMR1变异类型;未能获得FMR1缺失或点突变样本;tLRS-FMR1基于PCR扩增,主要用于CGG重复定量和AGG中断分析而非甲基化评估,临床需要时仍需甲基化特异性PCR或Southern印迹分析。未来工作应进一步扩展参考品 panel,纳入经临床确认的FMR1缺失、点突变和甲基化定义样本,并优化检测方法以提高FMR1表征的全面性。
研究结论指出,本研究开发并应用tLRS-FMR1,成功构建了信息更全面、表征更精确的新一代国家FXS参考品体系。这项工作不仅凸显了tLRS-FMR1在复杂重复扩增疾病分子诊断中的显著优势,也为FXS的精确分子诊断和标准化质量控制奠定了坚实基础。未来将参考品扩展至罕见FMR1变异类型和甲基化定义样本,将进一步提升其临床和标准化价值。该论文发表于《Genes》期刊。
本研究采用的主要关键技术方法包括:基于靶向长读长测序的tLRS-FMR1检测体系,其核心为长程PCR扩增结合Pacific Biosciences Sequel II CNDx平台的环化共识测序(CCS);样本来源包括Coriell细胞库、山东大学附属生殖医学中心临床样本,以及人工制备的嵌合样本和非人源性对照(ATCC);通过与AmplideX PCR/CE试剂盒的TP-PCR结果及Coriell数据库信息进行比对验证;运用核密度估计进行等位基因特异性重复长度鉴定;采用瀑布图实现CGG与AGG基序的高分辨率可视化;通过系列稀释实验确定检测限,并进行批内/批间重复性评价。