《HUMAN MUTATION》:Assessing Allele Frequency Information: A Study of Variant Curation Expert Panel Guidelines
编辑推荐:
目的:2015年的美国医学遗传学与基因组学学会/分子病理学协会(American College of Medical Genetics and Genomics/Association for Molecular Pathology, ACMG/AMP)指南
目的:2015年的美国医学遗传学与基因组学学会/分子病理学协会(American College of Medical Genetics and Genomics/Association for Molecular Pathology, ACMG/AMP)指南建议使用大规模、多样化且种族匹配的参考数据库。然而,由于遗传多样性和外显率等因素,在此背景下定义预期具有主观性。临床基因组资源(Clinical Genome Resource, ClinGen)成立了变异解读专家小组(Variant Curation Expert Panels, VCEPs),旨在为ACMG/AMP指南提供针对特定基因的解读,其中包括人群信息。本研究评估了VCEP指南中关于等位基因频率(Allele Frequency, AF)信息的应用。
方法:研究人员分析了39个VCEP的指南,通过检查数据库中的遗传编码,结合等位基因频率阈值和疾病流行率等因素,确定变异在人群中的频率及其潜在致病性。
结果:分析发现,各VCEP批准的等位基因频率截断值(阈值)存在多样性,反映了疾病机制的差异。同时注意到,用于建立截断值的方法存在变异性,并且对于获批准阈值所需的参数认定存在不一致。
结论:理解阈值需要具备遗传学和疾病相关知识。VCEP关于等位基因频率证据的指南可帮助解读人员识别推荐的阈值。然而,为了确保人群证据利用的一致性,需要更多指导。
一、 研究背景、问题与目的
随着高通量测序技术的普及,临床遗传检测中发现的基因变异数量激增。对这些变异进行准确、一致的致病性解读,是转化基因组学研究成果、实现精准医疗的关键。2015年,美国医学遗传学与基因组学学会与分子病理学协会联合发布了遗传变异临床解读的标准与指南(ACMG/AMP指南),为变异分类(分为致病、可能致病、临床意义不明确、可能良性、良性)提供了框架。其中,基于人群数据的证据,特别是等位基因频率,对于区分良性变异与致病性变异至关重要。指南中定义了三个核心的人群证据准则:BA1(等位基因频率>5%,支持良性)、BS1(等位基因频率超过疾病预期频率,支持良性)和PM2(在匹配的人群对照中未发现,支持致病性)。
然而,原始指南在实际应用中面临挑战。首先,定义“合适”的等位基因频率阈值具有主观性,需考虑疾病流行率、外显率、遗传模式等多种因素。其次,不同基因和疾病具有独特的遗传和临床特征,通用的阈值可能不适用,导致解读不一致。为应对此问题,ClinGen成立了多个针对特定疾病或基因的变异解读专家小组,负责制定对ACMG/AMP指南的基因/疾病特异性调整。这些VCEP指南提供了关于如何应用BA1、BS1和PM2准则的专家见解。截至2026年1月,已有39个VCEP发布并批准了其变异解读指南。
尽管VCEP指南增强了特异性,但其在参数设定、验证方法和阈值选择上可能存在差异,这种不一致性可能影响跨小组、跨实验室变异解读的标准化和可重复性。因此,本研究旨在通过系统分析这39个VCEP的指南,阐明其设定BA1、BS1、PM2等位基因频率阈值的关键特征、所采用的方法、面临的挑战以及由此产生的变异分类影响,从而识别当前实践中的异同点,并为未来实现更一致、可靠的变异解读标准化提供依据。本研究发表于《HUMAN MUTATION》期刊。
二、 关键技术方法概述
研究人员采用了系统性的文献回顾与数据分析方法。首先,从ClinGen官网获取了截至2026年1月所有已发布的39个VCEP指南文档。其次,从ClinGen变异解读界面(Variant Curation Interface)收集了由这些VCEP贡献的、总计9441个被标记为“已接受”的变异分类数据。分析方法包括:1) 定性分析VCEP指南文档,提取关于BA1、BS1、PM2阈值设定所使用的参数(如疾病流行率、外显率、最大等位贡献度、最大遗传贡献度)、参数来源(经验证参数 vs. 外推参数)及所使用的种群数据库(通用数据库 vs. 排除疾病的数据库)等信息。2) 定量分析变异数据,通过一个由ClinGen序列变异解读工作组(SVI Working Group)完善的贝叶斯积分系统,量化BA1、BS1、PM2证据对最终变异分类的具体影响,并评估阈值去除后分类的变化。3) 统计分析,计算各VCEP对人群准则的利用率、阈值与最终分类的一致性,以及再分类变异比例。
三、 研究结果
3.1. Whiffin–Ware计算器与SVI工作组建议
Whiffin–Ware计算器是绝大多数VCEP(39个中的37个)用于设定BA1、BS1、PM2阈值的基础工具,其输入四个疾病特异性参数。SVI工作组提出了跨VCEP的关键建议,包括:将PM2重新定义为“佐证强度”因素而非确定性准则;BS1应仅应用于具有充分特征的人群;为减少测序错误等影响,BA1/BS1的应用通常要求变异在至少2000个测试等位基因中出现≥5次;PM2可灵活应用于在大型数据库中频率极低(而不仅是完全缺失)的变异。
3.2. 各VCEP的BA1/BS1/PM2等位基因频率阈值
研究详细列出了各VCEP为BA1、BS1和PM2设定的具体阈值,显示阈值在不同疾病类型和基因间存在数量级上的显著差异。例如,CDH1 VCEP的BA1阈值为0.002,而von Willebrand病VCEP的BA1阈值高达0.1。这种差异反映了疾病流行率、遗传模式(常染色体显性、隐性、X连锁)、外显率等因素的综合影响。
4. 跨VCEP的关键观察
4.1. 准则应用的变异性
不同VCEP应用BA1/BS1/PM2准则的比例差异很大。例如,溶酶体贮积症和ACADVL VCEP的使用率超过96%,而恶性高热易感性VCEP的使用率仅为7.2%。这种差异与目标疾病的遗传基础清晰度、外显率复杂性等因素相关。被分类为临床意义不明确的变异几乎从不包含BA1/BS1证据。
4.2. 等位基因频率与变异分类的一致性
应用BA1或BS1准则的变异绝大多数被归类为良性或可能良性(分别占99%和90.6%)。相反,包含PM2准则的变异最常见被归类为致病性或可能致病性(合计占65%)。这证实了高频率支持良性,而罕见性支持致病性的基本逻辑。
5. VCEP特异性挑战与适应性策略
各VCEP针对其特定疾病挑战调整了阈值参数和应用策略,包括:针对隐性遗传病考虑携带者频率和迟发表现;针对流行率未知的罕见病使用替代指标;针对癌基因相关VCEP实施严格亚群等位基因计数要求以排除克隆性造血干扰;针对高遗传异质性疾病整合基因特异性贡献数据;针对不完全外显疾病采用保守外显率估计;针对X连锁疾病根据性别特异性外显率调整阈值。
6. BA1/BS1/PM2对变异分类的影响(积分系统)
通过贝叶斯积分系统量化发现,在6606个含等位基因频率数据的变异中,有4.5%的分类与原始ACMG/AMP分类相比发生了改变。PM2对致病/可能致病分类至关重要,移除PM2积分会导致41%的可能致病变异被降级为临床意义不明确。BA1/BS1对良性分类影响更大,移除其积分会导致79.5%的可能良性变异被重新归类为临床意义不明确。积分系统还揭示了一批处于分类临界点的“边界变异”。
7. 阈值设定方法总结
VCEP主要采用三种策略设定阈值:1) 保守参数选择以避免假阳性/假阴性分类;2) 基于变异特异性数据或数据库验证的数据驱动调整;3) 针对独特挑战对ACMG/AMP框架进行适应性修改。
8. 讨论
本研究揭示了VCEP指南实践中的一个核心悖论:基因/疾病特异性调整在提高解读精确性的同时,也因参数化、验证方法和等位基因频率数据利用的不一致,削弱了跨小组的可重复性。讨论部分详细分析了阈值异质性的表现与驱动因素(如遗传模式、疾病流行率、数据库选择、外显率),以及由此带来的临床挑战(如可重复性受损、实验室间不一致、阈值验证模糊、对排除疾病数据库利用不足)。
为在特异性与标准化之间取得平衡,研究人员提出走向平衡标准化的原则与实用建议:原则包括以疾病生物学为中心进行校准、指定数据库特异性阈值、确保验证与透明度。建议包括:按疾病类别建立参考阈值框架(例如,为常染色体显性疾病、隐性病、癌易感基因设定默认阈值范围);纳入剂量和遗传模式特异性调整;强制要求对等位基因频率数据进行质量控制(如最低测序深度、样本量);开发集中化的阈值知识库。
9. 关于BA1准则的补充说明
研究发现ACADVL VCEP、线粒体疾病VCEP和听力损失VCEP存在少数变异在满足BA1标准后仍被分类为临床意义不明确或致病性的例外情况。这偏离了BA1通常作为独立良性准则的通用规则,可能与该些疾病的独特特征(如高度遗传和表型异质性)或VCEP在解读过程中考虑了其他未报告的额外证据有关。此案例提示,在应用通用指南于特定疾病VCEP解读时需保持谨慎。
四、 研究结论翻译
理解(等位基因频率)阈值需要遗传学和疾病相关知识。VCEP关于等位基因频率证据的指南可帮助解读人员识别推荐的阈值。然而,为了确保人群证据利用的一致性,需要更多指导。