将针对微单倍型的概率基因分型模型从靶向扩增技术转移到杂交捕获技术:一项针对DNA混合物的100个位点基因组检测平台的概念验证研究

《Forensic Science International: Genetics》:Transferring a Microhaplotype-Specific Probabilistic Genotyping Model from Targeted Amplification to Hybridization Capture: A Proof-of-Concept Study of a 100-Locus Panel for DNA Mixtures

【字体: 时间:2026年06月03日 来源:Forensic Science International: Genetics 3.2

编辑推荐:

  杨春|曹月艳|王玉婷|胡宇涵|侯婷云|王浩宇|单天添|朱强|张吉中国四川大学基础医学与法医学西部学院,成都,中国摘要概率基因分型(PG)已成为评估法医DNA混合物的标准框架,但大多数实现方法都是针对STR数据和基于PCR的富集技术开发的。微单倍型(MHs)具有较高的等位基因多样性

  
杨春|曹月艳|王玉婷|胡宇涵|侯婷云|王浩宇|单天添|朱强|张吉
中国四川大学基础医学与法医学西部学院,成都,中国

摘要

概率基因分型(PG)已成为评估法医DNA混合物的标准框架,但大多数实现方法都是针对STR数据和基于PCR的富集技术开发的。微单倍型(MHs)具有较高的等位基因多样性且无重复序列,特别适用于混合物的分解,尤其是在处理降解或有限的DNA时,结合杂交捕获技术效果更佳。在这里,我们开发了一个包含100个位点的杂交捕获MH面板,并使用两种连续概率基因分型模型对其在混合物分析中的性能进行了评估:(i) 我们团队之前为靶向扩增MH-MPS数据开发的特定于MH的截断高斯(TG)模型;(ii) EuroForMix(EFM)中实现的基于伽马分布的模型。首先通过敏感性(0.5、0.125和0.0625 ng;重复三次)和重复性/一致性(10个个体,0.5 ng;重复两次)实验来检验该面板的性能。然后分析了两个人和三个人的混合物,混合物的不平衡程度逐渐增加(两人混合物:1:1到1:40;三人混合物:1:1.5:3到1:4:20;重复三次)。在所有混合物中,真实贡献者的似然比(LRs)在两种模型下均大于1,而所有测试的非贡献者的LRs均小于1。对于两人混合物,主要贡献者的分解准确率接近100%,而次要贡献者的准确率在1:5时达到最高,随后随着混合物不平衡程度的增加而下降。在三人混合物中,次要贡献者的准确率强烈依赖于贡献者之间的相对比例,并表现出非单调趋势。总体而言,与EFM相比,TG模型产生了更高的LRs,并改善了次要贡献者的分解效果,这支持了TG框架从靶向扩增到杂交捕获MH-MPS数据的迁移性。这些结果为法医混合物中杂交捕获微单倍型的概率解释提供了初步的实际基础。

引言

在法医遗传学中,混合DNA谱型的解释仍然是一个持续存在的挑战,尤其是对于低模板量或降解样本以及有多个贡献者的混合物。这一挑战源于贡献者之间的等位基因共享以及信号生成的随机变异,包括数据丢失、杂合子峰值不平衡和背景噪声,这些因素共同掩盖了贡献者的基因型,使得证据权重评估变得复杂[1]。
概率基因分型(PG)通过建模数据生成过程并在竞争假设下报告似然比(LRs)来应对这些挑战。广泛使用的PG系统如EuroForMix [2]、[3]、[4] 和 STRmix [5]、[6]、[7] 主要是为STR谱型开发的,但连续建模方法也已应用于MPS数据,将读取深度视为定量信号[3]、[4]、[8]。实际上,证据强度和分解性能取决于模型与数据的匹配程度、参数校准以及分析阈值和伪影模型的选择[4]、[7]、[9]、[10]。
微单倍型(MHs)是由多个紧密连锁的SNP组成的短基因组区域。与STRs相比,MHs具有多个无重复序列的等位基因、较短的目标长度和高多态性,这可以提高混合物的分辨率,并使其更适合处理降解材料[11]、[12]。杂交捕获是一种补充的富集策略,可以从片段化的DNA中恢复信息丰富的位点,并在单次检测中实现高多重目标检测[13]、[14]、[15]。
尽管有这些优势,杂交捕获MH系统及其概率解释方法仍需进一步探索。有两个关键问题尚未得到充分研究。首先,许多PG工具和验证研究集中在STRs上,而MHs具有更高的等位基因序列复杂性以及不同的噪声和标记扩增不平衡模式,这促使了针对MH的连续模型的开发[16]。其次,数据过滤策略(即分析阈值的选择,无论是静态的还是动态的)和PG模型选择对基于捕获的MH数据的影响尚未系统地进行评估,特别是在低模板量和贡献者数量增加的情况下[17]。
在我们之前的工作中,我们开发并验证了一个针对靶向扩增MH-MPS混合物数据的连续截断高斯(TG)模型[16]。在此基础上,本研究开发了一个包含100个位点的杂交捕获MH面板,并评估了TG模型在基于捕获的MH-MPS数据中的迁移性。我们还使用了EuroForMix(EFM)中实现的基于伽马分布的模型来计算似然比(LRs)并分析了两人和三人混合物,混合物的比例和贡献者数量逐渐增加的情况。

章节片段

标记选择和探针设计

我们使用已发布的数据集[18]、[19]、[20]、[21]、[22]、[23]、[24]、[25]、[26]以及1000基因组计划(1KGP)筛选了MH位点,重点考虑了混合物的适用性和捕获兼容性。根据以下标准选择了候选MHs:(1) 每个MH的长度小于100 bp;(2) 每个MH包含两个或更多SNP;(3) 排除了含有插入缺失或低复杂度序列的MH;(4) 符合连锁平衡和哈迪-温伯格平衡的MH。

面板特性

最终面板包含分布在21条常染色体上的100个MH。平均片段长度为48.62 ± 25.74 bp。每个位点包含2-8个SNP,每个位点的等位基因数量范围为2到13个。所有位点的有效等位基因数(Ae)平均为3.00 ± 1.16,观察到的杂合度为0.61 ± 0.18,区分度(DP)为0.76 ± 0.18。累积区分度接近1(1 ? 7.37 × 10?72)。位点级别的详细信息见补充表S2。

测序指标

总共

杂交捕获微单倍型在法医基因分型中的适用性

概念验证结果表明,杂交捕获MH-MPS系统在法医基因分型中的潜力及其与连续PG模型的兼容性。在本文使用的输入范围和双重阈值下(读取计数10和读取比例0.01),大多数位点的基因型恢复率稳定在≥0.125 ng,而在0.0625 ng时随机效应变得明显,这与之前的基于捕获的研究结果一致[13]、[14]、[15]、[32]。在0.0625 ng时,

结论

我们开发并验证了一个包含100个位点的杂交捕获微单倍型面板,并作为概念验证,将其应用于两人和三人的DNA混合物,采用法医概率解释工作流程。两种连续PG框架都支持LR计算和分解,其中特定于微单倍型的TG模型在次要贡献者分析中提供了更好的性能。这些结果支持了TG模型从靶向扩增到杂交捕获MH-MPS数据的迁移性。

CRediT作者贡献声明

侯婷云:方法学、概念化。胡宇涵:研究、数据管理。王玉婷:方法学、概念化。曹月艳:研究、正式分析、概念化。张吉:撰写——审稿与编辑、监督、概念化。朱强:撰写——审稿与编辑、概念化。单天添:研究、数据管理。王浩宇:方法学、概念化。杨春:撰写——初稿、方法学、研究、正式分析,

利益冲突声明

作者声明他们没有已知的可能会影响本文工作的财务利益或个人关系。

致谢

本工作得到了国家自然科学基金(82230064和82402205)和公安部法医遗传学重点实验室开放项目(2025FGKFKT02)的支持。我们感谢EuroForMix团队维护了一个可访问的开源平台,该平台为本研究提供了信息和灵感。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号