基于深度学习通过罕见病数据集合成数据扩展进行视网膜色素变性遗传模式检测

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Scientific Reports》：Deep learning detection of retinitis pigmentosa inheritance forms through synthetic data expansion of a rare disease dataset

【字体：大中小】 时间：2026年04月12日 来源：Scientific Reports 3.9

编辑推荐：

　　本研究针对视网膜色素变性（RP）等遗传性视网膜疾病（IRDs）临床遗传模式分类困难、分子诊断存在局限性的问题，开发了一种基于Vision Transformer（ViT）模型和变分自编码器（VAE）数据扩增的创新深度学习方法，通过彩色眼底照相有效区分常染色体与X连锁遗传RP，将分类性能AUC提升至0.79。这项工作展示了深度学习在挖掘与遗传相关的细微表型特征方面的潜力，为罕见病研究提供了一种新颖的训练数据增强策略。

在遗传性视网膜疾病（Inherited Retinal Diseases, IRDs）的诊断与遗传咨询中，精确判断疾病的遗传模式至关重要。临床上，这通常需要综合家系信息、临床评估和基因检测。然而，现实往往存在挑战：即使运用当代测序技术，仍有一部分患者无法获得明确的分子诊断；同时，家族史可能不完整或模糊不清。这些瓶颈促使研究人员探索能够提供补充信息的、基于表型（phenotype）的辅助方法，以期在不取代现有诊断手段的前提下，为临床决策提供更多依据。视网膜色素变性（Retinitis Pigmentosa, RP）作为一种临床表现和遗传病因均具有高度异质性的疾病，正是研究这一问题的理想模型。

近年来，眼组学（oculomics）领域的发展，特别是深度学习（Deep Learning, DL）在眼底影像分析中的应用，展现出通过自动化手段从图像中推断疾病特征的巨大潜力。深度学习模型能够揭示人眼难以察觉的、与特定视网膜疾病相关的细微表型模式。然而，将这一技术应用于IRDs，尤其是RP的遗传模式分类，却遭遇了“数据荒”的窘境。IRDs本身属于罕见病，单个临床中心难以积累足够数量的、标注清晰的病例数据，这严重阻碍了高性能深度学习模型的开发。为了解决有限数据下的模型训练难题，并探索基于眼底影像自动化区分RP遗传模式的可行性，一项创新性研究在《Scientific Reports》上发表。

研究人员开展了一项开创性的研究，核心目标是利用彩色眼底照相（Color Fundus Photography）来区分常染色体（autosomal）与X连锁（X-linked）遗传的RP。为了克服数据稀缺的核心挑战，他们引入了一种基于变分自编码器（Variational Autoencoder, VAE）的创新性数据扩展策略，用以生成合成数据，扩充训练集。该研究采用先进的Vision Transformer（ViT）模型架构进行图像特征学习和分类。

主要技术方法概述：本研究构建了一个包含RP患者眼底影像的数据集。核心方法是利用Vision Transformer（ViT）模型进行端到端的遗传模式分类。为应对数据量小的挑战，研究创新性地采用了变分自编码器（VAE）来学习真实眼底图像的特征分布，并生成高质量的合成眼底图像，用于扩展训练数据集，从而提升模型性能。模型评估采用受试者工作特征曲线下面积（AUC）等指标。

研究结果

基于ViT的遗传模式分类性能

研究人员首先评估了Vision Transformer（ViT）模型在原始数据集上区分常染色体与X连锁RP的性能。结果显示，即使在数据有限的情况下，ViT模型展现出一定的分类能力，基线AUC达到0.67。这初步证实了利用深度学习从彩色眼底照相中提取与特定遗传模式相关表型特征的可行性。

VAE数据扩展对模型性能的提升

为改善因数据稀少导致的模型性能瓶颈，研究团队引入了变分自编码器（VAE）进行数据扩展。VAE通过学习真实眼底图像数据的潜在分布，能够生成在视觉上逼真、在特征分布上与真实数据相似的合成眼底图像。将这些合成图像与原始真实图像结合，共同训练ViT模型。结果非常显著：经过VAE数据扩展增强后，模型的分类性能得到了实质性提升，AUC从0.67提高至0.79。这一结果证明了所提出的VAE数据扩展策略在有效扩充罕见病数据集、从而显著提升深度学习模型性能方面的巨大效用。

合成数据的表征分析

为了验证所生成合成数据的质量及其有效性，研究人员对合成图像进行了深入的表征分析。分析表明，VAE生成的合成图像不仅保留了真实眼底图像的关键形态学特征，而且在模型的潜在特征空间中，合成数据与真实数据的分布高度重叠。这确保了合成数据不是无意义的噪声，而是提供了有助于模型学习判别性特征的、有价值的“新样本”，从而解释了其能提升模型性能的原因。

研究结论与讨论

本研究成功开发并验证了一个首个基于Vision Transformer和VAE数据扩展的深度学习框架，能够利用单一的彩色眼底照相区分常染色体与X连锁遗传的视网膜色素变性。研究表明，深度学习能够从眼底图像中捕获与不同遗传模式相关的、细微的、可能人眼无法识别的表型差异。更重要的是，研究所创新的VAE数据扩展策略，为解决罕见病研究中标注数据集稀缺这一普遍性难题提供了新颖且有效的技术方案，使得数据驱动的深度学习方法在罕见病领域变得更加可行。

该研究的发现具有重要的临床和科研意义。在临床上，这种方法可以为遗传咨询提供补充信息，特别是在基因诊断不明确或家系信息不全的情况下，辅助判断遗传模式，帮助评估家族成员的患病风险。在科研上，它验证了“眼组学”通过影像表型反推基因型的理念，为理解基因型-表型关联开辟了新途径。同时，提出的数据扩展方法具有可推广性，有望应用于其他数据稀缺的罕见病甚至常见病的医学影像分析中，加速人工智能在医疗领域的落地应用。这项工作不仅推动了RP的辅助诊断研究，也为整个罕见病领域的AI研究提供了重要的方法论参考。

联系信箱：

粤ICP备09063491号

热点排行