摘要
尽管当前的计算病理学模型在多种应用中表现优异,但由于依赖高倍率全切片图像分析,其在诊断效率方面存在显著缺陷。这一限制降低了其在临床上的实用性,尤其是在需要快速诊断或高效传输数据的场景中。为解决这些问题,我们开发了一种兼具计算和通信高效性的框架——放大对齐全局局部变换器(MAG-GLTrans)。该框架通过利用低倍率输入数据进行有效分析,大幅减少了计算时间、数据传输需求以及存储开销。其放大对齐机制采用自监督学习方法,通过有效对齐低倍率与高倍率图像的特征表示,从而弥补两者之间的信息差距。经过在多种核心计算病理学任务中的测试,MAG-GLTrans在保持顶尖分类性能的同时,实现了显著的效率提升:计算时间可减少10.7倍,数据传输和存储需求则可降低20倍以上。此外,MAG框架的灵活性还通过两项重要扩展得到了体现:其一,它可以作为特征提取器,提升任何计算病理学架构的效率;其二,它可与现有的基础模型兼容,使这些模型能够在几乎无信息损失的情况下处理低倍率输入数据。在临床应用中,MAG-GLTrans被用于非小细胞肺癌术中冰冻切片的计算机辅助诊断,它能够以较低的计算和通信成本识别出不同的肿瘤形态,并精确定位具有诊断意义的区域。综上所述,这些进展使得MAG-GLTrans成为应对时间敏感型应用的理想解决方案,尤其是在对准确性和效率都有极高要求的术中冰冻切片诊断领域。
MAG-GLTrans是一种通用型全切片图像分析架构,专为计算病理学应用设计,可用于癌症亚型分类、转移检测及突变预测等任务,同时兼顾诊断能力、计算效率以及通信负担的优化。
数据可用性
本研究使用的数据均来自开源平台。所有癌症基因组图谱的全切片数据及标签均可通过NIH基因组数据共享平台获取(https://portal.gdc.cancer.gov)。TCGA-NSCLC和TCGA-NSCLC(冰冻切片)的全切片图像是从TCGA-LUAD(https://portal.gdc.cancer.gov/projects/TCGA-LUAD)和TCGA-LUSC(https://portal.gdc.cancer.gov/projects/TCGA-LUSC)两个项目下载的。TCGA-胶质瘤的全切片图像则来自TCGA-GBM(https://portal.gdc.cancer.gov/projects/TCGA-GBM)和TCGA-LGG(https://portal.gdc.cancer.gov/projects/TCGA-LGG)两个项目。CAMELYON16的数据可通过Grand Challenge平台公开获取,网址为https://camelyon16.grand-challenge.org。PANDA的全切片图像同样可通过Grand Challenge平台获取,地址为https://panda.grand-challenge.org/data/。MAG-GLTrans的代码及模型权重可在https://github.com/Bingchao-Zhao/MAG-GLTrans上获取。


