DREAMER-S:面向空间生物学的基于深度学习注意力多示例方法及可解释表征

《PLOS Computational Biology》:DREAMER-S: Deep leaRning-Enabled Attention-based Multiple-instance approaches with Explainable Representations for Spatial biology

【字体: 时间:2026年05月27日 来源:PLOS Computational Biology 3.6

编辑推荐:

  在不依赖像素级标注的前提下,从大规模多通道空间成像数据中识别与诊断或预后类别显著相关的图像特征仍具挑战性。研究人员提出DREAMER-S,一种基于注意力的多示例学习(Multiple Instance Learning, MIL)框架,仅利用图像或切片级标签,

  
在不依赖像素级标注的前提下,从大规模多通道空间成像数据中识别与诊断或预后类别显著相关的图像特征仍具挑战性。研究人员提出DREAMER-S,一种基于注意力的多示例学习(Multiple Instance Learning, MIL)框架,仅利用图像或切片级标签,即可在三维成像超立方体中学习对下游分类最具信息量的空间特征。研究人员在量子级联激光红外(Quantum Cascade Laser infrared, QCL-IR)组织成像中验证DREAMER-S,通过空间渲染注意力权重,在无人工标注条件下高亮显示与类别相关的光谱实例。由于MIL注意力层可为空间实例分配可解释的权重,该方法可广泛迁移至需要在高维数据集中通过实例级筛选聚焦于感兴趣区域的空间生物学应用场景。研究人员进一步在结直肠癌患者来源异种移植(Patient-Derived Xenograft, PDX)模型的化疗反应任务中评估DREAMER-S。经调优后,DREAMER-S对化疗敏感型PDX(CRC0344)与低响应型PDX(CRC0076)的光谱实例区分F1分数约为0.95。为验证可解释性,研究人员将模型显著性关联至细胞生理层面,观察到:(i)高注意力光谱的无监督均匀流形近似与投影(Uniform Manifold Approximation and Projection, UMAP)嵌入可按处理类型(化疗、凋亡增敏剂、联合治疗、载体对照)对样本分层;(ii)选定光谱标志物与同一PDX系统中独立测量的促凋亡蛋白水平相关。上述结果支持光谱信号与凋亡通路之间的机制关联,并将DREAMER-S确立为一种高效、可解释的高维空间生物学成像数据分析方法。
该研究针对高维空间生物学成像数据缺乏像素级标注、传统分析方法难以兼顾计算效率与可解释性的瓶颈,以结直肠癌患者来源异种移植(PDX)模型为对象,开发并验证了基于深度学习注意力机制的多示例学习(MIL)框架DREAMER-S,用于量子级联激光红外(QCL-IR)成像数据的化疗敏感性分类与空间生物标志物挖掘。研究发表于《PLOS Computational Biology》。
关键技术方法方面,研究人员使用已发表的CRC0076与CRC0344 PDX队列组织切片,经QCL-IR获取480×480像素、213个波数的高光谱化学图像;采用橡胶带基线校正、酰胺I峰阈值分割及矢量归一化完成光谱预处理;以整张图像为“包”、单个光谱为“实例”构建MIL数据集,按动物个体划分训练与验证集;设计受残差网络启发的线性深度模型,集成MIL注意力池化层;通过两阶段网格搜索优化网络深度、宽度、扩展策略及学习率;结合SHapley加性解释(SHAP)、UMAP聚类及皮尔逊相关性分析,实现模型决策机制解析与生物学验证。
研究结果如下:
模型架构参数优化:对比“收缩型”(每模块减半节点数)与“扩张型”(每模块倍增节点数)网络,收缩型在稳定性与峰值性能上均占优,无残差连接、2个模块、初始隐藏节点64的配置单轮验证F1分数达0.950。
引入残差连接的模型架构优化:残差连接显著稳定了扩张型网络的训练动态,但未进一步提升已表现优异的收缩型模型性能,最终选定非残差收缩架构。
学习率参数优化:Adam优化器学习率为1×10-3时收敛最优,最终模型在50轮训练中最佳验证F1分数为0.9499。
基于注意力光谱实例的显著组织区域识别:MIL注意力权重可自动定位图像中与分类相关的空间区域,CRC0076高注意力区域呈局灶分布,CRC0344则弥散分布,无需人工标注即可实现空间特征筛选。
基于SHAP的模型预测分析:模型决策主要依赖磷酸盐伸缩区(~965 cm-1)与羰基伸缩区(1710–1745 cm-1)等生化相关波段,并能有效忽略石蜡等实验伪影信号。
基于治疗模式的显著光谱聚类:对高注意力光谱进行UMAP降维,最优参数下标准化互信息(NMI)达0.994,治疗组形成独立紧密簇,CRC0344经凋亡增敏剂处理后酰胺I与酰胺III区吸光度显著升高,对应药物诱导凋亡的生化改变。
显著光谱与促凋亡蛋白表达标志物的相关性:在CRC0076中,酰胺I带吸光度与Puma蛋白表达呈强正相关(r=0.89);在CRC0344中,该相关性反转,酰胺III带成为关键光谱标志物(与Bim r=0.75,与Puma r=0.77),证实光谱特征与治疗反应的分子通路直接关联。
讨论与结论部分指出,DREAMER-S通过端到端流程实现了高维空间成像数据的无标注生物标志物发现,其注意力机制兼具计算效率与空间可解释性。SHAP分析揭示了模型所捕获的核酸、脂质与蛋白质生化特征,且能排除实验干扰。UMAP与蛋白相关性验证共同证实,高注意力光谱包含丰富的药效动力学信息,且不同PDX模型具有特异性的光谱-分子关联模式。该研究为空间生物学提供了可迁移的分析工具,也为光谱组织病理学的临床转化与个体化用药指导奠定了方法学基础。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号