将人工智能与拉曼组学(Ramanomics)相结合用于活细胞生化微环境的无标记监测以推进细胞诊断与分子医学

《ACS Omega》:Integrating Artificial Intelligence with Ramanomics for Label-Free Monitoring of Biochemical Environment in Live Cells to Advance Cellular Diagnostics and Molecular Medicine

【字体: 时间:2026年06月08日 来源:ACS Omega 4.3

编辑推荐:

  拉曼光谱(Raman spectrometry)凭借无损表征显微亚细胞体积(包括活细胞中单细胞器)分子组成的能力,已革新细胞生物学研究。作为无标记(label-free)生化成像方法被引入,拉曼光谱的实际应用仍常依赖荧光探针对细胞器及感兴趣亚细胞区域进行定位。

  
拉曼光谱(Raman spectrometry)凭借无损表征显微亚细胞体积(包括活细胞中单细胞器)分子组成的能力,已革新细胞生物学研究。作为无标记(label-free)生化成像方法被引入,拉曼光谱的实际应用仍常依赖荧光探针对细胞器及感兴趣亚细胞区域进行定位。为克服此局限,研究人员报道了一种人工智能/机器学习(AI/ML)方法用于对各类亚细胞结构进行真正的无标记识别。研究人员探究了将机器学习(ML)应用于学习活细胞不同细胞系单个细胞器中一组生化参数间的关系,该生化参数由光学组学技术——拉曼组学(Ramanomics)从活细胞单个细胞器的拉曼光谱中提取。评估了数种分类算法,包括神经网络(neural networks)、随机森林(Random Forests)、支持向量机(support vector machines)、逻辑回归(logistic regression)及高斯过程分类(Gaussian process classification)。研究人员报道最优分类器——浅层神经网络(shallow neural network)利用生化参数对细胞器类型进行分类的表现。采用k折交叉验证(k-fold cross-validation, k=10)进行评估,最终输出分类结果与真实标注(ground truth)比对。k折交叉验证表明,基于神经网络(NN)的分类器利用拉曼组学(Ramanomics)测量数据区分不同细胞器具有显著准确率(约90%)。该方法使研究人员能够通过局部拉曼测量无标记地确定各独立细胞器的精确位置。
论文解读:《Integrating Artificial Intelligence with Ramanomics for Label-Free Monitoring of Biochemical Environment in Live Cells to Advance Cellular Diagnostics and Molecular Medicine》发表于《ACS Omega》
一、研究背景与立题依据
拉曼光谱(Raman spectrometry)是一种能够以亚微米分辨率绘制活细胞生化组成图谱的有力技术,其无需外源标记即可获取定量分子信息,适用于监测各类生物样品的分子微环境,甚至可对单细胞器进行生化表征。当与生物分子组分分析(biomolecular component analysis, BCA)方法结合时,可在光谱采集的显微位点提供脂质、蛋白质、糖类等十余种主要亚类的绝对浓度,由此发展出的"拉曼组学(Ramanomics)"可检测疾病(如癌症、代谢障碍或病毒感染)导致的细微细胞生化改变,衔接分子谱分析与活细胞成像。
尽管拉曼光谱因可识别胞内生物分子振动指纹而长期被视为无标记生物成像手段,但实际应用中仍需借助荧光标记物来辨识细胞器及亚细胞域,即在生化分析前需先可视化目标亚细胞结构。这种依赖带来多重局限:引入人为假象、降低测量重现性、荧光背景削弱检测灵敏度,且拉曼 protocol 通常限制多细胞器同时多重标记(多仅单荧光通道),无法在同一细胞内同步生化表征多个细胞器,致使拉曼光谱在细胞科学中的巨大潜力尚未充分发挥。为此,研究人员提出利用人工智能/机器学习(AI/ML)建立独立完整的拉曼组学技术,使其可通过分析任意细胞位点或随机点采集的拉曼光谱识别特定细胞器存在与否,实现真正意义上的无标记细胞器鉴定。
二、主要关键技术方法
研究人员使用HeLa细胞及前列腺腺癌细胞RC-77(样本队列来源:体外培养活细胞),以特异性荧光探针标记高尔基体(GA, NBD C6 ceramide-BSA)、内质网(ER, ER-Tracker Green)、脂滴(LD, LipidGreen2或透射光识别)及线粒体(MT, MitoTracker Green FM),在共聚焦拉曼显微镜(633 nm激光,~33 mW,100×物镜,0.7 μm×0.7 μm×1.5 μm 半高宽)上对单标记细胞器采集拉曼光谱(6×20 s累加),通过BCAbox软件定量17项生化参数(蛋白、DNA、mRNA、tRNA、糖原、总磷脂、饱和/不饱和脂肪酸磷脂比、磷脂酰胆碱、胆固醇组分、胆固醇酯组分、鞘磷脂、磷脂C═C键平均数、不饱和磷脂C═C键平均数、反式磷脂比、磷脂平均碳数、麦角固醇浓度等)。数据集含187个测量实例(GA 50、ER 61、LD 28、MT 48),采用10折交叉验证(k-fold cross-validation, k=10)评估五种ML算法(神经网络NN、随机森林RF、高斯过程分类GPC、逻辑回归LR、支持向量分类SVC),并以加权F值(weighted f-measure)、准确率(accuracy)及马修斯相关系数(Matthews corr. coeff.)为指标,同时使用t-SNE进行高维数据降维可视化,以SHAP(SHapley Additive exPlanations)框架分析特征重要性。
三、研究结果
Results and Discussion(结果与讨论)
  • Machine Learning-Based Classification(基于机器学习的分类)
    研究人员将细胞器识别构建为多分类问题,以17项BCA生化参数为输入特征、细胞器类型为输出标签。t-SNE非线性降维三维可视化显示四类细胞器数据存在适度分离,但线粒体(MT)与其他细胞器有所重叠。经10折交叉验证评估五种ML算法后,神经网络(NN, 多层感知机,3个全连接隐层各64个ReLU单元)表现最优:加权F值0.89、准确率0.89、马修斯相关系数0.85;随机森林(RF)为0.85/0.84/0.79,支持向量机(SVM)为0.84/0.84/0.79,逻辑回归(LR)为0.83/0.83/0.77,高斯过程(GP)为0.82/0.82/0.76。神经网络混淆矩阵显示除线粒体(MT)和内质网(ER)因生化谱重叠具一定挑战性外,其余类别分类良好。对神经网络倒数第二层64维激活值做t-SNE降维可见细胞器间分离明显优于原始无监督表示,证明NN能将原始BCA数据转化为具类间区分性的内部表征。SHAP分析表明17项生化参数对各细胞器预测贡献度不同。综上,研究人员可仅凭拉曼光谱自信识别所研究各类细胞器。
四、讨论与结论翻译(Conclusions部分浓缩翻译)
拉曼光谱是最具价值的无创生物传感技术之一,在细胞生物学与生物化学领域具突破潜力;高灵敏度与亚微米空间分辨率使其可测量单细胞器生化内容物并长时程监测,以揭示生理与病理状态下细胞调控或药物-细胞互作。然而现有基于拉曼组学的方法受限于需多重荧光成像(通常仅能同时标记一至两种细胞器),且无法对细胞质溶质(cytosol)采集拉曼光谱,荧光染料亦产生假象与背景降低检测灵敏度。为克服上述局限,研究人员引入基于AI/ML赋能拉曼组学的新策略:反向于现行先荧光染色定位再采谱的流程,先对任意感兴趣细胞区域采集拉曼光谱,再通过AI/ML分析实现各类细胞器的真正无标记映射。该技术使细胞物质可作为生化连续体而非孤立单细胞器内容物进行研究。研究人员计划下一步开发AI驱动的量子拉曼组学(quantum Ramanomics),利用相干拉曼散射模态如受激拉曼散射(stimulated Raman scattering, SRS)或相干反斯托克斯拉曼散射(coherent anti-Stokes Raman scattering, CARS),结合非经典光源(纠缠光子/压缩态光),以较自发拉曼散射更快的谱图采集速度、更高空间分辨率与信噪比获取大规模BCA数据集训练ML模型,并结合先进神经网络架构学习更丰富表征以提升性能。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号