利用可解释人工智能（Explainable Artificial Intelligence, XAI）预测原发性进行性失语症（Primary Progressive Aphasia, PPA）患者的脑淀粉样蛋白（Amyloid β, Aβ）状态

《npj Dementia》：Predicting amyloid status in Primary Progressive Aphasia using explainable artificial intelligence

【字体：大中小】 时间：2026年06月02日 来源：npj Dementia

编辑推荐：

　　近期，靶向β-淀粉样蛋白(Amyloid β, Aβ)的阿尔茨海默病(Alzheimer's Disease, AD)疾病修饰疗法取得进展，证实可显著减缓认知衰退速率。然而，Aβ阳性检测手段（脑脊液分析与AβPET）费用高昂，因此亟需开发简便易行的筛查方法以及

近期，靶向β-淀粉样蛋白(Amyloid β, Aβ)的阿尔茨海默病(Alzheimer's Disease, AD)疾病修饰疗法取得进展，证实可显著减缓认知衰退速率。然而，Aβ阳性检测手段（脑脊液分析与AβPET）费用高昂，因此亟需开发简便易行的筛查方法以及时将患者引导至适宜的诊断流程。本研究采用预训练语言模型Distil-RoBERTa，基于短篇连接言语(connected speech)样本预测Aβ阳性状态，并运用可解释人工智能(Explainable Artificial Intelligence, XAI)方法提取可供临床实践参考的可解释语言学特征。研究人员收集71例三种变异型原发性进行性失语症(Primary Progressive Aphasia, PPA)患者的言语样本，Aβ阳性经由脑脊液、AβPET或尸检确认，其中51%受检者为Aβ阳性。Distil-RoBERTa训练参数为16个epoch、批次大小6、学习率5×10?5；采用局部可解释模型无关解释(Local Interpretable Model-agnostic Explanations, LIME)算法构建解释模型以解析分类器的推断依据。经10次重复10折交叉验证，分类器平均准确率达92%（SD=0.01），较既往同类研究绝对提升10%。LIME解释模型对分类器预测概率拟合准确率达97%，并揭示若干可能表征Aβ阳性的新型言语模式。结果表明，连接言语是预测PPA患者Aβ存在与否有价值的诊断输入；借助XAI技术可发现可供专科临床验证的新型语言学特征。连接言语的计算语言学分析有望成为AD及相关疾病新型评估手段。

论文解读：利用可解释人工智能预测原发性进行性失语症的淀粉样蛋白状态

该研究发表于《npj Dementia》。目前，靶向β-淀粉样蛋白（Amyloid β, A_β）的疾病修饰疗法（如Donanemab、Lecanemab）已被批准用于早期阿尔茨海默病（Alzheimer's Disease, AD），但其应用前提是对患者A_β状态的确证。脑脊液（Cerebrospinal Fluid, CSF）检测和A_β正电子发射断层扫描（Positron Emission Tomography, PET）虽为金标准，却因侵入性或高昂费用限制了广泛可及性，导致部分患者错失早期抗A_β治疗机会。原发性进行性失语症（Primary Progressive Aphasia, PPA）是神经退行性疾病（AD或额颞叶变性Frontotemporal Lobar Degeneration, FTLD）首发的语言综合征，其中Logopenic变型（logopenic variant PPA, lvPPA）多伴A_β病理。既往基于手工特征（如句法分析）的连接言语分析预测A_β状态准确率约77%，且难以发现未编码的新特征。为此，研究人员拟利用预训练大语言模型深层语义知识及可解释人工智能（Explainable Artificial Intelligence, XAI）技术，从短篇连接言语中高精度预测PPA患者A_β状态并挖掘潜在语言学标志物。

主要关键技术方法：

研究人员纳入美国马萨诸塞总医院（Massachusetts General Hospital, MGH）PPA纵向研究中71例符合标准的英语母语PPA患者（36例A_β+，35例A_β?；含lvPPA、语义变型svPPA、非流利变型nfvPPA），A_β状态经CSF/PET/尸检确定。采集西方失语症成套测验修订版（Western Aphasia Battery–Revised, WAB-R）野餐场景描述任务的录音并逐字转录。采用Distil-RoBERTa（基于RoBERTa蒸馏的小参数Transformer模型）接全连接层做二分类微调（16 epochs, batch=6, lr=5e^?5），执行10次重复10折交叉验证选优。使用LIME（Local Interpretable Model-agnostic Explanations）算法对黑盒模型做局部线性近似，获取词项及词性（Part of Speech, POS）的权重贡献；结合spaCy进行POS标注（增设存在性there EX标签），提取倒数第二层上下文嵌入并做子词对齐平均，通过奇异值分解（Singular Value Decomposition, SVD）降维可视化特征空间。

研究结果：

Classification（分类性能）：

Distil-RoBERTa对A_β阳性与阴性的区分平均准确率为X?=0.92（SD=0.02），显著优于平衡数据集中的机会水平（χ²(1,N=71)=55.94, p<0.001），较既往研究提升约10%绝对准确率。

Interpretation（解释模型验证）：

LIME解释模型对黑盒分类器行为拟合良好——平均Kullback-Leibler散度X?=0.03（SD=0.03），距离加权准确率X?=0.95（SD=0.05）；解释模型对真实样本预测分类器标签及金标准标签的分类指标亦表明LIME可较好捕捉原模型决策边界。

Feature importance by part of speech（按词性划分的特征重要性）：

采用加和与均值乘积评分法平衡频次偏差后，预测A_β阳性最重要的前5类词性依次为：感叹词（interjections）、限定词（determiners）、动词（verbs）、名词（nouns）、存在性there（existential "there"/EX）；预测A_β阴性最重要的前5类为：限定词、名词、感叹词、助动词（auxiliaries）、动词。

Feature discovery（特征发现/具体词项模式）：

通过LIME权重结合嵌入降维可视化发现：A_β+患者倾向使用语义空泛/抽象动词（如"get""have""make"），A_β?多用具体动词（如"pour""sail""fly"）；A_β+名词多为前景物体或泛指词（"radio""kite""car""boy""stuff""thing"），少用背景场景词（"water""beach""fisher"）；A_β+更多使用填充停顿"uh"、不定冠词"a"（vs定冠词"the"）、存在性there（there is/are结构），较少使用空间介词（如"in""on""near"）和并列连词，而A_β?相反。

讨论与结论：

研究人员指出，使用Distil-RoBERTa微调实现了92%的A_β状态预测准确率，超越既往基于手工工程特征的连接言语研究。通过LIME自底向上发现的新语言学标记包括：高频抽象动词替代具体动词、不定冠词偏好、填充停顿增多、存在性there高频使用及空间介词减少等，这些可能与lvPPA的词检索困难、语义通达受损及视空间注意缺陷有关。XAI使模型决策透明化并揭示了既往未被编码的言语微特征。该方法成本低、易获取，可作为初筛工具将疑似A_β病理患者分流至专科进行CSF或PET确证，适配抗A_β疾病修饰疗法的适用人群筛选需求。研究局限性包括样本量偏小、仅基于英语数据、未融合声学特征，未来需在独立多中心队列及跨语言样本中验证，并可结合情绪/注意力因素校正及融入语音模态以提升泛化性与精度。结论是：连接言语结合预训练语言模型与XAI可有效预测PPA患者A_β状态并发现新型语言学生物标志物，有望成为AD及相关疾病无创数字筛查的重要方向。

热点排行