基于机器学习联合乳腺X线摄影与DCE-MRI对BI-RADS 4及BI-RADS 5微钙化灶进行良恶性鉴别分类

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Tomography》：Machine Learning-Based Classification of BI-RADS 4 and BI-RADS 5 Microcalcifications in Mammography Combined with DCE-MRI for Malignant–Benign Discrimination

【字体：大中小】 时间：2026年06月18日 来源：Tomography 2.2

编辑推荐：

　　背景与目的：乳腺癌仍是全球女性癌症相关死亡的主要原因之一。早期准确表征可疑乳腺X线摄影微钙化灶对于改善诊断决策及减少不必要的有创操作至关重要。BI-RADS 4及BI-RADS 5分类的微钙化灶是临床重要的影像学发现，然而由于形态学及分布模式存在重叠，良恶性病

背景与目的：乳腺癌仍是全球女性癌症相关死亡的主要原因之一。早期准确表征可疑乳腺X线摄影微钙化灶对于改善诊断决策及减少不必要的有创操作至关重要。BI-RADS 4及BI-RADS 5分类的微钙化灶是临床重要的影像学发现，然而由于形态学及分布模式存在重叠，良恶性病变的鉴别仍具挑战性。本研究旨在开发一种基于结构化特征的机器学习（ML）模型，通过整合乳腺X线摄影描述符、患者年龄及动态对比增强磁共振成像（DCE-MRI）强化表现，预测乳腺微钙化灶的病理诊断。方法：数据集纳入53例经活检证实的病例，包含临床及影像学变量，包括患者年龄、钙化形态、钙化大小、分布模式、DCE-MRI强化状态及组织病理学结果。研究评估了多种传统机器学习算法，包括逻辑回归（LR）、径向基核函数支持向量机（SVM-RBF）、K近邻（KNN）、决策树（DT）、随机森林（RF）、极端随机树（Extra Trees）、梯度提升（GB）、自适应增强（AdaBoost）及分类提升（CatBoost）。采用五折交叉验证网格搜索进行超参数优化。模型性能通过准确率、精确率、召回率、F1值、受试者工作特征曲线下面积（ROC-AUC）及对数损失评估。结果：逻辑回归获得最佳整体性能，内部评估准确率为0.909，F1值为0.889；而AdaBoost在内部评估中召回率达1.000。然而，鉴于样本量有限且缺乏外部验证，这些发现应视为初步结果。结论：研究结果提示，结构化影像学描述符联合DCE-MRI强化信息或可支持BI-RADS 4–5微钙化灶的恶性风险分层，但临床应用前仍需更大规模的多中心研究验证。

乳腺癌是全球女性最常见的恶性肿瘤，也是癌症相关死亡的第二大原因，乳腺X线摄影筛查可使乳腺癌死亡率降低约30%。乳腺微钙化灶是乳腺癌的早期征象之一，在筛查中可作为30%–50%乳腺癌的唯一阳性发现。根据乳腺影像报告和数据系统（BI-RADS）第五版，BI-RADS 4类和5类可疑微钙化灶建议活检，但其恶性阳性预测值（PPV）波动于15.9%–90.6%之间，且放射科医师间存在显著差异，导致不必要的活检、医疗费用增加及患者焦虑。动态对比增强磁共振成像（DCE-MRI）的对比剂摄取是诊断恶性病变敏感性最高的标准，但DCE-MRI评估简化为二元变量时不应单独排除恶性可能。尽管深度学习在乳腺影像中展现出潜力，但其需要大规模标注图像数据集、病灶分割及严格验证。因此，在有限回顾性数据集中，基于常规乳腺X线摄影和DCE-MMI解读的结构化影像学描述符可能为初步机器学习恶性预测提供一种实用且可解释的方案。目前联合乳腺X线摄影与DCE-MRI预测乳腺钙化灶恶性的研究较少，本研究旨在开发并内部评估一种基于结构化特征的机器学习框架，以鉴别良恶性BI-RADS 4–5乳腺X线摄影微钙化灶。

研究人员采用的技术方法包括：自?zmir Atatürk培训与研究医院2023年3月至2025年10月的单中心回顾性队列，最终纳入53例活检证实的BI-RADS 4–5微钙化灶病例；影像学评估由一名具有6年以上经验的乳腺放射科医师独立完成，乳腺X线摄影采用Giotto全数字化乳腺X线摄影系统获取头尾位（CC）及内外斜位（MLO）图像，DCE-MRI采用Siemens MAGNETOM Lumina 3.0T扫描仪及18通道乳腺线圈，动态增强采用标准3D T1压脂VIBE/Dixon-VIBE序列；特征变量包括连续变量患者年龄，以及分类变量钙化形态（粗糙型、无定形型、多形性、细线型）、钙化大小（<10 mm、10–20 mm、>20 mm）、分布模式（弥漫性、区域性、节段性、线性、簇状）和DCE-MRI二元强化状态（有强化/无强化）；九种传统机器学习算法采用五折交叉验证网格搜索进行超参数优化，评估指标涵盖准确率、精确率、召回率、F1值、ROC-AUC及对数损失，并通过Wilson评分法及Bootstrap重采样计算主要性能指标的近似95%置信区间。

研究结果分析如下：

**模型性能比较与评估**
逻辑回归获得最高内部性能点估计值，准确率为0.909，F1值为0.889，ROC-AUC为1.000；AdaBoost recall达1.000，准确率为0.818，F1值为0.800；支持向量机（径向基核函数）呈现均衡性能，准确率0.818，精确率0.750，召回率0.750，F1值0.750，ROC-AUC为0.857。K近邻、决策树、随机森林、梯度提升及CatBoost表现中等，极端随机树F1值最低。由于数据集仅53例且存在中度类别不平衡（良性34例，恶性19例），在小测试集中即使1–2例假阳性或假阴性亦可显著影响指标，故各类指标应谨慎解读为探索性内部性能估计。置信区间对多项指标而言较宽，反映了测试病例数有限的统计学不确定性。

**混淆矩阵分析**
逻辑回归混淆矩阵显示其分类效果最佳，正确分类6例良性及4例恶性样本，仅1例良性误分为恶性，无恶性漏诊，展现出高判别能力并有效减少临床 significant 假阴性。支持向量机（径向基核函数）正确分类6例良性及3例恶性，各1例误判，敏感性与特异性平衡良好。AdaBoost完美识别所有恶性实例（4例真阳性），无假阴性，但2例良性误判为恶性，假阳性率稍高，在以正确分类恶性标本为目标的临床决策支持场景中该偏倚或可接受。K近邻、决策树、随机森林、梯度提升及CatBoost分类准确度中等，假阳性及假阴性倾向相对较高。极端随机树分类准确度最低，存在多例恶性样本误分为良性，临床漏诊风险较高。

讨论部分，研究人员指出本研究为基于结构化临床-影像学描述符的机器学习模型提供了初步内部评估证据。约80%–90%导管原位癌（DCIS）与微钙化灶相关，50%乳腺癌中微钙化灶是乳腺X线摄影唯一可检测发现，而多数微钙化灶经诊断性介入操作证实为良性。与直接基于图像的影像组学或深度学习模型不同，本框架基于常规放射科解读即可获得结构化描述符，在数据有限场景中具有实用性和可解释性，但不应视为放射科医师评估的替代或临床可部署工具。文献中，Cai等开发的卷积神经网络（CNN）微钙化灶分类准确率为89.32%；Stelzer等针对单纯BI-RADS 4微钙化灶的AUC-ROC为0.82–0.83；Liu等联合深度学习与临床变量的模型诊断能力接近高年资放射科医师；Lei等的影像组学模型验证队列AUC为0.80。本研究聚焦BI-RADS 4–5微钙化灶，代表日常临床最具挑战性的患者群体。研究存在多重局限性：单中心仅53例、19例恶性病变；仅行内部五折交叉验证而无独立外部验证队列；未进行直接图像影像组学、自动分割或深度学习分析；影像学特征由单名放射科医师手动评估，无法评估观察者间变异；DCE-MRI信息简化为二元强化变量，未纳入强化曲线、定量灌注参数等；未进行正式统计比较检验、校准分析、决策曲线分析及放射科医师单用性能比较；扫描仪变异、选择偏倚及回顾性设计亦可能影响结果。

研究结论如下：本研究开发了基于结构化特征的机器学习框架，利用患者年龄、乳腺X线摄影描述符及DCE-MRI强化状态鉴别良恶性BI-RADS 4–5乳腺X线摄影微钙化灶。在评估的传统机器学习算法中，逻辑回归获得最佳内部性能，准确率为0.909，F1值为0.889，ROC-AUC为1.000。然而，因样本量有限、单中心回顾性设计及缺乏外部验证，这些发现应谨慎解读。研究结果提示，常规可获得的影像学描述符对可疑微钙化灶的初步恶性风险分层具有潜在价值，但临床实施前仍需更大规模多中心研究，纳入外部验证、放射科医师性能比较、校准分析、决策曲线分析及定量影像组学或深度学习衍生影像标志物。在此语境下，所提出的框架应被视为探索性决策支持方法，而非临床可部署模型。

联系信箱：

粤ICP备09063491号

热点排行