《Frontiers in Artificial Intelligence》:Heart disease prediction using rough neutrosophic sets and dual-attention neural networks: RNS-OptiDANet
编辑推荐:
本研究针对传统心脏病诊断方法精度不足、数据不确定性高的问题,提出了一个名为RNS-OptiDANet的混合预测框架。研究人员将粗糙集理论用于特征选择,并转化为粗糙中性集表示以捕获数据不确定性,随后构建了集成通道注意和软注意机制的优化双注意神经网络进行特征提取,最终通过随机森林模型分类。该模型在测试中达到了99.51%的准确率,显著优于现有方法。其意义在于,为临床提供了一个兼具高精度、强鲁棒性、可解释性和不确定性处理能力的心脏病风险早期评估工具,推动了可解释人工智能在心血管疾病预测中的实际应用。
在全球范围内,心血管疾病是威胁人类健康的“头号杀手”,每年导致超过1700万人死亡,其中约三分之一发生在70岁以下人群。面对如此严峻的形势,传统诊断方法在应对复杂病例时,其准确性和时效性常常捉襟见肘,无法满足早期预警和个性化干预的迫切需求。正是在这个背景下,机器学习和深度学习技术为心脏病的预测带来了新的曙光。然而,挑战依然存在:如何从海量、充满噪声和不确定性的医疗数据中,精准地“打捞”出那些真正指示疾病的微弱信号?现有的模型往往要么“只见树木,不见森林”,忽略了数据内在的模糊性;要么像个“黑箱”,决策过程难以理解,让医生难以信任和采纳。为了攻克这些难关,研究人员开展了一项探索性研究,旨在构建一个既能准确预测、又能解释“为何如此预测”的智能诊断助手。他们的研究成果最终以题为“Heart disease prediction using rough neutrosophic sets and dual-attention neural networks: RNS-OptiDANet”的论文,发表在了人工智能领域的重要期刊《Frontiers in Artificial Intelligence》上。
为了构建这样一个强大的预测模型,研究人员整合了多种前沿技术。首先,他们利用基于可辨识矩阵的粗糙集快速约简算法(RST-QRDM)对包含1025个样本、13个临床特征的心脏病数据集进行了高效的特征选择,筛选出年龄、性别、空腹血糖等五个核心特征。接着,将这些选出的特征转化为粗糙中性集表示,以数学形式精准刻画每个特征在“隶属”、“不确定”和“非隶属”三个维度上的信息,有效应对医疗数据固有的不确定性。随后,研究人员设计了名为OptiDANet的优化双注意神经网络,它融合了通道注意模块(CAM)和软注意模块(SAM),前者能自动识别并加权关键特征通道,后者则能捕捉特征间的动态上下文关系。这个网络的超参数(如学习率、批量大小)由一个名为Optuna的自动化优化框架进行高效寻优。最后,从优化后的OptiDANet中提取的深度特征,被送入以稳定和高精度著称的随机森林模型中进行最终的分类决策。整个研究流程确保了从数据预处理、不确定性建模、特征学习到分类决策的每一个环节都得到了优化。
研究结果显示,这个名为RNS-OptiDANet的混合模型展现出了卓越的性能:
- •
模型性能优异:在独立测试集上,该模型达到了惊人的99.51%的准确率(Acc)、99.52%的精准率(Prn)、99.51%的召回率(Rcl)和0.9951的F1分数。为了验证其稳定性,研究还进行了5折交叉验证,平均准确率依然高达98.15%,且标准差很小,表明模型具有良好的泛化能力,而非过度拟合训练数据。模型的训练和验证损失曲线也呈现稳定下降和收敛趋势,没有出现过拟合迹象。
- •
消融研究验证组件贡献:研究人员通过系统的消融实验,逐一验证了模型中每个核心模块的必要性。实验表明,单独的机器学习模型(如随机森林)本身已能达到约98.5%的准确率。但当引入粗糙集进行特征选择后,模型效率得到提升。进一步加入粗糙中性集(RNS)进行不确定性表征后,模型性能在多个指标上得到小幅但稳定的提升。而最终,当整合了经过Optuna优化的双注意神经网络(OptiDANet)进行深度特征提取后,模型性能实现了质的飞跃,达到了最优的99.51%准确率,充分证明了整个框架设计的协同增效作用。
- •
对比现有方法优势明显:将RNS-OptiDANet模型与近年来其他先进的心脏病预测模型(如基于XGBoost和随机森林的混合特征选择模型、稀疏引导注意架构、以及结合Optuna优化的XGBoost模型等)进行对比,结果显示本文提出的模型在准确率等关键指标上全面领先,验证了其优越性。
- •
计算成本在可接受范围:尽管引入了深度神经网络增加了模型复杂度,导致训练时间(1.28秒)长于基线随机森林模型(0.23秒),但其推理时间(每样本0.1889毫秒)仍然极低,完全满足临床实时或近实时预测的需求,在精度和效率之间取得了良好平衡。
- •
模型具备可解释性:研究集成了可解释人工智能模块,如SHAP和LIME,能够对模型的预测结果进行特征层面的解释。例如,可以分析出年龄、胆固醇水平、胸痛类型等特定特征对某个预测结果为“患病”的贡献度,这极大地增强了模型的临床透明度和医生的信任度。
在研究结论与讨论部分,作者总结道,本研究成功开发并验证了RNS-OptiDANet这一创新的混合智能框架,它创造性地将粗糙集理论、中性集理论、优化双注意神经网络和随机森林分类器融为一体。该框架的核心贡献在于:1)通过粗糙集与可辨识矩阵的结合,实现了高效、稳定的特征选择,降低了数据维度;2)利用粗糙中性集,为处理医疗数据中普遍存在的不确定性、模糊性和不完整性提供了严谨的数学工具;3)设计的OptiDANet模型通过双注意机制,能够自动聚焦于最具判别性的特征模式,抑制噪声,从而提取出更鲁棒、更高效的深度特征表示;4)整个流程结合Optuna自动化优化,确保了模型性能达到最优。这项工作不仅在心臟病预测的准确率上设立了新的标杆,更重要的是,它为解决医疗人工智能领域长期存在的“黑箱”问题和数据不确定性问题提供了切实可行的技术路径。其意义超越了单一疾病,为其他需要处理不确定、不完整数据的复杂疾病(如癌症、慢性肾病)的预测建模提供了有价值的参考范式。未来,研究人员计划将该模型应用于更大规模、多中心的临床数据集,并探索将其与更先进的Transformer架构或图神经网络结合,以进一步提升其处理更复杂医学关系的能力,最终推动可解释、可靠的人工智能诊断工具真正走向临床实践,造福广大患者。