《PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES INDIA SECTION A-PHYSICAL SCIENCES》:Relative Analysis for Celiac Disease Prediction System Using Fuzzy Logic Approach with Different Implementation Techniques
编辑推荐:
摘要:在过去五十年间,借助模糊逻辑推理引擎的混合智能系统,模糊逻辑在全球范围内的普及度不断上升。大量研究已利用模糊逻辑对慢性疾病进行了探索,但尚未开发出基于模糊逻辑的乳糜泻诊断系统。乳糜泻目前通过临床检测进行诊断,而通过本研究提出的系统,能够基于症状提供建议和
摘要:在过去五十年间,借助模糊逻辑推理引擎的混合智能系统,模糊逻辑在全球范围内的普及度不断上升。大量研究已利用模糊逻辑对慢性疾病进行了探索,但尚未开发出基于模糊逻辑的乳糜泻诊断系统。乳糜泻目前通过临床检测进行诊断,而通过本研究提出的系统,能够基于症状提供建议和乳糜泻预测。该拟议系统将在MATLAB和Python(PyCharm)中执行,其在MATLAB中产生92%的乳糜泻概率,而在Python中则达到96.15%的概率。因此,在拟议系统中,就准确率而言,Python的结果比MATLAB的结果更为合理。该拟议系统达到了98.66%的准确率、98.21%的灵敏度、94.83%的精确度,误差率为1.33%。研究人员从300名个体的研究中识别出55名乳糜泻患者(21名男性和34名女性)。该系统旨在支持临床决策,并应作为辅助性的临床决策支持工具,与标准诊断流程一同使用。工作相关性:鉴于全球各地存在多种用于诊断不同疾病的专家系统,模糊逻辑有助于诊断乳糜泻,这将对社会以及医生通过症状预测乳糜泻有所裨益,并可作为辅助性的临床决策支持工具使用。
**论文解读:基于模糊逻辑的乳糜泻预测系统——不同实现技术的比较分析**
**研究背景与问题**
乳糜泻(Celiac Disease, CD)是一种由麸质摄入引发的慢性自身免疫性肠病,主要影响小肠,导致营养不良、腹泻、疲劳、体重下降等症状。全球约1%的人口受其影响,但许多患者尚未被确诊。当前诊断的金标准包括血清学检测(如组织转谷氨酰胺酶抗体tTG检测)和十二指肠活检,但这些方法依赖临床检查,耗时且具侵入性。模糊逻辑(Fuzzy Logic, FL)作为一种处理不确定性的智能推理方法,已在多种慢性疾病诊断系统中得到应用,但针对乳糜泻的模糊逻辑预测系统尚属空白。研究人员开展此项研究,旨在利用模糊逻辑方法,基于症状输入构建一个可解释的乳糜泻预测系统,并比较其在MATLAB和Python两种实现平台上的性能,从而提供一种辅助临床决策支持工具。
**研究内容与结论**
研究人员设计并实现了一个基于Mamdani模型的模糊推理系统(Fuzzy Inference System, FIS),以腹痛(Stomach pain)、腹泻(Diarrhea)和体重下降(Weight loss)作为输入变量,输出为乳糜泻发生概率。系统在MATLAB R2021a和Python(PyCharm 2021)中分别实现,采用相同的三角隶属函数(Triangular membership function)和125条模糊IF-THEN规则。数据来源于一项由胃肠病学专家指导的筛查活动,共收集300名个体(164名男性,136名女性)的症状问卷数据。系统在MATLAB中给出92%的预测概率,在Python中给出96.15%的预测概率。通过混淆矩阵评估,系统整体准确率达到98.66%,灵敏度(召回率)98.21%,精确率94.83%,F1分数96.49%,误差率1.33%。研究共识别出55名真阳性乳糜泻患者(21男,34女),3例假阳性,1例假阴性。与决策树、逻辑回归、随机森林(Random Forests, RFs)和卷积神经网络(Convolutional Neural Networks, CNNs)等机器学习模型对比,所提出的模糊系统在准确率上表现最优,且具备高可解释性(基于IF-THEN规则),更适用于临床决策支持。研究结论指出,模糊逻辑系统可作为辅助工具,在缺乏24小时临床检测条件的场所帮助评估乳糜泻风险,未来将扩展输入参数并进行多中心验证。
**主要技术方法**
1. **数据采集与伦理考量**:研究人员在胃肠病学专家监督下组织筛查活动,通过结构化问卷收集300名个体(含症状和无症状者)的数据,所有参与者均签署知情同意书,数据匿名化处理。
2. **Mamdani模糊推理模型**:采用Mamdani型FIS,因其可解释性适合医疗决策。输入变量(腹痛、腹泻、体重下降)通过三角隶属函数进行模糊化,划分为多个模糊集(如轻度、中度、重度)。
3. **模糊规则库构建**:基于专家意见和症状相关性分析,建立125条IF-THEN规则,采用最大-最小(Max-Min)推理和质心(Centroid)去模糊化,生成输出概率。
4. **交叉验证与性能评估**:采用五折交叉验证(k-fold Cross-validation)和混淆矩阵评估模型稳定性,防止过拟合;并与多种机器学习模型进行对比,验证系统性能。
**研究结果**
**4. 结果与讨论**
**MATLAB与Python实现对比**:在相同输入(腹痛8.1,体重下降8.8,腹泻9.4)下,MATLAB规则查看器输出乳糜泻概率为92%,而Python模糊系统输出为96.15%。两者差异为4.15%,Python表现更优。
**与机器学习模型的比较分析**:柱状图显示,所提模糊系统准确率达98.66%,优于决策树、逻辑回归、随机森林和CNN。混淆矩阵显示:真阳性55例,真阴性241例,假阳性3例,假阴性1例。系统准确率=(55+241)/300=98.66%,误差率=1.33%,精确率=55/(55+3)=94.83%,召回率=55/56=98.21%,F1分数=96.49%。
**4.1 过拟合与泛化分析**:尽管准确率高,研究人员采用五折交叉验证评估模型稳定性,各折间方差低,表明预测性能稳定。置信区间分析确认性能指标在统计上有效。但承认需要独立数据集进行外部临床验证,未来将开展多中心研究。
**总结讨论**
论文结论部分指出,模糊逻辑在医疗应用中持续产生优化进展。虽然无法用模糊系统完全替代医生,但此类混合系统的有效性可辅助医生获得更合理的结果。本研究通过引入结构验证、与现有模型的比较基准以及基于规则系统的增强可解释性,区别于现有工作。这类系统在实验室和医院缺乏24小时临床检测工具时将具有优势,用户可无需痛苦检测即可评估疾病概率。未来将扩展更多参数以提高准确率,并在印度范围内扩大调查以比较乳糜泻患者比例(目前全球患病率低于5%)。系统还可扩展为在预测后提供临床检查建议。