《Neurocomputing》:A Review of Fuzzy Cognitive Maps and their Perspectives for Explainable Decision Making
编辑推荐:
近年来,可解释人工智能(Explainable Artificial Intelligence, XAI)研究取得显著进展,这主要归因于机器学习(Machine Learning, ML)模型在各领域的广泛应用,以及人们对其推断结果背后原因的理解需求——大多数
近年来,可解释人工智能(Explainable Artificial Intelligence, XAI)研究取得显著进展,这主要归因于机器学习(Machine Learning, ML)模型在各领域的广泛应用,以及人们对其推断结果背后原因的理解需求——大多数现有模型属于“黑箱”模型,缺乏可解释性。为解决这一问题,最具前景的研究方向之一为模糊认知图(Fuzzy Cognitive Maps, FCMs)。凭借其简洁而有效的知识建模结构,FCMs已适用于多种科学领域。尽管已有大量研究关注FCMs的各类改进与应用,但其在可解释及透明决策方面的潜力尚未得到充分挖掘。本综述从透明、可解释及可解释机器学习的视角,系统梳理了FCMs的最新研究进展,主要贡献包括:a) 系统回顾2018年至2024年间提出的FCMs最新发展及其在XAI领域的应用前景;b) 介绍近期用于训练FCMs的学习算法;c) 汇总FCMs的最新应用,包括用于可解释一维信号与图像分析的前沿模型;d) 指出当前FCM模型的局限性,并提出开放挑战与研究路径,为面向XAI的创新提供指引。
本文主体内容按如下结构展开:
- 1.
引言
软计算方法能够处理不确定性、不精确性与非线性问题,从而使复杂问题可解。机器学习模型在关键任务预测中日益普及,但多数模型无法解释推断结果,影响了信任度。模糊认知图是一种有向图,由代表概念(concepts)的节点与表示概念间因果关系的加权边构成。相较于决策树等其他图模型,FCMs的优势在于:融合模糊逻辑以处理不确定性与数据局限性;可引入人类专家知识定义概念关系,适用于医疗决策等领域;支持动态迭代推理,能根据输入数据调整权重;可建模更复杂的系统关系。尽管已有大量FCM综述聚焦于学习算法或特定领域应用,但鲜有研究系统分析其在XAI中的潜力。本文首次系统梳理2018—2024年间FCM在可解释决策中的研究进展,涵盖新型变体、学习方法与应用。
- 2.
基础背景
2.1 透明度、可解释性与可说明性
在机器学习语境中,透明度指模型内部学习与推理过程可被人类理解并复现的属性;可解释性指模型能基于输入向人类提供预测原因线索的能力;可说明性则进一步要求模型能以人类可理解的方式详细解释预测原因,并结合领域语义。FCMs因其图结构与因果关系可视化特性,天然具备透明度与可解释性,但需结合语义增强才能实现完整的可说明性。
2.2 模糊认知图
2.2.1 FCM构建
FCM构建可通过专家咨询、历史数据或混合方式完成,典型步骤包括:邀请领域专家定义图概念与关系;使用IF-THEN规则描述概念关联;用语言值(如“低”“中”“高”)表示影响程度;聚合去模糊化后得到概念间权重。FCM可定义为四元组,权重矩阵Wij∈ [-1, 1],正值表示概念Ci增加会带动Cj增加,负值表示反向影响,零值表示无关联。FCM结构简单、易实现,可直接提供可理解的预测,但传统FCM依赖人工定义结构且难以建模非线性关系。
2.2.2 更新规则与传递函数
FCM推理通过离散时间步迭代更新概念激活值,常用更新公式为Ai(t+1)= f(∑j≠iwji· Aj(t)),其中f为传递函数。常用传递函数包括离散二值函数、双极性函数、连续双曲函数与Sigmoid函数,后者因预测性能优异而被广泛使用。
2.2.3 FCM是否具备透明、可解释或可说明性?
FCM的图结构与因果关系使其不同于黑箱模型,概念定义贴合系统特征,权重直观反映因素影响强度,且推理过程可复现,因此具备透明度。其可视化特性允许用户观察概念随时间的演化关系,从而理解预测依据,具备可解释性。但传统FCM仅展示结构关联,未提供充分的原因细节,需结合领域语义(如在图像分类中关联“猫耳”“花瓣”等语义概念)才能成为可说明模型。例如,在Caltech-101数据集的图像分类示例中,FCM通过将输入特征与类别概念关联,可直观展示“野猫耳朵”与“野猫”类别的正向因果、“睡莲花瓣”与“野猫”的负向因果,从而实现语义级可解释推理。
- 3.
研究方法
本研究基于Scopus数据库,采用PRISMA系统评价流程筛选文献。检索时间为2018—2024年,关键词为“fuzzy cognitive map”。初检获得1080篇文献,经去重、排除非英文与非正式出版物后,优先纳入Q1/Q2期刊与A类会议论文,最终筛选出138篇核心文献进行综述。
- 4.
不同FCM类型及其可解释前景
4.1 高阶模糊认知图(High-order FCMs, HFCMs)
HFCMs通过多层结构捕捉概念间的高阶交互,可建模间接与非线性关系。其状态向量计算引入k阶权重wijk,结合偏置项与传递函数实现推理。近年HFCM变体包括:结合Haar小波变换与小波-HFCM,用于大规模非平稳时间序列预测;结合稀疏自编码器(SAE)的SAE-FCM,解决局部最优与精度问题;结合经验模态分解(EMD)的EMD-HFCM,处理非平稳序列;核映射驱动的Kernel-HFCM,用于金融时间序列;结合弹性网的ElasticNetHFCM,基于脑电(EEG)信号预测人体动作;结合改进变分模态分解(IVMD)的IVMDHFCM、结合经验小波变换(EWT)的EWTHFCM,以及用于光伏功率预测的TSE-HFCM。HFCMs通过高阶因果提升了预测精度与系统动力学理解能力。
4.2 模糊灰色认知图(Fuzzy Grey Cognitive Maps, FGCMs)
FGCMs基于灰色系统理论,用区间灰数表示不确定或未知的因果关系强度,适用于高不确定性场景。其推理过程与传统FCM一致,但权重为灰数?wij∈ [w?ij, w?ij]。近年变体包括:采用广义灰数的FGCM,用于工业过程控制;结合直觉模糊集的区间值FGCM(IFGCM),用于股票市场预测;结合灰色聚类(GC)的GC-FGCM,减少专家参与并提升收敛速度。FGCMs通过灰色度量化专家犹豫,增强了不确定性下的透明度。
4.3 直觉模糊认知图(Intuitionistic FCMs, iFCMs)
iFCMs基于直觉模糊集(IFSs),同时考虑隶属度μ、非隶属度γ与犹豫度h=1-μ-γ,更细致地刻画专家不确定性。其推理过程迭代计算概念的隶属与非隶属对,通过传递函数更新。近年变体包括:结合证据推理(ER)的高阶iFCM(ER-IFCMR),用于肺炎风险评估与社会经济问题;结合TOPSIS的区间值iFCM(IVIFCM-TOPSIS),用于供应链供应商选择;基于原始序列数据与粒子群优化(PSO)的iFCM,自适应调整犹豫度;结合Dempster-Shafer理论的扩展iFCM(EIFCM);结合变分模态分解(VMD)的高阶iFCM(VMD-HIFCM),用于时间序列预测;以及用于食物浪费评估的基线iFCM。iFCMs通过犹豫度机制提升了缺失数据下的鲁棒性与预测可解释性。
4.4 多层模糊认知图(Multilayer FCMs, MFCMs)
MFCMs通过多层节点组织复杂系统,上层为代表性概念,下层为细节概念,推理类似深度优先搜索(DFS)。其状态更新包含层内与层间权重计算。应用包括:两层MFCM用于供应链质量管理(SCQM),建模供应商、制造商与分销环节的互动;两层MFCM-ASD用于自闭症谱系障碍(ASD)严重程度评估,结合ADOS2与ADIR诊断工具;四层MFCM用于公共舆论形成建模,融合生物、社会与技术因素。MFCMs通过分层知识提升了复杂系统的建模精度与解释性。
4.5 Z-数模糊认知图(Z-number FCMs, Z-FCMs)
Z-FCMs将Z数(A, B)引入FCM,其中A为模糊子集,B为A的可靠性度量,同时刻画信息不确定性与置信度。变体包括:结合Z数与PSO-S型传递函数的多阶段Z-MSFCM,用于汽车零部件制造过程的风险评估;以及用于COVID-19医疗服务质量评估的Z-MSFCM。Z-FCMs通过可靠性量化减少了专家参与,提升了决策清晰度。
- 5.
学习与优化方法
FCM构建通常依赖专家知识,存在主观偏差与高复杂度问题,因此需自动化学习方法。
5.1 基于赫布的方法
赫布学习是无监督方法,通过专家知识估计权重。包括:差分赫布学习(DHL),基于概念激活值变化更新权重;主动赫布学习(AHL),根据专家定义的概念优先级序列更新权重;非线性赫布学习(NHL),仅更新非零边权重。
5.2 生物启发式学习算法
此类算法受生物机制启发,优化FCM结构与权重。包括:鸟群优化(BSA)用于遥感图像分类,最小化分类错误率;差分进化(DE)用于IFGCM权重与隶属函数参数优化;确定性头脑风暴优化(DBSO)用于视障人士导航的BFCM权重优化;随机失活批量多任务进化算法(IBMTEA)用于大规模FCM学习;遗传算法(GA)与多智能体遗传算法(MAGA)用于权重矩阵优化;改进多因子粒子群优化(IMFPSO)用于空气质量预测;PSO用于iFCM、VMD-HIFCM与Z-MSFCM的训练;量子进化算法(QEA)用于量子FCM(QFCM)的结构编码与动态分析。生物启发算法虽提升了自动化水平,但存在超参数调优复杂、易早熟收敛等问题。
- 6.
应用
6.1 FCM应用领域
2018—2024年间,FCM应用最集中的领域为农业与生物科学(28%),其次为医学(22%),其余包括商业管理、工程、能源、社会科学与其他领域。具体应用涵盖生态系统预测、基因调控网络推断、供应链管理、机器人导航、太阳能系统设计、疾病诊断(如乳糜泻分级、ASD诊断、肺炎检测)、公共舆论建模、图像分类等。
6.2 FCM在信号分析中的应用
除时间序列预测外,FCM在信号与图像分析中展现出可解释优势。可解释应用包括:xFCM模型结合CNN特征实现图像分类(COVID-CT、Caltech-101等数据集);IF3框架用于无线胶囊内镜病变风险评估;CFCM模型基于EEG信号估计青少年抑郁程度;FCM模型基于胸片纹理检测肺炎;结合Transformer的FCM框架实现多标签图像分类的可解释推理;FCM模型用于EEG情绪识别与个性化运动虚拟教练推荐。不可解释应用主要包括各类时间序列预测模型(如wavelet-HFCM、SAE-FCM等)与EEG情感分类的混合模型。
- 7.
讨论与开放挑战
当前研究存在以下挑战:FGCMs、iFCMs与Z-FCMs的不确定性建模潜力尚未充分挖掘,需更多实证研究验证收敛性与实际应用效果;FCM在图像分析领域的应用仍处于起步阶段,需结合CNN、Transformer等深度学习模型构建更鲁棒框架;人工定义FCM结构易引入偏差,需发展数据驱动的自动构建方法与偏见感知优化算法;生物启发学习算法的选择需匹配问题特性,且超参数调优仍需标准化;多数研究未提供可解释性定量分析,需建立统一的评估指标;复杂FCM的因果结构难以理解,可通过分解为子模型简化;需结合领域语义增强FCM的可说明性;目前缺乏公开源代码,限制了方法复现与领域进展。
- 8.
结论
FCMs凭借简洁结构与因果推理能力,已成为复杂系统建模的有力工具,在XAI领域具备广阔前景。FGCMs、iFCMs与Z-FCMs通过不确定性建模提升了决策鲁棒性;生物启发学习算法有效降低了人工干预;应用已从农业、医学拓展至信号与图像分析。未来研究需聚焦鲁棒推理算法开发、变体模型在更多真实场景的验证、图像分析应用深化、自动化结构构建、新型优化算法探索、语义增强可说明系统设计,以及可解释性评估标准建立。