基于人工智能的乳腺癌生物心理社会筛查:利用差分进化线性判别分析法进行特征提取以提升风险预测能力
何塞·路易斯·利亚戈诺-罗克(José Luis Llaguno-Roque)、
阿德里安娜·劳拉·洛佩兹-洛巴托(Adriana Laura López-Lobato)、
胡安·卡洛斯·佩雷斯-阿里亚加(Juan Carlos Pérez-Arriaga)、
赫克托·加布里埃尔·阿科斯塔-梅萨(Héctor Gabriel Acosta-Mesa)、
安赫尔·J·桑切斯-加西亚(ángel J. Sánchez-García)、
加布里埃尔·古铁雷斯-奥斯皮纳(Gabriel Gutiérrez-Ospina)、
安东尼娅·巴兰卡-恩里克斯(Antonia Barranca-Enríquez)以及
塔尼亚·罗莫-冈萨雷斯(Tania Romo-González)
《Mathematical and Computational Applications》:AI-Driven Biopsychosocial Screening for Breast Cancer: Enhancing Risk Prediction via Differential Evolutionary Linear Discriminant Analysis for Feature Extraction
José Luis Llaguno-Roque,
Adriana Laura López-Lobato,
Juan Carlos Pérez-Arriaga,
Héctor Gabriel Acosta-Mesa,
ángel J. Sánchez-García,
Gabriel Gutiérrez-Ospina,
Antonia Barranca-Enríquez and
Tania Romo-González
【字体:
大
中
小
】
时间:2026年04月28日
来源:Mathematical and Computational Applications 2.1
编辑推荐:
摘要:在墨西哥,乳腺癌(BC)的高发病率和死亡率构成了一个关键的公共卫生挑战,需要采取针对特定背景的预防措施。本研究提出了一个基于生物心理社会模型的综合框架,用于预测乳腺癌风险。我们假设情绪压抑和抑制是墨西哥女性群体中的关键神经内分泌干扰因素和致病因素。为了验证这一假设,我们系统
摘要:在墨西哥,乳腺癌(BC)的高发病率和死亡率构成了一个关键的公共卫生挑战,需要采取针对特定背景的预防措施。本研究提出了一个基于生物心理社会模型的综合框架,用于预测乳腺癌风险。我们假设情绪压抑和抑制是墨西哥女性群体中的关键神经内分泌干扰因素和致病因素。为了验证这一假设,我们系统地比较了各种机器学习分类模型在使用110名女性的临床、心理以及综合数据时的预测性能。这些模型在应用了强健的进化算法——差分进化线性判别分析(Differential Evolutionary Linear Discriminant Analysis for Feature Extraction)后进行了评估。结果表明,将临床和心理数据整合到一个联合潜在空间中显著提高了分类算法的性能。人工神经网络取得了最高的指标(精确度0.9975;F1分数0.9976)。然而,由于这些模型固有的“黑箱”特性(临床解释性有限),决策树成为最佳的实际选择,它提供了高度竞争性的结果(精确度0.8874;F1分数0.8853)。这些发现提供了实证证据,表明心理因素可能不仅仅是偶然的共病现象,而可能与乳腺癌的病因有关,并可用于预测该疾病。最终,这种由人工智能驱动的生物心理社会筛查模型为墨西哥女性的早期乳腺癌诊断提供了一个可扩展、低成本且适应性强风险评估工具。
1. 引言
乳腺癌(BC)是全球女性中最常见的肿瘤。自2006年以来,它一直是墨西哥女性中最常见且最致命的癌症(见附录A中的表A1)[1,2,3,4]。据预测,到2050年每年将有超过50,000例新病例,乳腺癌代表了一个紧迫且日益严重的公共卫生问题。普遍认为,早期发现对于降低发病率和死亡率至关重要。尽管乳腺X光检查仍然是全球筛查项目的金标准,但它存在局限性。广泛的乳腺X光筛查常常受到年龄指南的限制,并且关于辐射暴露的问题,特别是对于年轻人群体[5,6,7]。在墨西哥,这种情况尤为突出,因为大多数晚期乳腺癌病例都是在20-41岁的女性中诊断出来的[8,9]。自2013年以来,我们的团队开发了非放射学资源来识别高风险年轻墨西哥女性,旨在优化早期发现的同时最小化不必要的辐射暴露。虽然墨西哥官方标准[10]承认生物学、医源性、生殖和生活方式因素共同决定了乳腺癌的相对风险,但目前的国家筛查计划几乎完全依赖于生物学和生殖历史数据。这种方法并没有显著减少发病率或死亡率,可能是因为这些因素最多只能解释50%的乳腺癌发病率。我们最近建议,在筛查设计中加入心理情感因素可以提高风险识别的准确性[11,12]。证据表明,特定的人格特征——如低情绪控制能力、低防御性和高压力——在乳腺癌诊断前的墨西哥女性中持续存在[11]。从生理学角度来看,情绪压抑和抑制已知会改变昼夜皮质醇分泌,这种失调与转移性乳腺癌患者的早期死亡有关[13,14]。此外,主成分分析表明,在纳入情绪压抑、抑制和压力症状的表型特征时,健康女性和有良性或恶性乳腺病变的女性会有不同的聚类[12]。值得注意的是,当同时分析临床和心理变量时,情绪压抑变量显著定义了不同的群体聚类。这些观察结果支持了筛查心理因素对于预防、早期诊断和理解乳腺癌发病机制至关重要的假设[15,16,17,18,19]。
为了改进墨西哥年轻女性的风险识别,García-Camacho等人[20]之前设计了一个基于决策树的模型,评估了压力症状量表(ISE)、Courtauld情绪控制抑制量表(CECS)和Weinberger适应量表(WAI)。他们的结果显示,虽然这些工具单独使用时准确性较低(34-40%),但结合起来后预测准确性提高了42.7%。这表明虽然情绪维度具有区分价值,但建模方法需要进一步改进才能实现临床实用性。另一方面,生物心理社会风险预测和可解释AI的最新进展强调了整合多领域数据在肿瘤学应用中的重要性。Hussain等人[21]回顾了用于乳腺癌风险预测的机器学习方法,强调了心理社会变量在提高模型准确性方面的附加价值。同样,基于放射组学的研究表明,多模态特征融合(如在MRI中的实质强化和乳房对称性)可以提高早期检测的区分能力[22]。与此同时,进化特征提取方法在肿瘤学中的应用也越来越广泛,Wang等人[23]强调了元启发式优化在细化肿瘤亚型分类中的作用。可解释AI(XAI)框架(如Carriero等人[24]所讨论的)进一步强调了临床模型透明度的必要性,特别是在整合异构数据源时。除了乳腺癌之外,类似的策略已在其他医学领域成功应用。NEDL-GCP模型[25]引入了一个用于妇科癌症风险预测的嵌套集成深度学习框架,展示了集成架构如何能够稳健地处理复杂的临床数据集。Doumari等人[26]提出了一个用于帕金森病早期诊断的高准确度模型,展示了特征融合和分类器优化在神经退行性疾病中的潜力。
在此基础上,我们提出了一个新的风险评估模型,该模型采用差分进化线性判别分析(Differential Evolutionary Linear Discriminant Analysis for Feature Extraction)进行特征提取。这种方法整合了生物学、生殖和心理变量,以处理数据集的复杂性。与之前的模型不同,它简化了风险类别的观察,并揭示了数据的协同行为。此外,这项工作的独特之处在于其对墨西哥人群的关注以及其关键创新:将心理数据与临床数据结合使用——这种方法 previously 未在该国的任何其他研究中用于乳腺癌风险评估[11,12,27],这正是本研究试图填补的空白。尽管分析的队列只有110名个体,但它准确地代表了墨西哥女性的心理和临床信息,对于这个群体来说,识别乳腺癌的风险因素是当务之急。
该方法用于使用机器学习算法改进分类,优先选择那些结果具有可解释性的算法。这种方法为未来的应用奠定了基础,例如开发一个网络模块,以可访问、无创、高精度和及时的方式估计乳腺癌风险。
2. 方法学
2.1. 参与者和研究设计
本研究使用了墨西哥“Dr. Eduardo Liceaga”综合医院接受常规妇科咨询的150名女性的临床和心理数据。所有参与者都提供了书面知情同意书,确保了保密性和匿名性,符合1964年7月18日《英国医学杂志》上发表的《赫尔辛基宣言》的要求。样本的选择旨在代表广泛的年龄范围(见附录A中的表A2),反映了墨西哥女性乳腺癌的流行病学现实;该疾病的诊断通常比全球平均水平早约十年[5]。参与者在组织病理学诊断之前被招募,并根据其临床病理报告被分为三组。健康组(H,n = 50)包括没有可触及或放射学乳腺病变的女性。良性乳腺病变组(BBP,n = 50)由被诊断为纤维囊性变化、纤维腺瘤或乳腺炎的女性组成。乳腺癌组(BC,n = 50)包括被诊断为浸润性导管癌(未经治疗)的女性。
2.2. 数据收集工具
使用包含57个项目的通用数据问卷收集了生理、遗传和生活方式数据。心理特征——特别是情绪压抑、抑制和压力症状——使用三个经过验证的工具进行评估:
2.2.1. 压力症状量表(ISE)
由Benevides-Pereira等人[28]设计,ISE评估了日常生活中压力表现的频率,涵盖了三个维度:心理、身体和社会症状。它包含30个项目,每个项目在5点李克特量表上评分(0 = 从不到4 = 总是)。整体症状得分被分类为低(0-22)、中(22-33)或高(>33)。
2.2.2. Courtauld情绪控制量表(CECS)
由Watson和Greer[29]开发,并由Durá等人[30]为西班牙语使用者进行了验证。CECS评估个体抑制负面情绪的程度。它包括21个项目,涵盖三个子量表:愤怒、焦虑和抑郁。得分越高表示情绪抑制越严重。该工具具有较高的内在一致性(α = 0.95)。在本研究中,使用中位数分割(得分 = 32)将参与者分为“情绪抑制”(得分≥32)或“情绪表达”(得分<32)组。
2.2.3. Weinberger适应量表(WAI)
WAI[31,32,33]通过三个主要量表评估适应风格:主观痛苦、克制和防御性。这些量表之间的相互作用可以识别出六种适应类型,包括压抑型(Type C)应对风格。使用了为墨西哥人群验证的西班牙语版本[34](子量表的Cronbachα值介于0.69到0.89之间)。
2.3. 特征编码和二值化
鉴于临床数据的二元性质,为了将其与心理工具的结果进行比较,后者被转换为二分变量,以评估女性群体中某些心理特征的存在与否。心理数据最初表示为连续分数或子量表,根据其值被分为低、中、高三个等级。随后,这些类别被重新编码为二分变量(1表示特征存在;0表示特征不存在),使用Romo-González等人[27]之前定义的截断点。在大多数情况下,保留了每个工具的原始截断点;然而,在CECS的情况下,这些截断点是基于95%置信区间建立的。附录A中的表A3详细说明了心理数据二值化可能导致的潜在信息损失或增益。
2.4. 机器学习识别模型
为了管理数据集的复杂性并实现三组(H、BBP和BC)之间的最佳分离,采用了监督学习方法——差分进化线性判别分析(Differential Evolutionary Linear Discriminant Analysis for Feature Extraction)。该方法通过结合原始变量的线性变换和进化优化来降低维度并提高类别可分性,从而获得一个在二维空间中最大化类别分离的投影矩阵。以下部分描述了该方法的主要组成部分:
2.4.1. 基于投影的维度降低
设为具有样本和特征的数据集。目标是获得一个简化的表示,定义为:
(1)
其中是投影矩阵,其列是正交向量。这种转换产生了新的特征,这些特征是原始变量的线性组合,而正交性确保了列构成了投影空间的有效基础。
2.4.2. 差分进化优化
差分进化(DE)是一种基于群体的优化方法,通过变异、交叉和选择操作符迭代地细化一组候选解决方案。
在迭代(代)中,群体由在适应性函数域内随机初始化的候选解决方案(个体)组成。每个个体由一个向量表示,表示问题的维度。在DE-LDA_{FE}框架中,每个个体对应于一个向量,编码一个候选投影矩阵,如方程(2)所示。这些矩阵的特殊之处在于它们的列是正交的,以定义投影方向。
(2)
使用DE/best/1/bin策略。对于群体中的每个目标向量,生成一个突变向量:
(3)
其中是当前最佳解,是随机个体,是突变因子。
然后通过二项式交叉创建一个试验向量:
(4)
其中是交叉率,是随机选定的位置。选择步骤保留了试验向量和目标向量之间适应性最高的解决方案。
这些步骤重复进行,直到满足停止标准,例如达到最大代数或群体收敛。因此,通过这种迭代进化过程,候选解决方案的群体逐渐通过结合和选择每一代中的最佳个体而得到改进。结果,算法逐渐收敛到在较低维度空间中越来越好的分类分离效果的投影矩阵。
2.4.3. 适应度函数
对于该方法,使用Fisher的判别标准来评估每个投影的质量,该标准旨在最大化类均值之间的分离,同时最小化每个类内的分散。这是通过最大化投影空间中类别间散布与类别内散布的比率来实现的,如方程(5)所示。(5)其中和分别代表类别间散布矩阵和类别内散布矩阵,如方程(6)和(7)所示,其中表示类别数量,表示第类的均值,表示全局均值。(6)(7)该标准促进了这样的投影:同一类的样本在降维空间中紧密聚集,而不同类的样本则被很好地分隔开来。2.5. 评估使用/不使用该算法的分类器在这项研究中,为了分析通过整合临床和心理变量来预测乳腺癌风险的情况,对六种分类模型进行了比较:K最近邻(K-nn;k = 3, 5, 7, 9, 11);线性判别分析(Linear);高斯分类器(Gaussian);决策树(DT);支持向量机(SVM);以及人工神经网络(ANN)。这种比较是考虑了临床变量和心理变量的原始数据,最后两者都考虑在内。此外,还使用了特征提取方法(Feature Extraction()来图形化分析分类性能并提高分类器的准确性,如图1所示。图1. 生物心理社会风险预测模型的示意图。该流程图展示了研究的四个计算阶段:(A)数据收集:从研究对象(n = 150)中收集生物学、生殖学和心理变量。(B)预处理:将原始数据转换为二进制特征向量(0, 1)以标准化输入。(C)特征提取:应用差分进化线性判别分析()来识别最大化类间可分性的最优投影矩阵(W)。(D)分类:根据分类模型将新病例概率性地分配到健康、良性病变或乳腺癌类别。为了确定最合适的人工神经网络(ANN)配置,使用前馈全连接神经网络进行了系统的实验评估,用于多类分类。测试的架构包括1到5个隐藏层,每层神经元数量相同。每层的神经元数量在集合{10, 20, 30, 40, 50, 100, 200, 300, 400, 500}中变化,生成了一系列浅层和深层网络配置。在所有情况下,每个网络都接收数据集作为输入,并在输出层产生类别预测。这种结构化的探索使得能够比较不同深度和容量的架构,以识别根据所选评估指标达到最佳分类性能的配置。对于该方法,采用了网格搜索策略,系统地探索差分进化(DE)参数的组合,包括种群大小、代数、交叉率和缩放因子。使用表1中显示的配置获得了每种数据类型的最佳分类值。表1. 实验中用于该方法的参数设置。3. 结果本节展示了使用临床、心理和综合数据集预测BC风险的选定分类模型的比较性能。在排除了包含缺失数据的记录后,最终有110名患者(原始150名中的)被纳入分析。使用原始数据和使用特征提取方法后的数据来评估模型性能。为了严格评估分类器,使用了标准性能指标,包括真正例率(TP Rate)、假正例率(FP Rate)、准确率、召回率(Recall)、F1分数(F1-score)和接收者操作特征曲线下面积(AUC-ROC)。对于实验,分类性能是在训练集上评估的。之所以选择这样做,是因为所提出方法的主要目的是比较不同特征表示的区分能力,而不是估计泛化性能。虽然这种方法可能会产生乐观的准确率值,但它确保了方法之间的公平和受控比较,因为所有模型都在相同的条件下进行评估。此外,数据集的有限大小支持使用这种评估策略。对于原始变量,所呈现的结果只考虑了一次执行,因为使用的数据集没有变化;然而,对于使用该方法对变量进行的投影,由于它是一种基于种群的元启发式算法,投影结果不是唯一的,因此所呈现的结果是10次运行的平均值,为了进行公平比较,使用这10次运行中获得的最佳解决方案与原始数据的结果进行比较。3.1. 基于临床变量的分类3.1.1. 原始临床数据分析在最初的实验阶段,分类模型使用原始的、未经处理的临床变量进行训练。这种基线分析用于在任何特征提取或降维技术应用之前评估标准生物学和生殖风险因素的固有区分能力。在这种情况下,每个分类器的比较性能指标详见表2。表2. 使用原始临床数据的分类模型性能指标。如表1所示,基于原始临床数据训练的分类模型的性能根据算法架构的不同而有显著差异。具有30个神经元的ANN展示了 superior 的预测能力,在所有指标上取得最高分数,F1分数为0.9034,AUC-ROC为0.9892。高斯分类器也表现稳健,获得了第二好的性能(F1分数:0.8064)。相反,K-nn算法显示了邻居数量(K)与模型性能之间的反比关系;随着K从3增加到11,F1分数从0.6690逐渐下降到0.5070。线性和SVM模型的结果适中(F1分数约为0.60–0.62),表明原始临床空间中风险组之间的边界是非线性的且复杂的,需要更复杂的建模方法(如ANN)来有效解码。3.1.2. 使用该方法通过临床数据投影进行分类如前几节所述,该方法通过将原始变量投影到优化的低维潜在空间中来提高类别区分能力。这些临床投影的平均性能指标是基于10次独立运行计算得出的,见表3。表3. 使用该方法通过临床变量投影的分类模型的平均性能指标。如表3所示,当使用投影的临床变量时,表现出最高预测能力的模型是具有400个神经元的ANN架构(精确度:0.9111;F1分数:0.8990)和DT模型(精确度:0.8043;F1分数:0.7831)。其余模型的表现适中,具有可比性。与原始数据的结果一致,K-nn模型随着邻居数量(K)的增加而显示出精确度和F1分数的下降,证实K = 3是这种空间映射的最佳配置。虽然表3反映了10次迭代的平均稳健性,但它也对于识别每个分类器的最大潜力非常重要。表4详细展示了基于临床投影的每个模型的最佳单次运行结果。表4. 使用临床变量投影的每个分类模型的最佳单次运行性能。表4中的结果反映了平均指标中观察到的趋势,再次证实了ANN模型的优越性。值得注意的是,在实验3中使用了扩展的500个神经元架构时获得了最佳性能,精确度为0.9149,F1分数为0.9024。DT模型同样在实验8中达到了其峰值,巩固了其作为这些特定临床投影的第二有效分类器的地位。3.1.3. 性能比较:原始数据与投影临床数据图2展示了在基于原始临床变量训练的分类模型与使用该方法生成的优化潜在投影之间的比较性能。如图所示,对于K-nn、DT、SVM和Linear,该方法的应用成功增强了类别可分性,从而总体上提高了分类指标。然而,有两个显著的例外:高斯和ANN分类器在使用原始数据而非投影的临床数据时达到了最佳性能。这一结果表明,这些特定的非线性算法在不需要先进行降维或特征提取的情况下,就具备映射生物风险因素复杂多维关系的内在能力。3.2. 基于心理变量的分类3.2.1. 原始心理变量分析在这个分析阶段,分类模型仅使用原始心理变量进行训练(没有任何预处理或投影)。这个实验建立了一个基线,用于评估心理因素(如情感压抑、抑制和压力)在单独分析时的固有预测能力。在这种情况下,每个分类器的比较性能指标详见表5。表5. 使用原始心理数据的分类模型性能指标。如表5所示,分类模型在处理心理变量时的成功程度各不相同。最显著的是,配置了20个优化隐藏层的ANN在所有指标上都取得了出色的预测结果(精确度:1.0000;F1分数:1.0000;AUC-ROC:1.0000)。这表明在这个特定训练配置下,网络能够绝对区分风险类别。DT模型成为第二有效的分类器,精确度为0.7402,F1分数为0.7298。其余的概率和线性模型表现中等。与临床数据分析中观察到的趋势一致,K-nn模型随着邻居数量(K)的增加而显示出精确度和F1分数的下降,确认K = 3是这种空间映射的最佳配置。3.2.2. 使用该方法通过心理数据投影进行分类根据对临床数据应用的相同程序,心理变量也被投影到优化的潜在空间中。这种转换旨在最大化类别可分性并提高分类算法的预测性能。这些心理投影的平均性能指标是基于10次独立运行计算得出的,见表6。表6. 使用该方法通过心理变量投影的分类模型的平均性能指标。如表6所示,使用投影的临床变量时表现出最高预测能力的模型是具有400个神经元的ANN架构(精确度:0.9111;F1分数:0.8990)和DT模型(精确度:0.8043;F1分数:0.7831)。其余模型的表现适中,具有可比性。与原始数据的结果一致,K-nn模型随着邻居数量(K)的增加而显示出精确度和F1分数的下降,确认K = 3是这种空间的最佳配置。虽然表6展示了10次迭代的平均稳健性,但同样重要的是要识别每个分类器的峰值潜力。表7详细展示了基于临床投影的每个模型的最佳单次运行结果。表7. 使用心理变量投影的每个分类模型的最佳单次运行性能。表7中的数据证实了平均指标中的发现。ANN模型在实验1中取得了完美的分类结果(精确度:1.0000;F1分数:1.0000)。DT模型同样在实验3中达到了峰值,使其成为这些特定临床投影的第二有效分类器。3.2.3. 性能比较:原始数据与投影临床数据图2展示了在基于原始临床变量训练的分类模型与使用该方法生成的优化潜在投影之间的比较性能。如图所示,对于K-nn、DT、SVM和Linear,该方法的应用成功增强了类别可分性,从而提高了分类指标的整体性能。然而,有两个显著的例外:高斯和ANN分类器在使用原始的、未投影的临床数据时达到了最佳性能。这一结果表明,这些特定的非线性算法在不需要先进行降维或特征提取的情况下,就具备映射生物风险因素复杂多维关系的内在能力。3.2. 基于心理变量的分类3.2.1. 原始心理变量分析在这个分析阶段,分类模型仅使用原始心理变量进行训练(没有任何预处理或投影)。这个实验建立了基线,用于评估心理因素(如情感压抑、抑制和压力)在单独分析时的固有预测能力。在这种情况下,每个分类器的比较性能指标详见表5。表5. 使用原始心理数据的分类模型性能指标。如表5所示,分类模型在处理心理变量时表现出不同程度的成功。最显著的是,配置了20个优化隐藏层的ANN在所有指标上都取得了完美的预测结果(精确度:1.0000;F1分数:1.0000;AUC-ROC:1.0000)。这表明网络在这种特定训练配置下能够绝对区分风险类别。DT模型成为第二有效的分类器,精确度为0.7402,F1分数为0.7298。其余的概率和线性模型表现中等。与临床数据分析中观察到的趋势一致,K-nn模型显示出邻居数量(K)与模型效果之间的反比关系;随着K的增加,精确度和F1分数系统性地下降,确认K = 3是这种配置下的最佳参数。3.2.2. 使用该方法通过心理数据投影进行分类遵循对临床数据应用的相同程序,心理变量也被投影到优化的潜在空间中。这种转换旨在最大化类别可分性并提高分类算法的预测性能。这些心理投影的平均性能指标是基于10次独立运行计算得出的,见表6。表6. 使用该方法通过心理变量投影的分类模型的平均性能指标。如表6所示,动态配置了500个隐藏层的ANN在这种投影空间中保持了完美的预测能力(精确度:1.0000;F1分数:1.0000)。DT模型与其原始数据基线相比有了显著提升,获得了第二高的平均性能(精确度:0.8224;F1分数:0.8149)。其余分类器表现出类似的中等性能。关于K-nn模型,邻居数量(K)与模型准确性之间的反比关系仍然存在,确认K = 3是这种投影空间的最佳配置。虽然表6展示了分类器的平均稳定性,但评估它们的峰值预测潜力同样重要。表7展示了每个模型使用心理变量投影的10次总执行中的最佳单次运行结果。表7. 使用心理变量投影的每个分类模型的最佳单次运行性能。表7中的数据证实了平均指标中的发现。ANN模型在实验1中取得了完美的分类结果(精确度:1.0000;F1分数:1.0000)。DT模型同样在实验3中达到了峰值,精确度为0.8668,F1分数为0.8682,巩固了其作为该数据集第二有效分类器的地位。最后,对于KNN模型,随着邻居数量(K)的增加,精确度和F1分数都有所下降。因此,K = 3在这个配置下对应于最佳性能。3.2.3. 性能比较:原始数据与投影心理数据图3展示了在基于原始临床变量训练的分类模型与使用该方法生成的优化潜在投影之间的比较性能。与临床数据集的发现一致,该方法的应用成功增强了类别可分性,从而系统地提高了K-nn、Linear和SVM的分类指标。图3. 基于心理数据的分类模型比较。图表对比了每种算法在使用原始心理变量(基线)与通过某种方法优化后的投影数据时的预测性能。缩写:K-nn:K最近邻算法;Linear:线性判别分类器;DT:决策树;SVM:支持向量机;ANN:人工神经网络。在这个实验阶段唯一的例外是ANN模型。因为动态配置的ANN在使用原始心理数据时已经实现了完美的预测准确率(1.0000),其在处理投影数据时的性能指标保持不变,这表明该模型在分类能力上达到了一个上限。3.3 基于临床和心理变量组合的分类 3.3.1 原始组合数据的分析 在这项研究的综合阶段,使用包含原始临床和心理变量的集成数据集来评估分类模型。这项实验旨在确定在没有任何预处理或投影的情况下结合这两个不同的领域——生物风险因素和心理状态——是否能够提高乳腺癌风险的总体预测准确性。比较性能指标见表8。表8. 使用原始临床和心理数据组合的分类模型性能指标。如表8所示,具有20个隐藏层的ANN模型再次展示了在原始数据上的卓越预测能力,在多个关键指标上取得了满分(精确度:1.0000;F1分数:1.0000)。两个变量集的整合显著提高了SVM模型的性能,使其成为这个组合数据集中第二强大的分类器(精确度:0.8929;F1分数:0.8693)。与之前的实验阶段一致,随着邻居数量(K)的增加,K-nn模型的性能逐渐下降,再次证实K=3是该算法的最佳参数设置。有趣的是,高斯分类器在这种组合的原始空间中未能收敛出有效的预测结果(所有指标均为0.0000)。这一现象经过进一步分析,主要归因于特征空间的高维性与样本数量之间的不平衡。在这种情况下,协方差矩阵变得病态或奇异,导致无法可靠地求逆,从而产生退化的概率估计,这解释了所有评估指标中观察到的零值。通过检查协方差矩阵的秩和条件数验证了这个问题。这些发现进一步证明了使用降维方法(如某种方法)的合理性,该方法可以将数据投影到一个低维度空间,在该空间中协方差估计更为稳定,类分离度显著提高。3.3.2 使用某种方法通过组合数据投影进行分类 为了解决组合数据集的复杂性,使用某种方法将整合的临床和心理变量投影到一个优化的潜在空间中。表8显示了在这些优化的投影数据上训练的分类模型的平均性能指标,这些指标是基于10次独立运行计算得出的。如表9所示,在投影的组合变量上表现最好的模型是使用了扩展的500个神经元的ANN模型,其平均指标接近完美(精确度:0.9975;F1分数:0.9976),其次是DT模型(精确度:0.8874;F1分数:0.8853)。值得注意的是,某种方法的应用解决了高斯模型在原始组合数据上之前的收敛失败问题。通过优化维度空间,高斯算法成功生成了预测结果,精确度达到了0.7956。最后,在K-nn配置中,邻居数量(K)的增加再次与精确度和F1分数的下降相关,再次证明K=3是该模型的最佳基线值。表10详细列出了每种模型在10次总执行中的最佳单次运行结果,突显了这些分类器在使用组合数据投影时的最大潜力。表10. 使用某种方法通过组合数据投影的每个分类模型的最佳单次运行性能。表10中的结果反映了平均指标中的趋势,进一步证实了ANN模型的优越性,该模型在实验3中实现了无误的分类(精确度:1.0000;F1分数:1.0000)。DT模型在实验5中也达到了最高点,精确度为0.9148,F1分数为0.9077。其余算法表现出一致的高水平性能,验证了某种转换对组合异构数据集的有效性。同样,在K-nn模型的情况下,随着邻居数量(K)的增加,精确度和F1分数都趋于下降。因此,K=3的值对应于该配置下的最佳性能。3.3.3 性能对比:原始数据与投影组合数据 图4展示了在原始组合临床和心理数据集以及通过某种方法生成的优化潜在投影上训练的分类模型的性能对比。与孤立数据集的发现一致,某种方法的应用成功提高了类分离度,从而改善了K-nn、Linear和DT模型的分类指标。图4. 基于组合临床和心理数据的分类模型对比。图表对比了每种算法在使用原始集成变量(基线)与通过某种方法优化后的投影数据时的预测性能。缩写:K-nn:K最近邻算法;Linear:线性判别分类器;DT:决策树;SVM:支持向量机;ANN:人工神经网络。两个显著的例外是SVM和ANN模型,这两种模型在使用原始未投影数据时都达到了峰值性能。正如3.3.1节所述,动态配置的ANN在原始组合数据上已经达到了完美的预测准确率(1.0000),而SVM在划分原始集成特征空间时表现出异常高的自然亲和力。相比之下,高斯模型从某种方法的投影中受益最大。虽然该算法在原始异构数据上完全无法收敛(所有指标均为0.0000),但优化的降维处理解决了这些数学上的奇异性问题。这种转换使高斯模型能够成功地计算概率并实现高度竞争性的性能,强调了在整合复杂多域数据集时稳定敏感算法的重要性。3.4 变量整合的全面分析 图5展示了各种分类模型在原始临床、心理和集成数据集上取得的精确度对比分析。在所有未投影的数据类型中,ANN始终表现出卓越的性能,获得了最高的精确度,证明了它是本研究中基线数据的最佳架构。图5. 使用原始数据集的分类模型性能对比。图表对比了每种分类器在原始临床变量、原始心理变量以及这两个领域的未投影组合数据上的精确度。缩写:K-nn:K最近邻算法;Linear:线性判别分类器;DT:决策树;SVM:支持向量机;ANN:人工神经网络。关于K-nn模型,分析确认精确度与邻居数量(K)呈负相关。在这个模型家族中,特别是在临床和组合数据集中,K=3时的性能始终最高,而更高的K值系统性地降低了算法的判别能力。高斯模型在单独的临床和心理数据上表现尚可;然而,在尝试处理原始组合变量时,它完全无法收敛(精确度降至零),表明在处理这种未投影的异构数据整合时存在严重的数学困难。DT模型在所有三个数据领域都表现出稳健和稳定的性能,在临床数据上的准确性指标略高于大多数基线模型,尽管没有达到ANN的绝对上限。最后,SVM和Linear保持了中等的性能水平,产生了可接受的精确度,但没有显著超过顶级算法。图6展示了模型在使用通过某种方法生成的优化数据投影(临床、心理和组合数据)时的预测准确性的对比。值得注意的是,数据表明将临床和心理变量整合到一个组合的潜在空间中,在大多数评估模型中得到了最高的精确度值。这一结果强烈表明,当通过某种方法适当优化和数学平滑后,将生物风险因素与心理状态结合起来,可以显著增强分类器的整体判别能力和预测可靠性。图6. 使用数据投影的分类模型性能对比。图表对比了在投影的临床空间、投影的心理空间以及组合变量的优化投影上的分类准确度。缩写:K-nn:K最近邻算法;Linear:线性判别分类器;DT:决策树;SVM:支持向量机;ANN:人工神经网络。虽然这项工作的主要目标是使用临床、心理和组合数据来构建乳腺癌风险档案,但也可以使用DE-LDA_FE方法识别每种数据类型的孤立特征,这些特征可能有助于风险预测。这是通过使用线性模型来实现的,其转换矩阵提供了按降序排列的变量相关性系数。被认为相关的变量在附录B(表A4、表A5和表A6)中呈现。然而,正如Montes-Nogueira等人(2018年)和Romo-Gonzalez等人(2018年)[11,12]所指出的,当临床和心理数据一起整合时,乳腺癌风险档案更加稳健,而不是使用孤立的特征。4. 讨论 4.1 对特定情境的风险模型的需求 乳腺癌仍然是全球最严重的公共卫生问题之一,对发展中国家(如墨西哥)的女性影响尤为严重。尽管在诊断和治疗方面取得了进展,但由于检测延迟和有效筛查项目的覆盖范围有限,死亡率仍然很高。在墨西哥,乳腺癌已成为女性癌症相关死亡的主要原因,其临床表现比高收入国家早大约十年出现。这些情况突显了迫切需要开发适应墨西哥人口特定特征的早期检测工具。已经设计了若干模型来评估女性一生中患乳腺癌的风险。最广泛使用的模型(如乳腺癌风险评估工具(Gail模型)、国际乳腺癌干预研究(Tyrer-Cuzick模型)和乳腺癌及卵巢疾病发病率和携带者估计算法(BOADICEA))依赖于生物和生殖风险数据来提供指导医生关于未来筛查、预防干预或化学预防的决策[35,36]。虽然这些工具已被证明有效并在发达国家得到广泛应用[37],但它们主要依赖于生物指标,未能考虑其他人口群体中重要的社会文化或心理维度。目前,墨西哥缺乏根据国家人口特点校准的风险评估工具,这些工具没有考虑生活方式或心理因素。因此,当应用于墨西哥女性时,这些标准化模型可能缺乏预测能力,因为墨西哥女性面临不同的环境压力、文化压力和情绪应对策略。我们的基线结果支持了这一局限性:仅基于临床数据的模型无法准确区分良性病变和癌症,这表明这些群体之间的生物风险因素有很大重叠。只有添加心理特征分析后,模型才成功“解锁”了其判别能力。4.2 模型性能与“黑箱”问题 我们的结果表明,将心理变量(特别是情绪压抑、抑制和压力症状)与标准临床历史相结合,显著提高了乳腺癌风险预测的准确性。分类模型在使用通过某种方法优化的临床和心理变量的组合投影时达到了最高的准确性(精确度:0.8874–0.9975;F1分数:0.8853–0.9976),远优于单独未投影的数据集。在评估的所有算法中,ANN显然是最准确的模型,当临床和心理变量结合使用时达到了最佳性能。然而,尽管ANN取得了最高的准确性指标,但其复杂的架构使其成为一个“黑箱”。这限制了结果的可解释性,而在医学领域,理解特定预测的达成方式对于临床信任和患者沟通至关重要。这一问题在最近的文献[38]中得到了强调,强调了在医疗保健中使用可解释人工智能(XAI)的必要性。因此,正如我们的工作所指出的,整体性能排名第二的DT模型似乎是更适合医疗应用的替代方案。该系统允许临床医生可视化地追踪分类过程,并透明地解释用于进行风险评估的具体标准。4.3. 心理变量与生理途径:我们模型产生的实证证据支持这样的假设:心理因素不仅仅是偶然的共病现象,而是乳腺癌多维度病因学中的相关风险因素。心理变量的预测价值与C型人格理论[15,16,17]高度一致。我们的数据表明,高水平的情绪抑制(通过CECS测量)和防御性(通过WAI测量)可能是乳腺癌群体中的特征性标志。从生理学角度而言,这些特征在疾病的多元病因学中的关系可以通过已建立的心理神经免疫学机制来解释。即,长期的情绪抑制已知会扰乱下丘脑-垂体-肾上腺轴的功能,改变皮质醇的分泌模式。这种紊乱反过来可能会影响免疫监视和肿瘤抑制机制[11,13,14]。因此,结合心理数据和临床数据所获得的更高准确性表明,情绪抑制和痛苦症状不仅是疾病的后果,还可能作为生理脆弱性的早期指标。
4.4. 临床意义与未来应用:所提出的算法流程为早期筛查提供了一个可扩展、非侵入性的替代方案。与资源密集且存在辐射风险的标准乳腺X光检查不同,这种方法可以作为一种基于网络或移动设备的预筛查模块。在资源匮乏的环境中,这种工具将具有特别的价值,能够带来以下系统性的益处:(a) 赋予患者权力:为那些在直接医疗服务有限或地理位置不便的情况下的女性提供经过验证的自我评估工具。(b) 优化分流:使初级保健提供者能够优先安排对具有高风险生物心理特征的女性的转诊,即使她们年轻或没有症状。该模块可以很容易地适应在拉丁美洲的更广泛使用,从而显著提升资源受限地区的早期检测能力。
4.5. 局限性与未来工作:尽管结果非常有前景,但本研究仍存在一些需要指导未来研究的局限性。首先,样本量(n=110)虽然对于这种探索性验证来说是统计上足够的,但还需要进一步扩大。未来的研究应纳入更大的多中心队列,以确保模型在墨西哥不同地理和社会经济区域中的普遍适用性。此外,还应采用处理缺失数据和不平衡队列的技术。虽然所提出的算法能够成功区分风险群体,但数据的横断面性质限制了确定的因果推断。需要纵向研究来确认这些特定的心理特征是先于细胞恶性病变出现的,还是与之同时发展的。还可以应用诸如熵调节双视图NMF和半监督自适应对称NMF等参考方法,因为它们提供了比较框架,并能揭示在更多样化的年龄分布、数据缺失模式或更大规模多中心队列下观察到的益处的表现。实验还应进行深入的敏感性和稳健性分析。
5. 结论:本研究为肿瘤学中的生物心理社会模型提供了强有力的实证支持。它证明了通过投影方法结合工程化的临床和心理特征能够显著增强机器学习分类器的区分能力。最终,这项研究表明人工智能可以有效弥合心理学与生物肿瘤学之间的差距,提供一种强大、特定于情境且非侵入性的工具,以应对墨西哥日益严重的乳腺癌负担。