与WiDRA优化技术整合的Q-ActorINet，用于自适应肾癌诊断系统

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Biomedical Signal Processing and Control》：Q-ActorINet integrated with WiDRA optimization for adaptive renal cancer carcinoma disease diagnosis system

【字体：大中小】 时间：2026年06月18日 来源：Biomedical Signal Processing and Control 4.9

编辑推荐：

　　普拉桑纳·P|维苏马蒂·J，印度泰米尔纳德邦金奈-600 062，维尔科技兰加拉詹博士萨古恩塔拉研发科学技术研究所，计算机科学与工程系摘要：肾细胞癌是最常见且危害最大的疾病之一，多发生在成年人身上，导致肾脏肿瘤。及时准确地检测该疾病对于提高患者生存率至关重要。然而，肾细胞癌诊

　　普拉桑纳·P|维苏马蒂·J，印度泰米尔纳德邦金奈-600 062，维尔科技兰加拉詹博士萨古恩塔拉研发科学技术研究所，计算机科学与工程系

摘要：肾细胞癌是最常见且危害最大的疾病之一，多发生在成年人身上，导致肾脏肿瘤。及时准确地检测该疾病对于提高患者生存率至关重要。然而，肾细胞癌诊断的难点在于肿瘤外观的高度异质性、病灶边界的模糊性以及不同扫描设备和临床条件带来的影像差异。现有的诊断系统普遍缺乏泛化能力，对多尺度特征的敏感度低，学习功能固定，这限制了它们的适应能力。为应对这些挑战，本文提出了一种基于WiDRA优化算法的Q学习演员-评论家Inception网络（Q-ActorINet）。在此模型中，状态为CT扫描每层图像的深度特征表示，动作是演员网络做出的分类决策，而奖励则是预测的准确性，用于通过更新Q值来引导评论家调整演员的网络策略。这种基于强化学习的机制使模型能够根据反馈信息不断调整决策边界，从而更精准地识别各种肾肿瘤模式。此外，文中还提出了WiDRA算法，该算法基于野生犬类的探索行为，构建了一种具有生物学依据的动态学习率调节模型，有助于更稳定、高效地处理复杂的临床数据。通过TCIA和KiTS两个肾脏癌基准数据集对Q-ActorINet和WiDRA进行了测试，这些数据集包含多种不同的强度、纹理、形状和语义特征。在KiTS数据集上，该模型的准确率为99%，精确率为98.99%，召回率为98.95%，特异性为98.96%，F1分数为99%。与传统的机器学习算法（随机森林、XGBoost、CatBoost）以及深度CNN模型（ResNet和DenseNet）相比，该模型在稳健性和诊断可靠性方面表现更为出色。

引言：肾脏是人类泌尿系统中的重要器官，具有维持整体生理平衡和内部环境稳定的多重功能[1]、[2]。作为高效的过滤器，肾脏日夜不停地过滤血液中的代谢产物和毒素，防止血液中有毒物质浓度过高。它们还严格调控体内的水分和电解质含量，如钠、钾、钙等，这些元素对神经传导、肌肉收缩及其他细胞功能至关重要。除了过滤功能外，肾脏还通过糖异生作用以及重新吸收过滤后的葡萄糖来维持血糖稳定，尤其是在禁食时[3]。此外，肾脏还具有激素分泌功能，可释放促红细胞生成素等生物活性分子，促进骨髓中红细胞的生成，同时还能分泌肾素，协助肾素-血管紧张素系统维持血压。肾脏还能生成活性维生素D——骨化三醇，有助于钙的吸收和骨骼健康。所有这些功能都体现了肾脏在维持体内环境稳定方面的复杂作用，而正是由于肾脏的这种多功能性，它们也容易患上各种疾病，其中就包括肾癌。肾癌，尤其是肾细胞癌[4]，是全球男女中最常见的十大癌症之一。它是指恶性肾组织细胞的转化过程，通常起源于肾盂或肾皮质，若在早期未被发现和治疗，很快就会发展成致命病变。肾细胞癌是一种泌尿系统癌症，全球每年的发病率约为40万例，因其侵袭性强且晚期死亡率极高，给医疗系统带来了巨大压力。“从统计数据来看，普通人一生中患肾癌的风险为1/75，即约1.34%，但吸烟、肥胖、高血压、慢性肾病或遗传因素等都会增加这一风险[5]、[6]。早期肾癌没有明显症状，因此需要通过筛查成像和提升公众意识来实现早期发现。随着病情发展，可能会出现血尿、腰痛、体重下降和乏力等症状。由于肾功能对生命至关重要，而肾细胞癌等疾病会导致肾功能丧失，因此开展持续的医学研究、开发早期诊断技术以及普及相关健康知识显得尤为重要。在早期诊断、疾病监测、治疗决策制定以及各类肾脏疾病的预后评估方面，肾脏功能评估方法起着核心作用。随着全球恶性肿瘤和慢性肾病发病率的上升，影像学诊断的重要性日益凸显[7]、[8]。尤其是CT成像，已成为评估肾脏解剖结构的最佳标准，因为它能够生成高分辨率的横截面图像，精准呈现细微的内部结构。CT成像可以提供关于肾实质、血管、周围组织以及肿瘤、囊肿、结石等病理变化的详细解剖信息。通过从多个角度对肾脏进行成像，CT扫描能够更准确地判断器官形态，不仅有助于诊断，还能为微创手术或开放手术的治疗方案制定提供依据。从CT扫描中分割出肾脏图像在临床中也有多种应用。例如，精确分割和标记肾脏区域有助于计算肾脏总体积，评估其大小和形状变化，特别是在肾脏阻塞、萎缩或肥大等情况下，还可以与肾功能情况进行对比[9]。在肾细胞癌这类疾病中，这一技术尤为重要，因为肾细胞癌是一种发生在近端弯曲小管上皮的良性甚至致命性肿瘤。它是继前列腺癌和膀胱癌之后第三常见的泌尿系统癌症，由于其发展隐匿，往往在晚期才会出现症状，因此对患者的预后评估具有重要意义。通过CT检查可以评估肿瘤的大小、位置、血管侵犯情况以及转移程度，这些信息对于决定是否进行肾切除术、冷冻消融术或靶向治疗具有重要意义[10]、[11]。此外，CT成像还有助于临床物理师建立精确的模型，用于规划放射治疗，同时也有助于开发人工智能平台，实现自动肾脏分割、特征提取和恶性病变分类。因此，新的成像技术不仅提高了肾脏疾病诊断的精度和重复性，还促进了多学科协作在治疗方案制定中的应用，提升了临床治疗效果，有助于实现更早的诊断和个性化的肿瘤学及肾脏病学治疗。深度学习是机器学习领域的一项革命性技术，它的特点是能够通过深层多层的人工神经网络从数据中学习高级、抽象的特征表示。过去，支持向量机、决策树、随机森林、K最近邻、朴素贝叶斯和逻辑回归等传统机器学习方法一直是数据分类和模式识别的核心手段，但这些模型严重依赖人类基于领域知识进行的特征提取和预处理才能达到高精度[12]、[13]。相比之下，深度学习网络，尤其是卷积神经网络，能够自主从原始输入数据中学习分层特征，这一能力在图像、语音和文本处理领域尤为突出。卷积神经网络由卷积层、池化层和全连接层组成，非常适合图像识别任务，因为它们能够从低级别的边缘特征逐步学习到高级的语义模式。图1展示了基于智能学习模型的标准肾细胞癌检测系统。随着这些深度模型复杂性的不断增加，诸如ResNet、DenseNet和Transformer等复杂架构的出现，大大提升了它们解决复杂识别和分类任务的能力。像AlphaGo通过深度强化学习击败世界顶尖围棋选手、面部支付技术以及由深度神经网络驱动的自动驾驶汽车等典型案例，都充分展现了深度学习解决原本被认为对计算机来说过于困难问题的能力。这些进步不仅是技术上的奇迹，也反映了深度学习理论与计算硬件快速发展之间的紧密联系，尤其是图形处理单元的发展，使得在海量数据上训练大型深度模型变得简单可行[14]。在医学影像和医疗保健领域，这一创新带来了深远影响。计算机辅助图像分析作为一种革命性的技术，相比人工检查，具有更高的准确性、客观性和重复性，尤其在病理学领域，用于分析微观组织样本以识别疾病，大大提升了诊断的精确度和准确性。卷积神经网络形式的深度学习是这一变革的核心。这类模型需要在高分辨率的数字化病理图像上进行训练，从而能够学习到不同疾病（如癌症）中出现的各种组织结构和细胞模式的特征[15]。通过大量标注过的数据集训练，深度学习模型能够识别出人类难以察觉的细微形态变化，从而提高检测灵敏度，减少诊断错误。可以说，深度学习在病理图像分析中最重要的价值在于能够实现组织学切片的自动预筛。通过扫描整个切片图像并进行分析，这类模型能够识别出可能含有病理异常的区域，标出潜在的癌变组织，从而减少漏诊的情况[16]。这在病理科工作繁忙的情况下尤为重要，因为病理学家需要在短时间内查看大量切片。除了预筛之外，深度学习还能向研究人员提示数字化组织切片中具有诊断意义的区域，引导病理学家关注重点部位。这种有针对性的帮助不仅加快了诊断速度，还提高了诊断的可靠性，因为医生可以集中精力检查最可疑和相关的区域[17]。另一个重要优势是，深度学习算法能够在不同病例和医疗机构之间保持一致的诊断结果，且不受操作病理学家经验水平的影响。在缺乏专业病理诊断条件的环境中，或者在不同观察者之间的差异可能影响患者治疗效果的情况下，这类算法更具价值。通过保存和处理电子切片，这些系统能够支持大规模数据挖掘研究[18]，实现远程第二意见咨询，以及开展关于疾病进展或治疗反应的纵向研究。随着这类技术的不断发展并获得适当的监管审批，它将逐步融入常规临床工作流程，提升诊断准确性和工作效率，同时为全球各地的患者提供高质量的诊断服务。因此，利用深度学习进行图像分析代表着病理学领域的重大进步，它以基于证据的智能决策过程取代了传统的主观判断方式，从而为患者提供更好的医疗服务。推动采用基于混合深度迁移学习模型的方法来诊断肾癌，是因为目前临床上亟需提高肾细胞癌的早期、准确且独立的检测能力，而这确实是全球范围内一个极为重要的健康问题。尽管近年来肾细胞癌的发病率持续上升，但由于该疾病往往没有明显症状，且医学影像上早期的形态变化较为微妙，因此仍然很难实现早期检测[19]、[20]。传统的诊断方法，如放射科医生和病理学家对CT或组织病理学图像的目视判断，不仅耗时且具有主观性，还容易存在不同观察者之间的差异。在缺乏训练有素的医疗专家或医疗资源过于紧张的情况下，这一诊断难题更为严重。因此，亟需一种智能且可扩展的计算机辅助诊断系统，能够在癌症处于最佳治愈期、预后较好的早期阶段，实现可靠、可重复且精确的诊断。为解决这些难题，基于混合深度迁移学习的解决方案应运而生，它能够结合多种深度架构的优势，并借助迁移学习的领域适配能力。深度学习架构，尤其是卷积神经网络，已被证明能够从医学图像中提取复杂且层次分明的特征。但要从头训练这类模型需要大量的标注数据，而医学领域尤其是针对肾癌这类疾病，往往缺乏足够的数据。迁移学习通过利用在大型数据集（如ImageNet）上预训练得到的模型经验，并将其微调到规模较小的领域特定数据集中，从而在数据量不足的情况下依然保持良好性能。此外，结合多种深度模型的混合框架，或者整合不同网络架构之间的互补特征表示，能够学习到更丰富、更具区分度的特征，进而提升模型区分恶性与良性病变的能力，甚至区分不同亚型的肾细胞癌。这类混合框架可能在一定程度上牺牲深度、泛化能力和灵敏度，但能在不同的临床病例和成像模式下保持稳定的性能。

尽管已有众多深度学习和机器学习模型被用于研究肾肿瘤，但在应对临床影像中肾细胞癌所存在的极端变异性和诊断复杂性方面，相关研究仍存在不足。现有系统大多基于传统CNN架构，它们以固定的前馈方式提取特征，且在没有自适应反馈机制的情况下做出分类决策，因此容易对边界不规则、对比度低或内部纹理高度异质的肿瘤产生误判。此外，这些系统还依赖Adam、SGD或RMSprop等静态优化算法，这类算法难以适应医学数据分布的动态变化，尤其是当CT体积发生变化时，体素间距、采集方案和噪声分布都会随之改变。这意味着当前技术难以推广到不同的数据集和医院环境中，且在临床应用中的准确性也会下降。本文提出的Q-ActorINet结合WiDRA优化方法将从多个层面弥补这一缺陷：首先，将医学图像分类过程转化为一个主动决策系统，这是将强化学习融入模型框架的直接结果。在此框架中，状态为多尺度Inception层的深度特征表示，动作是演员网络的分类输出，而奖励则体现为所有决策的正确性，以此让评论者能够通过Q学习优化演员网络。这是一种闭环学习机制，可使模型的诊断策略不断改进，从而具备更高的灵活性，更能捕捉肿瘤外观的细微变化。其次，WiDRA优化器提出了一种受野狗行为启发的新学习率调整框架，能够根据探索与利用的原则动态调整学习步长，有效解决异构医学数据长期存在的稳定性差、收敛速度慢及过拟合问题。这一创新框架通过多尺度特征提取、强化学习驱动的策略优化以及基于生物模型的自适应优化，有效克服了传统监督学习的局限性，显著提升了肾细胞癌检测的效率。

本研究的主要贡献如下：首先，本研究旨在开发并测试一种全新的深度学习模型，该模型基于新的图像处理和机器学习理念，能够高效地对医学图像进行分类，从而实现肿瘤检测。其目标是从医学图像中筛选出重要的特征，去除冗余或无用信息，提升模型在图像分类过程中的效率和准确性。其次，本研究旨在将所提模型的性能与当前最先进的模型在准确性、精确度、召回率、F1分数和AUC等关键指标上进行比较，评估其在TCIA和KiTS等公开数据集上的表现。此外，本研究还旨在阐明通过引入超参数优化和特征设计等优化方法，如何进一步提升所提模型在医学图像分类任务中的性能、准确率及泛化能力。

本文共分为五个详细章节，以便清晰、连贯地阐述基于混合深度迁移学习的肾细胞癌检测研究内容。第二章是对目前用于肾细胞癌检测和分类的各类模型和方法的文献综述，分析了它们的工作原理、优缺点，以及本研究所要填补的研究空白。第三章详细介绍了所提出的混合方法，包括深度学习架构与迁移学习的结合方式、图像数据预处理流程、训练方法以及用于提升诊断准确度的混合融合机制。第四章通过性能指标分析、检测结果可视化，以及与传统模型和最先进模型的全面对比，评估了所提模型的性能，从而确定其优势与效率。最后，第五章总结了本文的主要研究成果，阐述了所提新系统的贡献，并提出了未来的研究方向，例如将该模型扩展到其他医学成像数据类型，以及增加可解释性功能，以提高临床应用的信任度和可理解性。

相关研究
目前，通过医学影像检测和表征肾细胞癌越来越依赖于人工智能驱动的智能系统，尤其是深度学习技术。人工扫描CT或MRI图像进行诊断是一项耗时且主观性强的工作，不同放射科医生之间的解读结果可能存在较大差异。因此，研究人员试图采用自动化和半自动化方法，以提高恶性肾脏肿瘤检测的准确性。大多数深度学习模型……

所提出的方法
本研究提出了一种全新的深度学习系统组合，用于通过CT扫描识别肾细胞癌。这类平台具有重要意义，因为目前用于检测肾细胞癌的AI模型通常具有固定的学习策略，难以适用于不同患者群体，其决策机制也不易理解。本研究通过提出基于Q学习的演员-评论家Inception网络（Q-ActorINet）以及野狗式学习率调整优化器（WiDRA），弥补了这些缺陷……

结果与讨论
本研究在两个流行的开源基准数据集——癌症影像档案（TCIA）和肾脏肿瘤分割（KiTS）挑战数据集[37][38]上，对所提出的Q学习演员-评论家Inception网络结合WiDRA优化器的性能进行了测试。选择这两个数据集是因为它们在反映肾细胞癌的表现形式方面具有相关性、多样性和全面性……

局限性
虽然所提出的Q学习演员-评论家Inception网络结合WiDRA优化器展现出了良好的前景，但仍存在一些局限性。首先，由于策略需要随时间持续更新，且Q函数也需要估算，因此强化学习的计算过程更为复杂，这可能导致训练时间比传统监督学习方法更长。其次，CT扫描数据集的质量和多样性也可能影响模型性能……

结论
本文旨在提出一种准确、可靠的混合深度强化学习框架——Q-ActorINet，用于CT医学影像中肾细胞癌的检测。该模型融合了基于Q学习的演员-评论家框架以及受电影《盗梦空间》启发的多尺度特征提取技术，能够从多个空间分辨率中成功学习到肿瘤的精细特征。此外，该模型的优化机制也具有进化特性……

资金支持
撰写本手稿过程中未获得任何资金支持。

伦理与实践问题
本文使用了TCIA和KiTS数据集，但未提及相关的伦理合规性、数据使用许可或数据来源说明。文中也没有声明利益冲突、资金支持情况或机构伦理审批结果。此外，尚不清楚患者数据是否已按照伦理研究标准进行匿名处理。这些缺失内容亟需补充……

利益冲突声明
作者声明不存在任何可能影响本文研究工作的已知财务利益或个人关系。

联系信箱：

粤ICP备09063491号

热点排行