职业性铅暴露是一个持续的全球公共卫生威胁,也是环境健康的核心问题。根据国际癌症研究机构的分类,铅属于1类人类神经毒素,即使是在低暴露水平下,也会导致不可逆的认知损伤、慢性肾衰竭和进行性的血液系统损害(Jomova等人,2025年;Grandjean和Landrigan,2006年)。在中国江苏省的一个基于人群的职业队列中,铅暴露工人的血液铅(BL)异常率在不同行业范围内为26.8%至29.2%(Han等人,2018年)。根据2024年全国职业健康新闻发布会的数据,全国有超过一百万中国工人面临职业性铅暴露(NHCC & CDC,2024年),生物监测数据显示高暴露组的亚临床损伤率为27%,主要影响造血系统、肝脏系统和肾脏系统(NHCC & CDC,2024年;Hua等人,2025年)。
全球范围内,国际劳工组织估计每年有180万工人暴露于职业性铅危害中,铅相关健康损失的全球经济负担达到6.0万亿美元(ILO,2023年;Larsen和Sánchez,2023年)。在职业环境中,铅暴露主要通过吸入铅烟雾和粉尘(占总吸收量的70-80%)以及皮肤接触含铅表面发生(WHO,2021年)。
在中国,2024年全国职业健康监测数据显示,只有62.3%的铅暴露企业符合国家标准GBZ 2.1-2019中规定的铅烟雾职业暴露限值0.05 mg/m3,电池制造、汽车零部件焊接和电镀行业被认为是高风险领域。核心监测指标包括可吸入铅烟雾和可吸入铅粉尘,这些指标直接量化了暴露强度(GBZ 2.1-2019;NHCC & CDC,2024年)。
现有文献中已经很好地描述了铅的毒代动力学特性。超过95%的吸收铅与红细胞中的-氨基乙酰丙酸脱氢酶(ALAD)和含硫蛋白结合,血液半衰期约为35天,并在暴露后30天内重新分布到大脑、肝脏和肾脏等关键器官(Yu等人,2026年)。在稳态条件下,大约66%的铅通过尿液途径排出,尽管这一比例会随着暴露时间和肾功能的改变而变化:急性短期暴露后这一比例降至40-50%,而在慢性暴露期间由于骨骼中铅的逐渐释放而略有增加(Tempowski,2021年;WHO,2021年)。这种动力学特征使得血液铅(BL)成为最近30-90天暴露的金标准生物标志物,而尿液铅(UL)成为长期6-12个月体内累积负担的主要标志物(Tempowski,2021年;WHO,2021年)。异常的BL水平与急性血液系统损害直接相关(?ivan?evi?等人,2024年),而升高的UL水平与慢性周围神经病变和肾功能损害相关(Thomson和Parry,2006年)。重要的是,即使是低水平的铅暴露也会引起不可逆的神经毒性:血液铅水平低于的儿童平均智商下降5-7分(Bozalan等人,2019年),而成人职业性铅暴露是帕金森病的已知风险因素(Caudle,2017年)。铅暴露还会干扰铁代谢和红细胞功能,加剧易感人群的血液毒性(Yuksel等人,2017年),并在脐带血和胎盘组织中积累,对胎儿发育构成严重风险(Yuksel等人,2016年;Yuksel等人,2022年)。
尽管有这些明确的毒理学基础,当前的职业性铅暴露风险评估框架仍存在三个核心问题。首先,传统的基于回归的模型受到线性假设的限制,无法解决暴露强度、保护措施和早期健康生物标志物之间的复杂非线性相互作用(Liu等人,2023年)。其次,包括随机森林(RF)在内的传统机器学习方法在高维数据集中对高频特征存在固有偏见,系统性地低估了低发生率但医学上至关重要的生物标志物,如血小板分布宽度(PDW),导致亚临床低剂量暴露的漏诊率超过30%(Fox等人,2025年;?ivan?evi?等人,2024年)。第三,职业健康数据集中的类别不平衡严重,其中异常BL样本通常只占总样本的10-20%,这引入了算法对多数类的偏见,进一步降低了早期预警模型的敏感性(Christen等人,2023年)。传统的机器学习框架难以解决非线性暴露-生物标志物相互作用、高频特征偏见和类别不平衡问题,这凸显了需要一种将毒理学先验知识整合到算法设计中的医学先验指导范式的迫切需求。
蚁群优化(ACO)是一种受生物学启发的群体智能算法,它模拟蚁群的觅食行为,在高维空间中进行全局最优特征搜索(Xu等人,2023年)。它在医学研究中展现了独特的价值,包括医学图像加密优化(Karthikeyini等人,2023年)、疾病相关基因子网络的识别(Hanna等人,2024年)、高维医学数据的特征降维(Xia等人,2024年)和脑电图生物标志物分析(Saif Alghawli和Taloba,2022年)。基于这些处理复杂生物数据的成功经验,ACO的全局搜索能力特别适合解决职业健康数据集中的高维冗余和高频特征偏见问题。然而,尽管有这种明显的潜力,其在职业健康风险评估中的应用仍然很大程度上未被探索。关于铅毒代动力学的医学背景、现有评估方法的局限性以及ACO在生物医学研究中的应用先例的详细补充内容,请参见补充说明1。
虽然上述文献已经证明了ACO在生物医学特征选择中的价值,但现有的ACO-RF混合模型仅应用于非健康领域,包括光缆资源管理(Wu等人,2025年)、太阳辐射预测(Prasad等人,2019年)和光伏系统缺陷检测(Rana & Arora,2025年),没有针对职业健康研究的特定领域定制。这些方法将ACO纯粹视为一种技术特征选择工具,没有整合特定领域的生物学或毒理学知识,也没有适应职业健康数据的独特挑战,如类别不平衡和临床可解释性的需求。
目前还没有任何ACO-RF框架能够解决职业性铅暴露评估中的类别不平衡、高维偏见和低可解释性挑战,也没有将毒代动力学领域知识整合到算法设计中。为了填补这一关键研究空白,本研究提出了一种基于医学先验的ACO-RF模型,该模型采用双层优化系统。这是第一个系统地将铅的ADME毒代动力学途径整合到ACO-RF算法设计中的框架,筛选出既具有预测能力又在毒理学上合理的特征子集。该模型在大型多中心职业队列上进行了验证,其性能与主流的降维和分类方法进行了比较,并确定了职业健康管理的高风险暴露场景和可采取的干预措施。据我们所知,这是第一个为职业健康场景定制的ACO-RF框架,它系统地整合了毒理学领域知识,以解决现有评估框架的三个核心局限性。