高光谱成像与可解释的深度学习相结合,用于快速检测玉米粒中的玉米赤霉酮和赭曲霉毒素A
《Microchemical Journal》:Hyperspectral imaging combined with interpretable deep learning for rapid detection of zearalenone and ochratoxin a in corn grits
【字体:
大
中
小
】
时间:2026年05月01日
来源:Microchemical Journal 5.1
编辑推荐:
张一云|刘天|赵双红|熊瑞佳|李轩|王松磊
宁夏大学食品科学与工程学院,中国银川750021
**摘要**
玉米粒在生产和储存过程中极易受到玉米赤霉烯酮(ZEN)和赭曲霉毒素A(OTA)的污染,因此需要快速、无损的同时检测方法。为了克服传统技术的缺点以及传统深度学习
张一云|刘天|赵双红|熊瑞佳|李轩|王松磊
宁夏大学食品科学与工程学院,中国银川750021
**摘要**
玉米粒在生产和储存过程中极易受到玉米赤霉烯酮(ZEN)和赭曲霉毒素A(OTA)的污染,因此需要快速、无损的同时检测方法。为了克服传统技术的缺点以及传统深度学习的“黑箱”问题,本研究开发了一种集成系统,结合了900–1700纳米的高光谱成像(HSI)和可解释的深度学习。共准备了330个人工污染样本,ZEN浓度范围为0–60 μg/kg,OTA浓度范围为0–5 μg/kg,并进一步使用25个来自实际粮食供应链的自然污染样本进行模型验证。经过多次散射校正(MSC)预处理、无关变量消除(UVE)和变量组合群体分析(VCPA)后,分别确定了ZEN和OTA的26个和12个特征波长——主要集中于970 nm、1200 nm和1450 nm,这些波长与淀粉、水分和蛋白质相关。在偏最小二乘回归(PLSR)、支持向量机(SVM)和混合模型中,CNN-GRU-Attention模型的表现最佳,对于添加样本,其R2P值分别为0.9311(ZEN)和0.9350(OTA),RPD值分别为3.8234和3.9229;对于自然污染样本,实际值与预测值的R2分别为0.915和0.908。SHAP可解释性分析阐明了与OH振动相关的核心波长和光谱机制,解决了“黑箱”问题。伪彩色可视化进一步揭示了ZEN和OTA的空间分布。该方法实现了快速、准确的无损检测,为粮食霉菌毒素分析提供了一种新的技术途径,并为食品安全评估中的可解释深度学习提供了见解。
**引言**
作为世界三大主要粮食作物之一,玉米及其加工产品玉米粒因其细腻的质地和丰富的营养成分而在食品、饲料和工业应用中得到广泛使用[32][46]。然而,玉米在种植、收获和储存过程中容易受到真菌污染。玉米赤霉烯酮(ZEN)和赭曲霉毒素A(OTA)是典型的霉菌毒素,它们会污染玉米及其衍生物:ZEN具有强烈的雌激素活性,长期摄入会破坏人体内分泌系统,导致生殖器官损伤和发育异常等健康危害[3][19];而OTA则具有肝毒性、肾毒性和潜在的致癌性。国际癌症研究机构(IARC)将OTA归类为2B类致癌物,其在食品加工过程中稳定性很高,难以通过传统方法完全消除[Thiruppathi [29][30]。目前,包括中国和欧盟(EU)在内的主要经济体已为食品中的ZEN和OTA制定了严格的最大残留限量(MRL)。例如,中国的国家标准GB2761–2022规定玉米粒中的ZEN含量不得超过60 μg/kg,OTA含量不得超过5 μg/kg。因此,开发一种快速、准确且无损的ZEN和OTA同时检测方法对于保障食品安全和规范市场秩序具有重要意义。
**传统霉菌毒素检测方法**
传统的霉菌毒素检测方法主要依赖于高效液相色谱(HPLC)和液相色谱-串联质谱(LC-MS/MS)。尽管这些技术具有高灵敏度和特异性,但需要复杂的样品预处理程序,如固相萃取和免疫亲和柱纯化。这些过程导致检测周期较长(通常需要数小时),试剂消耗量大,并且对操作人员的技术要求较高,限制了它们在食品生产中的“实时筛查”和“批量检测”应用[14][20][38]。为了解决这些限制,无损检测技术成为研究重点。其中,高光谱成像(HSI)技术结合了“光谱信息+空间信息”的双重优势。通过分析特定波长下毒素与玉米粒基质之间的光谱响应差异(例如,官能团振动吸收和散射效应),HSI能够在不破坏样品的情况下快速预测毒素水平[22]。这些光谱响应差异主要是由ZEN和OTA对玉米粒中淀粉和蛋白质的结构破坏以及基质吸水能力的变化引起的,进而导致与淀粉、蛋白质和水分相关的特征带的光谱反射率波动。过去五年中,HSI被广泛用于谷物霉菌毒素的检测,大多数研究集中在单一毒素的定量和基本机器学习建模上;很少有研究尝试同时检测玉米粒中的ZEN和OTA,现有的基于深度学习的HSI研究缺乏可解释性和在自然复杂基质中的严格验证,这在实际应用中存在关键差距[3][31][32]。
**机器学习模型**
如偏最小二乘回归(PLSR)和支持向量机(SVM)等机器学习模型相比早期的传统高光谱数据分析方法(如主成分分析(PCA)具有显著优势。这些模型的优势包括更简单的模型架构、更高的训练效率和更稳定的泛化性能。它们能够有效揭示光谱数据与毒素含量之间的线性或简单非线性关联,无需复杂的特征工程。由于计算成本低且易于部署,这些模型已成为光谱定量分析的基本且有效的工具[4][8][16][17]。然而,作为相对基础的建模方法,它们在从高光谱数据中提取复杂的高阶特征方面存在局限性——例如多维光谱相互作用和微量毒素与基质之间的耦合响应。面对基质干扰(如玉米粒粒径或水分含量的变化)时,这些方法难以充分分离无关信息,需要改进模型的鲁棒性[2]。
**深度学习模型**
相比之下,深度学习模型(包括卷积神经网络(CNN)、长短期记忆网络(LSTM)、门控循环单元(GRU)及其混合架构)近年来表现出显著优势。它们的端到端学习范式能够自动从高光谱数据中提取高阶非线性特征和深层相关性,有效克服了传统方法对人工工程特征的依赖。此外,CNN捕捉局部光谱细节的能力、LSTM/GRU建模时间光谱依赖性的能力以及注意力机制对关键特征的关注,使得在处理具有复杂基质干扰的高维光谱数据时,检测精度显著提高[27][39][40][50][51]。然而,深度学习模型具有“黑箱”特性,其决策过程难以解释。目前尚不清楚哪些光谱带或特征在毒素检测中起关键作用——这不仅降低了检测结果的可信度,也限制了该技术在食品安全监管中的应用[7][28]。为了解决这一核心挑战,集成可解释性分析工具至关重要。其中,SHAP(Shapley Additive Explanations)方法因其独特优势而尤为突出:首先,其基于合作博弈论的理论框架确保了严谨性,量化了每个光谱特征对预测结果的边际贡献,并明确指出了贡献的方向(正面促进或负面抑制)[26][48];其次,它揭示了特征之间的相互作用,克服了传统特征重要性评估的局限性;第三,它通过条形图和小提琴图直观展示了贡献模式,使“黑箱”模型的决策逻辑透明化;第四,它精确识别了与毒素检测相关的核心波长,为光谱机制分析提供了定量证据,增强了检测方法的科学严谨性和说服力[5][25][39][40][41]。
**本研究**
基于此背景,本研究提出了一种结合可解释深度学习和900–1700纳米HSI的新集成方法,用于同时定量检测玉米粒中的ZEN和OTA,该方法通过丰富复杂谷物基质中微量污染物的高光谱定量分析方法论体系,推进了分析化学领域的发展,并为深度学习与光谱成像技术的融合提供了新的可解释范式。一方面,该方法利用定制的CNN-GRU-Attention混合模型的先进深度特征提取能力,揭示了高光谱数据中与毒素含量相关的细微光谱差异,从而提高了复杂基质中的检测精度,并解决了传统机器学习模型抗干扰能力差和低阶特征提取能力不足的问题;另一方面,它结合了SHAP可解释性分析工具,量化了每个光谱带对模型预测结果的贡献,识别了与毒素相关的特征吸收峰(例如,与ZEN和OTA相关的淀粉、水分和蛋白质的响应波长),并揭示了模型决策背后的科学光谱机制——成功解决了基于HSI检测的传统深度学习的“黑箱”挑战。通过多重散射校正(MSC)消除基质干扰,以及通过无关变量消除(UVE)和变量组合群体分析(VCPA)进行目标特征波长选择以去除冗余信息,该集成系统全面解决了现有检测方法的核心局限性:色谱技术的低效率、基本机器学习模型的低鲁棒性、深度学习模型的缺乏可解释性以及未优化HSI模型在自然样本中的泛化能力不足。本文详细介绍了该方法的实验设计、模型构建和验证过程——包括330个人工污染样本和25个来自实际粮食供应链的自然污染样本——旨在提供一种快速、无损的玉米粒霉菌毒素检测的新技术途径,并为食品安全评估中可解释深度学习的广泛应用提供了宝贵见解。
**样本制备**
实验中使用的玉米粒购自中国宁夏的一家大型超市,为普通的食用级黄色玉米粒(常规流通品种,无特定品种标签,符合市场上可获得的粮食实际情况)。所有样本均在保质期内,在实验前后均统一存放在室温、干燥、避光的环境中,以避免吸湿和发霉。
**光谱分析**
如图1a和图1b所示,玉米样本集的平均光谱反射率曲线显示出高度一致的整体趋势。这一实验观察表明,样品的化学组成没有发生根本变化,只有微量成分有轻微波动。在900–1700纳米的目标光谱范围内,玉米样本的反射率值保持在0到0.8之间。所有样本在970 nm附近都显示出特征吸收峰。
**结论**
本研究通过建立结合HSI和可解释深度学习的同步检测技术系统,满足了快速、无损检测玉米粒中ZEN和OTA的需求。该方法有效解决了传统检测方法的关键挑战,如检测周期长和深度学习模型的“黑箱”特性,为食品安全中的霉菌毒素检测提供了新的理论支持和技术解决方案。
**AI声明**
数据收集、数据分析、结果解释或原始手稿撰写过程中未使用任何人工智能(AI)工具。仅使用Grammarly进行语言润色、语法校正和句子优化。所有作者均批准了最终版本的手稿。
**作者贡献声明**
张一云:撰写——初稿、可视化、软件开发、数据管理。
刘天:撰写——审阅与编辑、资源管理、项目协调、方法论构建、概念化。
赵双红:数据管理、资源管理、撰写——审阅与编辑。
熊瑞佳:验证、概念化、撰写——初稿。
李轩:形式分析、撰写——初稿。
王松磊:撰写——审阅与编辑、监督、资源管理、概念化。
**伦理声明**
本文不包含任何涉及人类或动物的研究。
**资助**
本研究得到了国家自然科学基金(区域基金)[项目编号32260625]和宁夏回族自治区优秀青年学者自然科学基金[项目编号2022AAC05022]的支持。
**利益冲突声明**
作者声明没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号