一种可解释的深度学习框架，用于在环境光下通过便携式荧光成像技术检测鸡蛋壳上的粪便污染

《Poultry Science》：Explainable deep learning framework for fecal contamination detection on chicken eggshells via portable fluorescence imaging under ambient light

【字体：大中小】 时间：2026年03月28日 来源：Poultry Science 4.2

编辑推荐：

　　Insuck Baek|Lalit Mohan Kandpal|Chansong Hwang|Sookyung Oh|Laura P. Del Collo|Mónica Santín|Bradd J. Haley|Manan Sharma|Jitu Patel|Jianwei Qin|Fartash Vasefi|Moon Kim
美国农业部农业研究服务局环境微生物与食品安全实验室，马里兰州贝尔茨维尔，20705

**摘要**
本研究评估了优化后的深度学习架构在检测鸡蛋壳上粪便污染方面的有效性，这些架构专门用于现场检测，以提高食品安全性。研究使用了“污染与消毒检测”设备来建立全面的荧光图像数据集，利用了粪便在600至720纳米范围内发出荧光的光谱特性。基于这些荧光图像数据，开发出了高性能模型，能够识别棕色和白色鸡蛋壳上的粪便残留物。实验结果表明，在环境光条件下，粪便污染物的荧光信号非常稳定，无论是使用405纳米激发还是365纳米激发的模式，结构相似性指数（SSIM）值始终超过0.9200。这些指标证实了荧光成像的固有高对比度可以在无需严格暗室环境的情况下保持图像的结构性完整性。通过对九种不同神经网络的评估发现，365纳米激发有效抑制了棕色鸡蛋上的背景干扰，使得轻量级的MobileNet架构能够以0.9000的准确率检测到粪便污染。对于白色鸡蛋壳，405纳米激发结合ViT Base 384模型在识别微量粪便痕迹时达到了0.9333的最高准确率。通过可解释AI框架进一步验证了检测的可靠性，确认分类逻辑始终基于实际被粪便残留物标记的区域。这些发现为利用手持式荧光技术建立家禽行业中粪便污染检测的客观标准提供了可靠的方法。

**引言**
鸡蛋是全球广泛消费的主食，因其富含蛋白质、脂肪、维生素和矿物质而受到重视（Atwa等人，2024年）。鉴于其广泛的消费量，确保鸡蛋的安全性和质量不仅对保护公众健康至关重要，也对维持农业部门的经济稳定具有重要意义。然而，最近的疫情突显了供应链中的持续脆弱性。2025年6月，由于潜在的沙门氏菌污染，美国至少九个州发生了涉及约170万打鸡蛋（近2000万个单独单位）的重大召回事件（Corredor，2025年；美国食品药品监督管理局，2025年）。根据疾病控制与预防中心（CDC）的数据，该事件导致79例确诊病例和21人住院（CDC，2025年）。虽然没有报告死亡病例，但此次疫情凸显了沙门氏菌对公众健康的严重风险以及对生产商和零售商的重大经济影响。此外，高致病性禽流感（HPAI）的爆发也对家禽生产和食品供应链造成了严重干扰，导致消费者价格上涨（Mitchell和Thompson，2025年）。尽管HPAI主要是动物健康和供应链问题，而非直接针对鸡蛋消费者的食品安全风险，但它仍然加剧了行业的压力，并提高了公众对整个食品系统脆弱性的认识。

这些事件强调了识别和控制鸡蛋生产过程中病原体传播途径的必要性。研究表明，鸡蛋壳表面的粪便残留物是病原体持续存在和传播的主要途径之一（García等人，2011年；Kintz等人，2024年）。表面污染对消费者食品安全构成双重威胁，同时增加了家禽之间的交叉污染风险或工人职业暴露的风险。为了降低这些风险，养鸡场通常会定期清洗和消毒鸡蛋壳以去除污染物，同时保持壳的完整性。然而，由于缺乏可靠和标准化的微生物污染检测方法，确认这些卫生程序的有效性仍然具有挑战性。目前，鸡蛋壳清洁度的评估主要依赖于高度主观的视觉和触觉评估。视觉检查主要用于检测异物，而触觉检查则用于识别表面不规则性（Gao等人，2025年）。尽管已经探索了多种非破坏性检测技术作为替代方法，但它们的重点主要在于质量分级参数，如裂纹检测、新鲜度评估或重量预测，而不是专门评估表面清洁度（Gao等人，2025年；Han等人，2022年；Nasiri等人，2020年；Nematinia和Mehdizadeh，2018年；Sun等人，2015年；Wang等人，2023年；Yang等人，2023年；Zhu等人，2022年）。然而，表面清洁度对于确定鸡蛋安全性和保护消费者至关重要，它在防止整个家禽生产链中的病原体传播中起着核心作用。此外，许多现代技术仅在受控实验室条件下得到了验证，这大大限制了它们在现实农业环境中的应用。因此，迫切需要一个实用、准确且易于使用的系统，使检查员和生产者能够定量评估鸡蛋壳的清洁度。

为了进一步说明未清洗鸡蛋可能带来的微生物风险，我们对从当地养鸡场收集的15个鸡蛋壳进行了初步微生物检测。结果显示，虽然没有检测到大肠杆菌和沙门氏菌，但从三个鸡蛋中检测到了总大肠菌群，从两个鸡蛋中检测到了耐热大肠菌群。值得注意的是，其中一个样本的总大肠菌群计数为3.47 log CFU/鸡蛋。这些发现量化了卫生过程必须有效消除的显著基线污染负荷。鉴于如此高的初始污染水平，清洗过程中的任何失败或效率低下都可能带来重大的安全风险。从严格的食品安全角度来看，对这些风险实行零容忍标准是必要的；即使污染的概率很小，鉴于其可能带来的广泛公共卫生后果，也是不可接受的。因此，强大的检测方法不仅对于检测表面残留物至关重要，而且对于识别和消除任何潜在的危害也至关重要，以验证微生物负担是否已成功减轻。

**研究目的**
本研究的目标如下：
(1) 通过在受控暗室条件和环境光条件下获取和分析图像，研究环境光照对荧光成像质量的影响；
(2) 通过比较两种不同LED类型的检测准确性，确定最佳激发光源；
(3) 开发和优化针对不同鸡蛋壳颜色（白色和棕色）的深度学习模型，以确保检测能力；
(4) 通过使用适合每种架构的可解释AI（XAI）技术，验证所提出系统的可靠性。具体来说，通过应用CNN的Eigen-CAM和ViT的注意力图可视化，本研究旨在验证分类决策是由实际粪便污染驱动的，而不是背景噪声，从而确保自动化检测的可解释性和可信度。

**材料与方法**
**接种物来源**
粪便样本来自Ziggy’s Farm, LLC（美国北达科他州），该设施受北达科他州农业部肉类和家禽检验计划（NDMPIP）监管。根据《联邦肉类检验法》（FMIA），NDMPIP确保管理实践符合《农业动物在研究和教学中的护理和使用指南》（动物科学联合会，2020年）。由于本研究仅使用了排泄物，作者没有进行任何直接的动物干预或处理。将8克鸡粪与72毫升无菌去离子水（DI水）在过滤过的胃袋（GSI Creos Corporation，日本）中混合，并手动搅拌。然后通过0.22微米过滤器瓶（Corning Incorporated，纽约州奥尼昂塔）过滤。这种过滤后的10%（w/v）原液悬浮液进一步用无菌DI水稀释至2%和1%浓度。

**鸡蛋样本制备**
从当地杂货店购买了120个农场鸡蛋（60个棕色壳和60个白色壳）。为了模拟表面污染，将10微升每种粪便悬浮液（1%、2%和10%）小心地涂抹在鸡蛋壳表面，使用无菌DI水作为阴性对照。在第一次试验中，每个鸡蛋的顶部表面滴加10微升液体。涂抹后，鸡蛋在21°C的生物安全柜中干燥24小时。干燥后，肉眼几乎看不到涂抹的液体（图1）。然后获取荧光图像。

**图像下载**：
- 下载高分辨率图像（306KB）
- 下载全尺寸图像

**图1. 干燥前后两种粪便悬浮液（1%、2%和10%）和DI水（蒸馏水）在棕色鸡蛋上的对比**

在第一次成像步骤之后，每个鸡蛋被倒置，并在相反的表面再滴加20微升相同浓度的液体。经过相同的干燥过程后，捕获了第二组图像。这种做法使得每个鸡蛋可以在受控条件下进行双面成像。每个鸡蛋都单独标记以追踪其污染程度。组别大小经过刻意平衡，以确保下游成像分析和模型训练的一致性。

**手持式荧光成像设备**
尽管荧光成像具有高灵敏度，但其实际应用受到荧光信号固有弱点的限制，通常其强度比激发光源或反射光的强度低几个数量级（Shashkova和Leake，2017年）。为了缓解这一问题，传统系统需要严格的光密封闭环境或暗室来阻挡外部光子。然而，这样的物理限制增加了系统的复杂性，并阻碍了其与动态家禽加工线的无缝集成。因此，在环境光条件下评估检测性能对于开发一个强大的、可在现场部署的检测系统至关重要。

本研究使用了由美国农业部农业研究服务局和SafetySpect（基于主动照明的多光谱污染检测系统）共同开发的“污染与消毒检测”（CSI）设备来获取荧光图像。与传统荧光成像系统不同，CSI设备能够在环境和暗室条件下捕获荧光图像（技术细节见其他文献）。如图2所示，CSI系统从前部（图2A）和后部（图2B）两个角度提供了设备的全面视觉表示，包括两个用于荧光成像的摄像头、两种LED光源（365纳米和405纳米）以及用于设备操作的单板计算机。每个摄像头分别与一种激发波长配对。在主模式下，一个摄像头被405纳米光激发，以捕获510–560纳米和665–720纳米光谱带内的双通道荧光图像；而在增强模式下，另一个摄像头被365纳米光激发，以捕获451–477纳米、529–555纳米和618–660纳米光谱带内的三通道荧光图像。

**设计特点**
一个设计特点是每个摄像头镜头上方直接安装了专用光学滤波器。这种过滤机制精确地阻挡了激发光，仅允许捕获每个成像通道特定的波长，这对于隔离所需的荧光信号、最小化背景噪声以及显著提高图像清晰度和数据可靠性至关重要。两种不同类型的LED以均匀的圆形图案排列（如图2A所示），以确保在整个成像区域内的激发一致性和均匀性。此外，设备背面还有一个显示屏（图2B），提供捕获荧光图像的实时可视化，为用户提供即时反馈。这种实时成像能力对于监控实验进展和确保高质量数据的成功获取非常宝贵。

**荧光图像获取**
尽管CSI设备设计为便携式和手持操作，但为了本实验的目的，它被配置为固定单元。选择这种固定设置是为了消除手持操作可能导致的移动或波动，从而最小化变异性并最大化获取的荧光图像数据的精度。这种方法对于严格评估设备的基本可行性及其全部能力至关重要，为将来充分利用其便携设计奠定了坚实的基础。如图2C所示，用于捕获荧光图像的实验装置是固定的。为了使用两种不同的模式，样品分别放置在225毫米和304毫米的距离上，这是因为两个相机的视野不同，以防止荧光图像饱和。每个样品在环境光和黑暗条件下各拍摄两次图像，以便在没有环境光偏差的情况下进行学习处理。在本研究中，每种模式共收集了240张图像（每类60张）。数据集通过分层抽样被分为120张训练图像、60张验证图像和60张测试图像。为了确保评估的公平性和无偏见性，验证集和测试集中使用的都是原始图像，没有进行任何数据增强处理。相比之下，训练集应用了数据增强技术来提高模型的泛化能力和鲁棒性。数据增强是一种关键的深度学习技术，它通过对方向现有图像应用各种变换来人工扩展训练数据集的多样性和规模。这种方法主要通过防止模型仅仅记忆训练数据来减轻过拟合问题，而是鼓励学习更通用的特征。它还有效地缓解了数据稀缺的问题，即使在原始数据集有限的情况下也能实现强大的模型训练（Shorten和Khoshgoftaar，2019）。在本研究中，使用了Albumentations Python库来进行数据增强，包括HorizontalFlip、VerticalFlip、RandomBrightnessContrast、ShiftScaleRotate和GaussNoise等方法。增强后，训练图像的总数为3600张。

为了全面评估模型性能，实现了九种不同的深度学习架构并进行比较，如图3所示。这些模型被分为两大主要范式：卷积神经网络（CNNs）和视觉变换器（ViTs）。CNNs利用卷积操作提取具有强归纳偏置的局部空间特征，例如平移不变性，这对于检测局部表面不规则性非常有利。相比之下，ViTs利用自注意力机制来捕捉整个图像的全局长距离依赖性，从而能够全面理解蛋壳表面的上下文。通过比较这些方法，本研究旨在确定对于这一特定应用来说，局部特征提取的效率还是全局上下文的鲁棒性更为关键。此外，这种多样化的选择允许对推理速度和检测精度之间的平衡进行关键评估，为确定手持设备所需的最佳嵌入式计算平台规格提供了重要标准。

下载：下载高分辨率图像（354KB）
下载：下载全尺寸图像

图3. 实验框架的示意图。所提出的系统评估了九种不同的深度学习架构。这些模型被分为基于CNN的方法和基于视觉变换器的方法。

**卷积神经网络（CNNs）**
在CNN类别中，选择了ResNet-50和ResNet-101作为基线模型，因为它们证明了其稳定性和深度残差学习能力（He等人，2015）。MobileNetV2被用来评估资源受限环境下的性能，它提供了一种专为移动和嵌入式应用优化的轻量级架构（Howard等人，2017）。此外，ConvNeXt也被用来评估一种结合了变换器设计原则的现代化CNN架构，同时保留了卷积的归纳偏置（Liu等人，2022）。

**视觉变换器（ViTs）**
对于ViT类别，检查了标准的视觉变换器（ViT）系列，包括ViT-Base（分辨率为224×224和384×384）和ViT-Large，以分析输入大小和模型缩放对检测精度的影响（Dosovitskiy等人，2020）。此外，数据高效图像变换器（DeiT），特别是DeiT-Small和DeiT-Base，被用来评估在数据集有限的情况下训练高性能变换器的蒸馏令牌的有效性（Touvron等人，2020）。

**训练策略和数据效率**
为了克服荧光蛋数据集大小有限的挑战，并确保特征提取的鲁棒性，所有架构都采用了迁移学习策略。我们没有使用随机权重初始化网络，而是使用了在ImageNet数据集上预训练的模型。这种方法利用了丰富的视觉知识，使模型在特定领域训练之前能够识别基本模式。除了迁移学习的好处外，荧光成像的固有特性进一步减少了了对大规模数据集的需求。与标准RGB成像不同，后者经常受到蛋壳和污染物之间对比度低的影响，荧光成像产生了高对比度信号，其中粪便残留物在背景上显示出明显的发射强度。这种增强的信噪比显著简化了神经网络的特征提取任务。因此，独特的视觉模式降低了底层数据分布的复杂性，使得模型即使在相对较少的训练样本数量下也能实现高收敛性和鲁棒的泛化能力。

**可解释AI（XAI）框架**
为了验证分类的可靠性，并确保模型基于实际的表面污染物而不是背景伪影进行预测，实现了一个全面的可解释AI（XAI）框架。该框架结合了对所有架构适用的模型无关的定量分析以及针对CNNs和ViTs不同结构机制的模型特定可视化策略。为了提供对所有九种模型特征重要性的一致和定量衡量标准，普遍应用了局部可解释模型无关解释（LIME）和Shapley加性解释（SHAP）。LIME（Ribeiro等人，2016）通过将输入图像扰动为超像素来近似复杂的深度学习模型，从而识别出对预测有积极贡献的区域。补充这一点的是，基于合作博弈论的SHAP（Lundberg和Lee，2017）为每个输入特征分配了一个Shapley值，以量化其对最终分类输出的边际贡献，确保了两种范式之间的一致决策逻辑。

为了可视化模型的空间焦点，应用了特定于每种架构的可解释方法。对于基于CNN的模型，使用了Eigen-CAM（Muhammad和Yeasin，2020），通过计算最终卷积层中学习到的表示的主成分。对于基于ViT的模型，使用了注意力图可视化（Dosovitskiy等人，2020），通过从最终变换器块中提取自注意力权重来映射分配给特定图像块（16×16）的注意力强度。

**评估指标**
为了严格验证从图像采集到最终分类的整个系统的性能，评估框架分为三个不同的类别：不同照明条件下的图像质量评估、深度学习模型的分类性能以及手持设备的计算效率。

**图像质量评估**
为了定量研究环境照明对荧光成像质量的影响，在受控暗室条件下获取的图像（参考）和在环境光下捕获的图像（测试）之间进行了比较分析。使用了两个标准指标来评估外部光干扰导致的结构完整性和色彩保真度的下降。首先，使用结构相似性指数（SSIM）来评估结构信息的保留情况，包括亮度、对比度和结构。该指数的范围是从-1到1，其中1表示完美的结构一致性。在本研究中，高SSIM值表明即使在环境光下，污染物的荧光特征也能与背景区分开来。
$$
SSIM(x,y) = \frac{(2\mu_x\mu_y + C_1)(2\alpha_xy + C_2)}{((\mu_x^2 + \mu_y^2 + C_1)(\sigma_x^2 + \sigma_y^2 + C_2)}
$$
其中x和y代表暗室和环境光下的图像，μ表示平均强度，C表示稳定常数，σ^2表示方差。

其次，在CIELAB颜色空间中计算了颜色差异（ΔE），以评估宽带环境光引入的色彩失真。较低的ΔE值表明荧光信号的光谱特性得到了保留，最小化了背景照明引起的褪色效应。
$$
\Delta E = \frac{(L^*_a^* - L^*_1)^2 + (a^*_b^* - b^*_1)^2}{(L^*_a^* + L^*_1)(L^*_b^* + b^*_1)}
$$
在这个公式中，L^*_a*和L^*_b*代表CIELAB颜色空间中的坐标，L^*表示亮度，a^*表示红绿色分量，b^*表示蓝黄色分量。下标1和2分别表示在受控暗室条件和环境光条件下测量的值。

**分类性能指标**
使用从混淆矩阵派生的标准指标（准确性、精确度、召回率、F1分数）来评估每个深度学习模型的分类能力。鉴于食品安全的严格要求，最小化假阴性至关重要。准确性定义为正确预测的观测值与总观测值之比。召回率（敏感性）定义为正确预测的正观测值与实际类别中所有观测值之比；在本研究中，高召回率对于确保所有受污染的鸡蛋都能被成功识别非常重要。精确度定义为正确预测的正观测值与总预测的正观测值之比，表明了污染警报的可靠性。最后，F1分数是精确度和召回率的调和平均值，提供了一个反映模型整体鲁棒性的单一分数。这些指标的公式如下：
$$
\text{准确性} = \frac{TP}{TP + TN} \\
\text{召回率} = \frac{TP}{TP + FN} \\
\text{F1分数} = 2 \times \frac{\text{精确度}}{\text{精确度} + \text{召回率}}
$$

**结果和讨论**
**环境照明对荧光成像质量的影响**
在所有荧光图像中，无论是棕色还是白色鸡蛋，蛋壳表面的粪便污染物都清晰可辨（图4A）。这种有效的可视化归因于粪便物质的光谱特性，它在350-430纳米波段内受到激发时会在600-720纳米范围内发出荧光（Ribeiro等人，2016）。此外，无论环境照明条件如何，图像都表现出高度一致性；在开启和关闭环境光的情况下捕获的图像之间没有明显差异（图4A）。

**下载：下载高分辨率图像（688KB）**
**下载：下载全尺寸图像**
图4. 环境照明对荧光成像性能的影响。(A) 在开启和关闭环境光的‘主要’和‘增强’激发模式下捕获的含有粪便污染物的棕色和白色鸡蛋的代表性荧光图像。(B) 开启和关闭环境光条件下结构相似性指数（SSIM）值的箱形图比较。(C) 评估环境光干扰对颜色稳定性的ΔE值。

为了量化这一视觉观察结果，我们使用客观指标分析了环境光对图像质量的影响（图4B）。展示了在环境光下捕获的图像与在受控暗室中捕获的图像的SSIM和ΔE值分布，分别针对白色和棕色鸡蛋（图4B和4C）。评估在两种不同的成像配置下进行：‘主要’和‘增强’，应用于白色和棕色鸡蛋。

主要配置表现出异常的稳定性，SSIM值的四分位数范围较窄，中位数接近1.0（图4B）。相比之下，增强配置的SSIM值分布较广，表明对外部光照变化的敏感性较高。然而，尽管方差增加，增强模式的绝对SSIM值仍然保持较高，大多数数据点超过0.92。这表明虽然增强模式对环境噪声稍微敏感一些，但图像的基本结构完整性得到了充分保留，使得深度学习模型能够准确提取特征。

在颜色差异分析中也观察到了类似的趋势（图4C）。主要配置的ΔE值主要低于0.5，表明颜色偏移可以忽略不计。虽然增强配置显示出更宽的分布，有些异常值达到了更高的值，但两种配置的整体分布仍然在低颜色失真的范围内。这表明即使增强模式对环境光的敏感性较高，荧光信号的光谱特性也得到了有效保留，没有显著的信号退化。

**检测模型的性能指标**
在主要（405纳米）和增强（365纳米）模式下评估了深度学习模型的分类性能。虽然关键发现总结在表1中，但包括精确度和召回率在内的综合指标详细列在补充表S1-S4中。这些结果表明，激发光与蛋壳色素之间的相互作用在确定最佳模型架构方面起着决定性作用。

**表1. 图像采集和增强参数**
| 模型 | DropletLight | Brown Egg | White Egg |
|------|---------|---------|
| 主要 | 开启 | 60 | 60 |
| 关闭 | 60 | 60 |
| 增强 | 开启 | 60 | 60 |
| 关闭 | 60 | 60 |

**表2. 在主要成像配置下深度学习模型的分类性能。评估指标（F1分数、准确性）按棕色和白色蛋壳分层呈现**
| | | | |
| | | | |
| ConvNeXt | 0.835 | 0.833 | 0.772 | 0.783 |
| | | | 0.949 | 0.950 |
| | | | 0.862 | 0.866 |
| MobileNet | 0.817 | 0.816 | 0.765 | 0.766 |
| | | | 0.883 | 0.804 |
| | | | 0.800 | 0.862 |
| ResNet-50 | 0.855 | 0.866 | 0.713 | 0.733 |
| | | | 0.934 | 0.933 |
| | | | 0.916 | 0.916 |
| ResNet-101 | 0.817 | 0.816 | 0.814 | 0.816 |
| | | | 0.901 | 0.900 |
| | | | 0.847 | 0.850 |
| DeiT-B | 0.882 | 0.883 | 0.795 | 0.800 |
| | | | 0.899 | 0.900 |
| | | | 0.885 | 0.883 |
| DeiT-S | 0.832 | 0.833 | 0.793 | 0.800 |
| | | | 0.901 | 0.900 |
| | | | 0.868 | 0.866 |
| ViT-B | -224 | 0.852 | 0.850 | 0.834 |
| | | | 0.833 | 0.900 |
| | | | 0.899 | 0.900 |
| | | | 0.900 | 0.932 |
| | | | 0.933 |
| ViT-Large | 0.866 | 0.866 | 0.899 | 0.900 |
| | | | 0.899 | 0.900 |

**表3. 在增强成像配置下深度学习模型的分类性能。评估指标（F1分数、准确性）按棕色和白色蛋壳分层呈现**
| | | | |
| | | | |
| | | | |
| ConvNeXt | 1.000 | 1.000 | 0.869 | 0.866 |
| | | | 0.883 | 0.866 |
| MobileNet | 1.000 | 1.000 | 0.898 | 0.900 |
| | | | 0.777 | 0.783 |
| | | | 0.791 | 0.800 |
| ResNet-50 | 1.000 | 1.000 | 0.795 | 0.762 |
| | | | 0.766 | 0.730 |
| | | | 0.750 |
| ResNet-101 | 1.000 | 1.000 | 0.866 | 0.752 |
| | | | 0.814 | 0.816 |
| | | | 0.933 | 0.916 |
| DeiT-B | 1.000 | 1.000 | 0.813 | 0.816 |
| | | | 0.933 | 0.916 |
| | | | 0.833 | 0.916 |
| ViT-B | -224 | 0.852 | 0.850 | 0.834 |
| | | | 0.833 | 0.900 |
| | | | 0.899 | 0.900 |
| | | | 0.900 | 0.932 |
| | | | 0.933 |
| ViT-Large | 0.866 | 0.866 | 0.899 | 0.900 |
| | | | 0.899 | 0.900 |

在405纳米激发（主要模式）下，分类性能受到光谱对比度和模型解析细微空间细节的能力的共同影响。白色蛋壳表现出强烈的内在自荧光，峰值大约在454纳米（蓝色区域）（Ostertag等人，2019）。尽管这种信号在光谱上与粪便污染物发出的红色荧光（600–720纳米）不同（Kim等人，2003年），但它可能会引入背景噪声。在主要模式下，信号采集仅限于两个特定区域，有效地消除了白色蛋壳454纳米自荧光的干扰。然而，仅靠光谱分离并不能完全解释观察到的最佳性能；保持空间信息同样关键。值得注意的是，ViT-Base-384实现了最高的分类准确率（0.9333），优于标准分辨率的ViT-Base-224，后者的准确率为0.9000。这种性能差异突显了高输入分辨率对于保留与微小污染物相关的细粒度空间特征的重要性，这些特征在低分辨率特征图中可能会丢失。这种对空间细节的依赖也得到了卷积神经网络（CNN）架构性能的支持。ResNet-50实现了0.9167的高准确率，明显优于更深层次的ResNet-101（0.8500）。这一反直觉的结果表明，对于白色蛋壳上的高对比度目标（如污染物），过深的网络可能是有害的。虽然像ResNet-101这样的深层网络具有更大的感受野，但其激进的特征抽象往往会侵蚀微小污染物的细粒度局部信号。相比之下，ResNet-50达到了最佳平衡，利用CNN的归纳偏差提取清晰的局部空间特征，而不会过度平滑小的异常。

对于棕色鸡蛋，405纳米的激发导致信噪比（SNR）显著降低。这是因为405纳米针对的是原卟啉IX（PPIX）的Soret带，使得分布在整个蛋壳上的色素在红色区域强烈荧光（Ostertag等人，2019年）。由于粪便污染物也在同一红色光谱带发出荧光，因此背景蛋壳的荧光成为直接的光学干扰。至关重要的是，这种具有挑战性的光学环境突显了高模型容量的必要性。光谱重叠的影响在模型家族之间的性能差异中得到了明显体现。在CNN中，更深层次的ResNet-101实现了0.8167的准确率，显著优于较浅的ResNet-50。这表明在高干扰条件下，需要增加网络深度来学习区分污染物信号和背景噪声所需的复杂非线性边界。这一趋势在ViT-Large模型中达到顶峰，它具有最高的计算负担，实现了0.9000的准确率。这些结果共同表明，当光谱信号重叠时，模型的计算能力（深度和参数数量）成为准确检测的决定性因素。

将激发源切换到365纳米从根本上改变了特征空间，导致模型性能显著提升。在棕色鸡蛋中观察到了最显著的变化，轻量级的MobileNet的准确率跃升至0.9000，远高于405纳米时的0.7667。这种性能提升归因于棕色蛋壳的光学特性。反射率研究表明，棕色蛋壳在365纳米处的反射率显著高于410纳米Soret带的强吸收峰（Ostertag等人，2019年）。这种更高的反射率意味着蛋壳对光子的吸收减少，从而最小化了背景荧光。因此，365纳米下的检测机制依赖于荧光团密度。虽然蛋壳只有一层薄薄的色素层，但粪便污染物由浓缩的荧光团聚集物组成（Gorji等人，2022年）。在365纳米激发下，背景被光学抑制，粪便中的高浓度荧光团仍能发出足够的光子通量。这创造了高的信噪比，使污染物在蛋壳背景下突出显示。这种光学优化简化了特征提取，即使资源有限的CNN也能高精度地识别污染物。

然而，在365纳米下，白色鸡蛋的情况出现了有趣的反转，其中更深层次的ResNet-101（0.8167）的表现优于ResNet-50（0.7500）。这种变化表明任务复杂性显著增加。类似于405纳米下棕色鸡蛋的光谱干扰，365纳米激发在白色鸡蛋上创造了高噪声环境。增强模式下的成像系统捕获了白色蛋壳在454纳米处的固有自荧光，这在紫外光下被强烈激活。这种强烈的背景信号与污染物特征重叠，使它们变得微弱且不清晰。在这种具有挑战性的情况下，较浅的ResNet-50由于光谱混淆而表现不佳，而更深层次的ResNet-101提供了必要的计算能力来区分这些较暗的、抽象的特征表示和强烈的背景荧光。

总体而言，这些发现表明，最佳检测策略必须是适应性的，并考虑蛋壳类型和可用硬件资源。对于棕色鸡蛋，增强模式无疑更优。通过利用基于密度的光学对比度来抑制背景噪声，它使轻量级的MobileNet实现了0.9000的高准确率，使其成为资源受限手持设备的理想选择。相反，对于白色鸡蛋，主要模式对于确保足够的光谱对比度至关重要。在这种配置下，模型选择需要平衡最大精度和计算效率（详见补充表S5，了解所有模型的输入分辨率、参数和浮点运算次数（FLOPs））。虽然ViT-Base-384展示了最高的灵敏度（0.9333），但ResNet-50提供了具有竞争力的性能（0.9167）。对于边缘处理器上的实时应用，ResNet-50是一个更实用的解决方案，因为它提供了比ViT更低的延迟和内存使用量。因此，未来便携式检测系统的开发应优先考虑将模型架构与硬件规格相匹配，为手持设备部署高效的CNN（如MobileNet和ResNet-50），同时为高性能计算环境保留高容量的Transformer。

为了确保有针对性和有意义的解释性分析，评估范围从最初测试的九个模型缩小到每种蛋壳变体的最佳性能架构。具体来说，XAI实现仅在增强模式下使用MobileNet进行棕色蛋壳的检测，在主要模式下使用基于ViT-base-384进行白色蛋壳的检测（图5，图6）。然后对这些选定的模型应用了针对其各自架构的特定XAI技术，以可视化其高性能分类的具体特征。对于应用于棕色蛋壳的基于CNN的MobileNet，使用了EigenCAM来投影类别激活图；而对于应用于白色蛋壳的ViT-base-384，则提取了注意力展开图来可视化变压器块中的自注意力机制。除了这些特定于架构的方法外，还对两种模型应用了SHAP和LIME，以提供比较和模型无关的视角。

下载：下载高分辨率图像（586KB）
下载：下载全尺寸图像

图5. 使用增强模式的MobileNet模型对棕色蛋壳的可解释AI（XAI）可视化。行对应于从0级到3级的污染严重程度。列显示：(a) 带有绿色圆圈标记的真实污染情况的原始荧光图像；(b) Eigen类别激活映射（EigenCAM）图，突出显示模型的关注区域；(c) SHapley加性解释（SHAP）摘要图，其中红色像素表示对分类的正面贡献；(d) 局部可解释模型无关解释（LIME）图，用黄色边界勾勒出最重要的超级像素。

下载：下载高分辨率图像（529KB）
下载：下载全尺寸图像

图6. 使用主要模式的ViT-base-384模型对白色蛋壳的可解释AI（XAI）可视化。行对应于从0级到3级的污染严重程度。列显示：(a) 带有绿色圆圈标记的真实污染情况的原始荧光图像；(b) 注意力展开图，突出显示模型的关注区域；(c) SHapley加性解释（SHAP）摘要图，其中红色和蓝色像素分别表示对分类的正面和负面贡献；(d) 局部可解释模型无关解释（LIME）图，用黄色边界勾勒出最重要的超级像素。

从0级到3级的不同污染程度的比较分析显示，MobileNet和ViT-base-384模型一致地将原始荧光图像中用绿色圆圈标记的实际污染区域作为主要诊断证据。对于棕色蛋壳，EigenCAM热图显示了与局部污染精确重叠的高激活区域。同样，对于白色蛋壳，注意力展开图通过高权重关注区域指出了缺陷的确切位置，表明基于变压器的模型有效地捕捉了异常特征的空间依赖性。SHAP分析进一步证实了这种空间一致性，每次解释使用2000次迭代以确保统计收敛。结果SHAP图显示，红色像素表示的正面SHAP值主要聚集在两种蛋壳类型的污染区域内。这种一致性确认了这些特定像素组是提高模型对相应污染类别信心最具影响力的因素。此外，LIME结果通过突出模型认为对其预测最关键的单一超级像素区域提供了细粒度的验证。在这项研究中，LIME分析也使用了2000个样本来稳定局部替代模型，并将可视化限制在表现最好的区域，以清晰地隔离最主导的特征。LIME生成的黄色边界一致地涵盖了所有类别的污染区域，反映了人类专家用于识别的视觉逻辑。

这些独立方法的收敛表明，优化模型已经发展出对数据的稳健和可解释的理解。值得注意的是，XAI检测区域与棕色和白色蛋壳的真实污染区域之间的高度重叠验证了所提出检测系统的科学可靠性。这些发现证实，所选架构的卓越性能是由特征学习驱动的，而不是背景伪影，为它们在安全关键检测任务中的部署提供了宝贵的见解。

结论

这项研究提出了一个实用且可扩展的框架，用于定量评估蛋壳上的粪便污染，弥合了实验室级分析和实际应用之间的差距。通过将便携式荧光成像与优化的深度学习架构相结合，我们证明了所提出的系统即使在标准环境光线下也能实现稳健的检测精度，消除了传统荧光检测协议通常所需的严格暗室条件。这种环境适应性是确保系统在各种农业环境中可用的关键因素。这项工作的一个关键贡献是验证了根据特定光学配置调整深度学习策略的重要性，特别是通过匹配激发波长和模型架构与蛋壳色素，以最大化检测精度。此外，效率分析证实了这些高性能模型在嵌入式系统的计算限制内运行，验证了手持设备进行实时操作的可行性。可解释AI（XAI）的整合进一步通过提供与人类专家逻辑一致的透明视觉证据，增强了系统的可靠性，从而增强了人们对自动化决策过程的信任。

最终，这项技术为家禽供应链提供了一种变革性的解决方案，用客观、标准化的筛查方法取代了主观的视觉和触觉检测。通过实现病原体的早期和准确识别，该系统在提高整体食品安全协议、减轻食品安全风险和支持鸡蛋生产行业的经济稳定性方面具有重大潜力。

**cRediT作者贡献声明**

Insuck Baek：写作——审阅与编辑、撰写——初稿、方法论、调查、形式分析、数据管理、概念化。
Lalit Mohan Kandpal：写作——审阅与编辑、方法论、调查、形式分析、数据管理。
Chansong Hwang：写作——审阅与编辑、验证、调查、形式分析、数据管理。
Sookyung Oh：写作——审阅与编辑、方法论、形式分析、数据管理。
Laura P. Del Collo：写作——审阅与编辑、方法论、形式分析、数据管理。
Mónica Santín：写作——审阅与编辑、监督、概念化。
Bradd J. Haley：写作——审阅与编辑、监督、方法论、数据管理。
Manan Sharma：写作——审阅与编辑、监督、方法论、数据管理。
Jitu Patel：写作——审阅与编辑、监督、方法论、数据管理。
Jianwei Qin：写作——审阅与编辑、可视化、验证。
Fartash Vasefi：写作——审阅与编辑、资源管理、概念化。
Moon Kim：写作——审阅与编辑、撰写——初稿、监督、项目管理、资金获取、概念化。

热点排行