一个经过洗牌归一化的Pix2Pix GAN框架,结合了Elastic ArcFace和YOLO算法,用于实现无遮挡的牛只识别

《Computers and Electronics in Agriculture》:A shuffle-normalized Pix2Pix GAN framework with Elastic ArcFace and YOLO for occlusion-free cattle identification

【字体: 时间:2026年04月25日 来源:Computers and Electronics in Agriculture 8.9

编辑推荐:

  针对传统牲畜识别方法存在的侵入性、易损及人工记录误差等问题,本研究提出基于Shuffle Normalization的Pix2Pix GAN框架,合成无遮挡牛嘴图像以解决数据不足与遮挡干扰。实验表明,该方法在Fréchet距离13.92下实现98.7%的识别准确率,有效提升生物特征识别鲁棒性。

  
Niraj Kumar | Sanjay Kumar Singh
印度理工学院(BHU),瓦拉纳西分校,计算机科学与工程系,瓦拉纳西221005,北方邦,印度

摘要

近年来,基于生物特征的牛只识别技术,尤其是利用牛嘴图案的技术,已成为一种可靠且非侵入性的解决方案。然而,现实世界中的牛嘴图像经常受到草丛、污垢和环境噪声的影响而出现遮挡现象,这会严重影响识别效果。生成对抗网络(GAN),特别是Pix2Pix GAN,为将受噪声影响的图像转换为清晰、真实的表示提供了有前景的方法。尽管如此,GAN的训练仍然具有挑战性,因为存在不稳定性和模式崩溃的问题。传统的归一化技术(如批量归一化)效果有限,因为它们未能充分利用GAN的架构特性。为了解决这些问题,本文提出了一种名为“Shuffle Normalization”的新归一化技术,并将其集成到Pix2Pix GAN框架中,以从噪声输入生成清晰的牛嘴图像。Shuffle Normalization通过保留语义信息并减轻梯度饱和来提高训练稳定性和图像质量。在牛只识别任务中,我们采用了一种基于弹性边缘损失(Elastic Face Margin Loss)的分类器,该分类器在真实的牛嘴图像上进行训练,并使用GAN生成的图像进行评估。所提出的方法取得了13.92的Frechet Inception Distance分数,表明生成图像的视觉保真度很高,识别准确率为98.7%,证明了整个框架的有效性。这项工作推进了动物生物特征领域的生成建模,并为现实世界的牛只识别提供了稳健的解决方案,同时为精确畜牧业中的抗遮挡数据增强和生物特征识别建立了一个实用的基于生成式AI的范式。

引言

准确识别牲畜对于高效农场管理、可追溯性、疾病监测以及各种农业领域的身份验证至关重要。在实际农场环境中,识别系统必须在具有挑战性的条件下可靠运行,例如光照不受控制、动物移动、草丛或泥浆造成的遮挡以及庞大的畜群规模。在现代大规模智能农业操作中,自动化的个体识别是精确畜牧业管理系统的核心,能够连续监测动物的健康状况、生产力和行为模式。传统的识别技术(如耳标、烙印和微芯片)已被广泛使用;然而,这些方法存在一些局限性,包括侵入性、篡改风险和操作效率低下(Islam等人,2024年;Kimani等人,2023年)。烙印会给动物带来疼痛和压力,而耳标和微芯片可能会丢失或被移除,从而影响数据完整性并增加维护成本。此外,基于视觉检查的手动记录容易出错,且不适合现代精确畜牧业中常见的大规模操作。
为了解决这些问题,基于生物特征的识别方法因其非侵入性、可靠性和自动化潜力而受到越来越多的关注(Smink等人,2024年)。在探索的各种生物特征中,如虹膜图案、视网膜血管、DNA谱型和牛嘴印迹中,后者显得特别有前景。牛嘴印迹的独特性和持久性类似于人类指纹,并且在图像捕获和部署成本方面具有优势(Kaushik等人,2023年;Rajeshwaran等人,2024年;Mohanty和Sahu,2020年)。重要的是,牛嘴图像可以在农场环境中随时捕获,而无需限制动物的活动,这使得它们非常适合实际应用。可靠的个体识别可以实现精确的喂养策略,根据生长阶段和产奶量调整饲料分配,支持依赖于个体行为追踪的发情检测系统,并通过将生物特征身份与健康记录和传感器数据流关联起来来增强早期疾病检测。
随着深度学习和计算机视觉的发展,生物特征识别取得了显著进展,特别是通过卷积神经网络(CNN),它们在提取具有区分性的视觉表示方面优于传统的手工特征方法(Chauhan等人,2018年;Rajeshwaran等人,2024年;He等人,2016年)。尽管取得了这些进展,但在农场部署此类系统时仍面临一个持久挑战,即大型、多样化且高质量的数据集有限。现实世界中的牛只图像经常受到光照变化、姿势变化、草丛或饲料造成的部分遮挡以及运动模糊的影响,所有这些都会降低识别性能并限制在受限数据集上训练的CNN模型的泛化能力。在高密度农业环境中,识别错误可能会传播到管理系统中,可能影响自动喂养计划、疫苗接种计划甚至保险理赔验证过程,而这些过程都需要准确的个体可追溯性。
为了缓解数据不足和噪声问题的影响,图像合成和数据增强已成为重要的工具。最近的研究表明,生成对抗网络(GAN)在合成高保真生物特征图像方面非常有效,从而丰富了训练数据集并增强了模型的鲁棒性(Rahman等人,2024年;Karras等人,2018年)。在可用的GAN架构中,Pix2Pix是一种用于成对图像转换的条件GAN(cGAN),在需要结构对齐的任务(如恢复、增强和去除遮挡)中显示出特别的前景(Karras等人,2019年;Isola等人,2018年)。这些能力对于农场获取的牛嘴图像尤其相关,因为在这些图像中遮挡和质量退化很常见。
在这项工作中,我们提出了一种将Pix2Pix GAN与Shuffle Normalization结合的流程,以从草丛覆盖或质量较低的输入中合成无遮挡的牛嘴图像(Wang等人,2020年)。Shuffle Normalization通过通道级别的随机排列进行局部归一化,提高了训练稳定性,使其非常适合农业数据集通常遇到的数据量有限的情况(Karras等人,2020年)。与批量归一化或实例归一化等传统归一化技术不同,Shuffle Normalization减轻了特征过度平滑和批量依赖性问题,使得细粒度纹理(对于基于牛嘴的生物特征识别至关重要)的保持更加一致。生成的图像用于增强真实世界的数据,使得学习更加一致和具有区分性的生物特征成为可能。这种集成是所提出框架的关键创新点,因为Shuffle Normalization是专门为解决牲畜成像场景中常见的遮挡引起的不稳定性问题而设计的。
对于识别任务,我们采用了基于角度边缘的损失函数,特别是Elastic ArcFace和CosFace,这些函数在生物特征识别中表现出强大的性能,通过强制紧凑的类内分布和增强的类间可分性(Deng等人,2022年;Wang等人,2018年;Boutros等人,2022年)。弹性边缘公式在训练过程中引入了适应性变化,使模型能够更好地适应农场环境中常见的姿势变化和部分遮挡等现实因素。通过稳定训练过程中的特征分布,增强型增强流程使判别模型能够从部分损坏的输入中学习更可靠的嵌入,从而在实际农场条件下提高识别性能。
总体而言,这项工作通过减少对大型清洁数据集的依赖、通过合成图像生成明确处理遮挡问题以及通过基于自适应边缘的学习提高特征区分能力,解决了牛只识别中的关键实际挑战,从而提供了一种适用于实际农场条件的可扩展且非侵入性的解决方案。通过在实际农场干扰下实现可靠的身份识别,所提出的框架有助于智能畜群管理系统的发展,其中生物特征识别与喂养自动化、繁殖监测、健康分析和数字可追溯平台相结合。然而,现有研究大多缺乏一个统一的框架,该框架能够整合合成数据生成(用于遮挡输入)、归一化引导的生成学习和基于边缘的特征区分(用于牛嘴识别),而这一限制在本文中得到了解决。
我们方法的整体工作流程如图1所示。本文的主要贡献总结如下:
  • (1)
    提出了一种新的图像合成流程,将Pix2Pix GAN与提出的Shuffle Normalization相结合,从部分遮挡的输入中生成高质量、无遮挡的牛嘴图像,从而丰富了牛只识别的训练数据。
  • (2)
    通过从农场录制的视频中提取帧并使用YOLO v10定位和裁剪牛嘴区域,构建了一个可靠的牛嘴图像数据集,这些图像样本适合生成模型训练。
  • (3)
    使用具有随机边缘的弹性边缘损失函数Elastic ArcFace来增强特征嵌入的鲁棒性,并通过促进更大的类间可分性来提高识别准确性。
  • (4)
    使用真实的清晰牛嘴图像对提出的系统进行评估,同时使用GAN生成的无遮挡图像来评估和验证合成增强在提高识别性能方面的有效性。
本文的组织结构如下:第2节介绍了生成模型、基于角度边缘的损失函数和牛只识别技术的背景和相关工作。第3节详细介绍了所提出的方法论、数据集获取和预处理、提出的GAN方法以及使用Elastic ArcFace的识别框架。第4节讨论了实验设置、结果和评估。最后,第5节总结了本文并概述了未来的研究方向。

部分摘要

生成模型的进步

生成对抗网络(GAN)已成为数据合成的强大工具,特别是在收集标记样本成本高昂或不切实际的领域。早期的基础工作(如Salimans等人,2016年)引入了改进的训练技术,包括特征匹配、小批量判别和历史平均,显著稳定了GAN的优化并提高了样本多样性。随后Ulyanov等人的研究(Ulyanov等人

提出的方法论

在本节中,我们详细介绍了我们改进的Pix2Pix GAN架构的方法论,其中将Shuffle Normalization(SNorm)作为传统批量归一化(BN)(Ioffe和Sze

实验结果和讨论

本节全面评估了所提出的Shuffle Normalized Pix2PixGAN框架在将草丛覆盖的牛嘴图像转换为清晰、高质量表示方面的性能,这些表示随后用于牛只识别。我们展示了图像生成和分类任务的结果,并比较了各种归一化方法和损失函数。广泛的消融研究进一步验证了我们选择的有效性。

讨论

所提出的框架整合了三个关键组件:增强了Shuffle Normalization的Pix2Pix GAN、基于YOLO的牛嘴提取和Elastic ArcFace分类,以解决无遮挡牛只识别的挑战。Shuffle Normalization在生成器中引入,以在训练过程中提高特征的一致性和稳定性,使模型能够从被遮挡或被草覆盖的输入中合成清晰、高保真的牛嘴图像。YOLO v10实现了精确的

结论

本文提出了一种新的方法论,将Shuffle Normalization集成到Pix2Pix GAN架构中,以生成高质量、无遮挡的牛嘴图像用于牛只识别。所提出的框架稳定了生成过程,并提高了合成图像的结构和感知保真度,这一点通过FID和SSIM等指标得到了验证。通过将这种生成框架与判别损失函数(特别是Elastic ArcFace变体)相结合,模型

CRediT作者贡献声明

Niraj Kumar:撰写——原始草稿,方法论。Sanjay Kumar Singh:撰写——审阅与编辑,监督。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能会影响本文报告的工作。

致谢

我们衷心感谢NASF项目“基于人工智能和物联网的智能兽医生态系统,用于动物健康、患者护理和精确畜牧业”(项目编号NASF/PA-9028/2022-23)的资助支持。我们还要感谢比哈尔邦政府科学、技术和技术教育部门(DSTTE)下属的Kishanganj政府工程学院提供的机构支持和研究便利。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号