面向现实养殖场景的大规模肉鸡检测数据集PIO:推动精准畜牧业计算机视觉发展

《Scientific Data》:PIO, A Large-Scale Dataset for Broiler Chicken Detection under Real Poultry Farming Conditions

【字体: 时间:2026年04月10日 来源:Scientific Data 6.9

编辑推荐:

  为解决商业养鸡场因高饲养密度和复杂环境导致动物监控困难,以及自动化监测领域专用公开数据集匮乏的问题,研究人员开展了“面向目标检测的家禽图像(PIO)”数据集构建研究。该数据集包含1,487张手动标注图像,涵盖327,289个肉鸡实例,采集自不同生长阶段的商业和原型鸡舍,真实反映了形态、光照和密度变化。基于PIO数据集对三种YOLOv10变体进行训练和评估,证明了其适用于精准畜牧业中目标检测模型的基准测试,为相关计算机视觉模型开发提供了关键资源。

  
在全球化食物供应链中,肉鸡生产扮演着至关重要的角色,然而,如何在高密度、环境多变的商业养殖场中有效监控动物福利与生长状况,却一直是畜牧业面临的棘手挑战。传统的人工巡检方式不仅效率低下,也难以实现全天候、无间断的观测。更关键的是,随着人工智能与计算机视觉技术在农业领域的渗透,一个根本性的瓶颈浮现出来:该领域极度缺乏公开可用的、针对真实养殖场景的专用图像数据集。没有高质量的数据“燃料”,再先进的算法模型也难以“跑起来”,这严重阻碍了自动化、智能化监测系统在精准畜牧业(Precision Livestock Farming, PLF)中的实际应用与进步。
为了破解这一困局,一个研究团队在《Scientific Data》上发表了一项研究,他们创造并发布了名为“面向目标检测的家禽图像”(Poultry Images for Object detection, PIO)的大规模数据集。这项研究的核心目的,就是为开发与测试适用于家禽养殖场的计算机视觉模型提供一个坚实、可靠的公共基准。研究人员深知,实验室里的理想化图片与真实鸡舍中拍摄到的画面天差地别,因此他们刻意从商业养殖场和原型鸡舍中收集图像,覆盖了肉鸡不同的生长阶段,确保了数据能真实反映现实条件中的各种挑战,比如鸡只因日龄增长而产生的形态变化、鸡舍内不均匀的光照、以及极高的鸟类密度导致的严重遮挡。
为了构建PIO数据集,研究团队系统地采集了1,487张图像,并进行了精细的人工标注。他们使用了LabelImg工具,在每张图片中为每一只可见的肉鸡绘制了边界框(Bounding Box),最终得到了总计高达327,289个肉鸡实例。这些标注信息都经过了规范化处理,以适应主流目标检测框架的输入要求。仅仅拥有数据集还不够,为了展示PIO的实用价值,研究人员选取了当时先进的YOLOv10(You Only Look Once version 10)目标检测算法的三个不同变体模型,在PIO数据集上进行了完整的训练和评估流程。这项“以身试法”的基准测试,不仅验证了数据集本身的质量和挑战性,也为其作为未来相关模型性能评测的标尺提供了实证依据。
主要技术方法
本研究的关键技术方法围绕数据集的构建与评估展开。首先,研究团队从真实的商业和原型家禽鸡舍中,采集了覆盖肉鸡多个生长阶段的原始图像,作为数据基础。其次,他们利用LabelImg工具对所有图像进行了精细的手动边界框标注,构建了包含超过32万个实例的大规模标注数据集PIO。最后,为了评估数据集的效用,研究者采用了基于深度学习的YOLOv10目标检测框架,并选择了其三种不同的模型变体(n, s, m),在PIO数据集上执行了标准的模型训练与性能评估流程,以验证数据集对模型开发和基准测试的适用性。
研究结果
大规模、高质量数据集的创建
研究人员成功构建了PIO数据集,该数据集包含1,487张经过手动标注的图像,共计327,289个肉鸡实例。这些数据采集自多样化的真实养殖环境,涵盖了从商业鸡舍到原型设施的不同场景,以及肉鸡的多个关键生长阶段。数据集主动囊括了现实养殖中存在的多种挑战性因素,包括鸡只的形态学(Morphology)变化、鸡舍内复杂的照明(Lighting)条件、以及极高的鸟类密度(Bird Density)导致的密集遮挡。所有标注均以归一化的边界框形式保存,确保了与当前主流目标检测框架的兼容性。
数据集在模型基准测试中的效用验证
为了实证评估PIO数据集的价值,研究团队选取了YOLOv10-n、YOLOv10-s和YOLOv10-m三个不同复杂度的模型变体,在PIO数据集上进行了训练与评估。实验结果表明,所有模型变体均能在该数据集上有效地进行学习并实现肉鸡检测。性能最佳的模型在测试集上取得了具有竞争力的检测精度,这充分说明了PIO数据集能够可靠地用于训练和评估先进的目标检测模型。同时,不同模型变体之间的性能对比,也清晰地揭示了模型容量与检测精度、速度之间的权衡关系,为后续研究者在特定应用场景下选择合适模型提供了参考。
结论与讨论
本研究推出的PIO数据集,有效填补了精准畜牧业计算机视觉应用领域缺乏大规模、高质量公开数据集的空白。该数据集严格源自真实养殖条件,其包含的形态、密度、光照变化使其成为开发生命科学和健康医学领域内鲁棒性强的自动化监测算法的理想测试平台。通过使用YOLOv10系列模型进行基准测试,研究不仅验证了数据集本身的实用性和挑战性,也为其作为未来目标检测模型在畜牧业场景性能评估的标准基准奠定了基础。这项工作的重要意义在于,它通过提供关键的公共数据资源,降低了该领域的研究门槛,有望加速计算机视觉技术在动物福利监控、健康预警、生长性能评估等方面的创新与应用,最终推动精准畜牧业向更高效、更智能的方向发展。论文中展示的构建高质量领域专用数据集的方法学,也为解决其他农业或生命科学监测场景中的数据稀缺问题提供了可借鉴的范式。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号