基于YOLOv11m的智能帧保留与异常检测通知

《IEEE Transactions on Mobile Computing》:Intelligent Frame Retention and Anomaly Detection with Notification Using YOLOv11m

【字体: 时间:2026年06月18日 来源:IEEE Transactions on Mobile Computing 9.2

编辑推荐:

  本研究旨在解决视频存储问题,通过采用实时异常检测来提高摄像头的整体效率,从而通知用户任何可疑的异常。所提出的训练模型处理实时视频流,识别不寻常的事件和异常情况,如盗窃、武器或暴力活动。同时,一个视频存储优化算法减少了冗余帧,同时保留了来自闭路电视监控(CCTV

  
本研究旨在解决视频存储问题,通过采用实时异常检测来提高摄像头的整体效率,从而通知用户任何可疑的异常。所提出的训练模型处理实时视频流,识别不寻常的事件和异常情况,如盗窃、武器或暴力活动。同时,一个视频存储优化算法减少了冗余帧,同时保留了来自闭路电视监控(CCTV surveillance)的检测到运动的视频流。此外,如果模型检测到实时视频流中发生异常事件,它会立即通知用户异常类型和事件发生的位置。实验结果表明,所提出的系统有效地检测异常,平均精度-召回率(precision–recall)得分为0.958,F1置信度(F1-confidence)得分为0.93,确保了可靠的威胁识别和检测。该模型具有鲁棒性,能够区分正常和异常活动,这一点由实验结果证明。
**研究背景**
近年来,全球多地犯罪率持续上升,多数案件发生在夜间人们熟睡时段。传统闭路电视(CCTV)监控系统需人工持续监视可疑活动,不仅耗费人力,且全天候录制产生的海量视频数据(通常保留约30天)给存储成本和检索效率带来巨大挑战——从720小时录像中定位特定事件十分困难。为应对上述问题,研究人员提出一种智能CCTV监控系统,旨在通过实时异常检测与视频存储优化相结合,在提升威胁识别及时性的同时降低存储开销。该论文发表在《IEEE Transactions on Mobile Computing》。

**研究内容与结论**
研究人员开发了一套集成实时异常检测、视频帧优化及消息告警的系统。系统使用经微调的YOLOv11m模型处理实时视频流,能够准确识别盗窃、武器、暴力、火灾等异常事件;同时采用基于均方误差(MSE)的视频存储优化算法,通过比较连续帧间差异仅保留关键帧,显著降低冗余数据。实验表明,该系统在异常检测中取得平均精度-召回率(precision–recall)0.958和F1置信度(F1-confidence)0.93的优异性能,并能实时向用户推送包含异常类型、时间戳与位置的告警通知。意义在于:实现了高可靠性的实时威胁识别与存储效率的协同提升,为智能安防系统提供了一种可部署的解决方案。

**主要关键技术方法(不超过250字)**
研究采用以下关键技术:
1. **YOLOv11m深度学习模型**:在Roboflow Universe的“Anomaly Detection Dataset”(包含4类异常、共10,385张标注图像)上微调,用于实时帧级异常检测。
2. **基于均方误差(MSE)的视频帧选择算法**:设定阈值,仅保留与前一帧差异超过阈值的帧,剔除冗余帧以优化存储。
3. **帧采样策略**:每连续20帧中仅抽取一帧送入检测模型,降低计算负载。
4. **实时告警机制**:通过Telegram Bot发送包含异常类型、时间戳和位置的通知。
5. **训练配置**:70个epoch、Adam优化器、初始学习率0.001(衰减至0.0001),并使用随机翻转、旋转、缩放、色彩变换等数据增强。

**研究结果**
**5.1 实验设置**
实验在配备Intel Core i5-12500H CPU、16GB RAM及Google Colab Pro(NVIDIA A100 GPU,40GB显存)的环境下完成。模型训练使用Anomaly Detection Dataset,批大小为16。

**5.2 结果与讨论**
研究人员通过性能指标评估微调的YOLOv11m模型:平均精度-召回率(precision–recall)曲线达0.958(见图6),平均F1置信度(F1-confidence)曲线达0.93(见图7),表明模型能有效定位并分类复杂场景中的对象。可视化结果(图8和图9)展示了实时视频界面与告警通知界面——系统在检测到异常后立即推送消息及现场图片,而视频存储优化(MSE阈值判断)在后台并行执行。进一步,模型成功识别搏斗、火灾、烟雾、事故等威胁(图10、图11),所有检测结果均以边界框标注。

**讨论与结论总结**
讨论部分指出,该系统的异常检测与告警模块为实时响应,视频存储优化作为后台缓冲层仅用于滤除冗余帧、压缩并组织录像,保证关键片段不丢失。实验证实模型具备区分正常与异常活动的鲁棒性。结论翻译如下:
**结论**:本研究旨在提升实时安全监控效率并降低视频存储成本。传统CCTV系统面临数据过量生成和异常检测延迟的问题,导致运营成本高、效率低下。所提出的系统通过集成微调的YOLOv11m深度学习模型用于异常检测,以及基于MSE的视频优化技术(仅保留关键帧),解决上述挑战。该系统能实时处理连续视频流,准确识别搏斗、火灾、事故、烟雾等威胁。异常检测模型在Roboflow Universe的异常检测数据集(含4类犯罪相关类别,共10,385张标注图像)上训练,采用70个epoch、Adam优化器、批大小16、学习率从0.001衰减至0.0001,并使用随机翻转、旋转、缩放、色彩变化等数据增强方法增强泛化能力。实验评估验证了该系统在异常检测和视频存储优化方面的有效性,平均精度-召回率达0.958,F1置信度达0.93,证明了其在可靠检测安全威胁方面的性能。此外,基于MSE的优化方法通过剔除冗余帧同时保留关键监控片段,显著降低了存储成本。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号