基于YOLOv11m的智能帧保留与异常检测通知

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《IEEE Transactions on Mobile Computing》：Intelligent Frame Retention and Anomaly Detection with Notification Using YOLOv11m

【字体：大中小】 时间：2026年06月18日 来源：IEEE Transactions on Mobile Computing 9.2

编辑推荐：

　　本研究旨在解决视频存储问题，通过采用实时异常检测来提高摄像头的整体效率，从而通知用户任何可疑的异常。所提出的训练模型处理实时视频流，识别不寻常的事件和异常情况，如盗窃、武器或暴力活动。同时，一个视频存储优化算法减少了冗余帧，同时保留了来自闭路电视监控（CCTV

本研究旨在解决视频存储问题，通过采用实时异常检测来提高摄像头的整体效率，从而通知用户任何可疑的异常。所提出的训练模型处理实时视频流，识别不寻常的事件和异常情况，如盗窃、武器或暴力活动。同时，一个视频存储优化算法减少了冗余帧，同时保留了来自闭路电视监控（CCTV surveillance）的检测到运动的视频流。此外，如果模型检测到实时视频流中发生异常事件，它会立即通知用户异常类型和事件发生的位置。实验结果表明，所提出的系统有效地检测异常，平均精度-召回率（precision–recall）得分为0.958，F1置信度（F1-confidence）得分为0.93，确保了可靠的威胁识别和检测。该模型具有鲁棒性，能够区分正常和异常活动，这一点由实验结果证明。

**研究背景**
近年来，全球多地犯罪率持续上升，多数案件发生在夜间人们熟睡时段。传统闭路电视（CCTV）监控系统需人工持续监视可疑活动，不仅耗费人力，且全天候录制产生的海量视频数据（通常保留约30天）给存储成本和检索效率带来巨大挑战——从720小时录像中定位特定事件十分困难。为应对上述问题，研究人员提出一种智能CCTV监控系统，旨在通过实时异常检测与视频存储优化相结合，在提升威胁识别及时性的同时降低存储开销。该论文发表在《IEEE Transactions on Mobile Computing》。

**研究内容与结论**
研究人员开发了一套集成实时异常检测、视频帧优化及消息告警的系统。系统使用经微调的YOLOv11m模型处理实时视频流，能够准确识别盗窃、武器、暴力、火灾等异常事件；同时采用基于均方误差（MSE）的视频存储优化算法，通过比较连续帧间差异仅保留关键帧，显著降低冗余数据。实验表明，该系统在异常检测中取得平均精度-召回率（precision–recall）0.958和F1置信度（F1-confidence）0.93的优异性能，并能实时向用户推送包含异常类型、时间戳与位置的告警通知。意义在于：实现了高可靠性的实时威胁识别与存储效率的协同提升，为智能安防系统提供了一种可部署的解决方案。

**主要关键技术方法（不超过250字）**
研究采用以下关键技术：
1. **YOLOv11m深度学习模型**：在Roboflow Universe的“Anomaly Detection Dataset”（包含4类异常、共10,385张标注图像）上微调，用于实时帧级异常检测。
2. **基于均方误差（MSE）的视频帧选择算法**：设定阈值，仅保留与前一帧差异超过阈值的帧，剔除冗余帧以优化存储。
3. **帧采样策略**：每连续20帧中仅抽取一帧送入检测模型，降低计算负载。
4. **实时告警机制**：通过Telegram Bot发送包含异常类型、时间戳和位置的通知。
5. **训练配置**：70个epoch、Adam优化器、初始学习率0.001（衰减至0.0001），并使用随机翻转、旋转、缩放、色彩变换等数据增强。

**研究结果**
**5.1 实验设置**
实验在配备Intel Core i5-12500H CPU、16GB RAM及Google Colab Pro（NVIDIA A100 GPU，40GB显存）的环境下完成。模型训练使用Anomaly Detection Dataset，批大小为16。

**5.2 结果与讨论**
研究人员通过性能指标评估微调的YOLOv11m模型：平均精度-召回率（precision–recall）曲线达0.958（见图6），平均F1置信度（F1-confidence）曲线达0.93（见图7），表明模型能有效定位并分类复杂场景中的对象。可视化结果（图8和图9）展示了实时视频界面与告警通知界面——系统在检测到异常后立即推送消息及现场图片，而视频存储优化（MSE阈值判断）在后台并行执行。进一步，模型成功识别搏斗、火灾、烟雾、事故等威胁（图10、图11），所有检测结果均以边界框标注。

**讨论与结论总结**
讨论部分指出，该系统的异常检测与告警模块为实时响应，视频存储优化作为后台缓冲层仅用于滤除冗余帧、压缩并组织录像，保证关键片段不丢失。实验证实模型具备区分正常与异常活动的鲁棒性。结论翻译如下：
**结论**：本研究旨在提升实时安全监控效率并降低视频存储成本。传统CCTV系统面临数据过量生成和异常检测延迟的问题，导致运营成本高、效率低下。所提出的系统通过集成微调的YOLOv11m深度学习模型用于异常检测，以及基于MSE的视频优化技术（仅保留关键帧），解决上述挑战。该系统能实时处理连续视频流，准确识别搏斗、火灾、事故、烟雾等威胁。异常检测模型在Roboflow Universe的异常检测数据集（含4类犯罪相关类别，共10,385张标注图像）上训练，采用70个epoch、Adam优化器、批大小16、学习率从0.001衰减至0.0001，并使用随机翻转、旋转、缩放、色彩变化等数据增强方法增强泛化能力。实验评估验证了该系统在异常检测和视频存储优化方面的有效性，平均精度-召回率达0.958，F1置信度达0.93，证明了其在可靠检测安全威胁方面的性能。此外，基于MSE的优化方法通过剔除冗余帧同时保留关键监控片段，显著降低了存储成本。

联系信箱：

粤ICP备09063491号

热点排行