面向工业物联网(Industrial Internet of Things, IIoT)的可解释神经-模糊入侵检测系统(Intrusion Detection System, IDS)

《Internet of Things》:An Explainable Neuro-Fuzzy Intrusion Detection System for Industrial IoT

【字体: 时间:2026年06月02日 来源:Internet of Things 7.6

编辑推荐:

  在工业物联网(Industrial Internet of Things, IIoT)中采用可信人工智能(Trustworthy AI)需要适用于边缘部署的透明、资源高效的入侵检测系统(Intrusion Detection System, IDS)。针对现有

  
在工业物联网(Industrial Internet of Things, IIoT)中采用可信人工智能(Trustworthy AI)需要适用于边缘部署的透明、资源高效的入侵检测系统(Intrusion Detection System, IDS)。针对现有方案难以同时兼顾性能与可解释性的不足,研究人员提出并评估了一种基于自适应神经-模糊推理系统(Adaptive Neuro-Fuzzy Inference System, ANFIS)的可解释神经-模糊IDS,专为边缘场景定制。研究人员实现了ANFIS模型,并在TON_IoT数据集及一个新的基于NFStream的AI4SECIoT流数据集上进行评估,完整记录了预处理流程和硬件/软件配置以保证可复现性。该模型在Intel i5-1335U CPU上取得F1=0.9043、AUC-ROC=0.9717、推理延迟0.57 ms,含88条规则,权值载荷约0.97 kB(float32),ONNX/TorchScript导出文件分别为93 kB/103 kB,优于Mamdani模糊基线并提供比多层感知器(Multilayer Perceptron, MLP)参照模型更强的可解释性。结果表明该方法为IIoT边缘网关提供了一条可解释、高效IDS的可行路径,同时也指出隐私、公平性和对抗鲁棒性仍是待解决的开放问题,需优先处理以增强整体可信度。
论文解读:面向工业物联网的可解释神经-模糊入侵检测系统(ANFIS-Based IDS for IIoT)
研究背景与意义
工业物联网(Industrial Internet of Things, IIoT)的广泛部署显著扩大了关键基础设施的网络攻击面,促使研究者近年来广泛关注IoT/IIoT环境下的入侵检测系统(Intrusion Detection System, IDS)。深度学习模型虽常在标准数据集上报告接近完美的检测性能,但其"黑盒"特性及较高的计算开销限制了其在资源受限边缘设备上的实际部署。相比之下,神经-模糊(Neuro-fuzzy)方法可通过规则级可解释性结合有竞争力的性能和低运行时开销来弥补这一缺陷,但现有文献缺乏其在异构IIoT语境下充分实证验证及严格现实工业环境评测。为此,研究人员设计、实现并实证评估了一种面向IIoT的可解释神经-模糊(即自适应神经-模糊推理系统,Adaptive Neuro-Fuzzy Inference System, ANFIS)IDS,旨在平衡可解释性、效率与检测性能,并将检测任务置于边缘层执行。该论文发表于《Internet of Things》。
主要关键技术方法
研究人员采用两类数据源构建数据集:一是自建可控环境中捕获的.pcap流量(Raspberry Pi 4为受害端、Jetson Nano为攻击端,辅以互联网正常流量),二是公开TON_IoT数据集。所有.pcap经NFStream转化为单向网络流(Network Flow)并导出CSV,对齐至NF-ToN-IoT特征集。预处理步骤含数值列float64→float32类型转换、去全空/零方差列、分类变量确定性标签编码及缺失值中位数填补,标签编码为0(良性)/1(攻击)。经互信息(Mutual Information)与随机森林重要性初筛、Pearson相关系数及方差膨胀因子(Variance Inflation Factor, VIF)去冗余后最终保留6个特征:App_Cat_Code、Src2dst_Max_Ps、Dst2src_Packets、Dst2src_Mean_Piat_Ms、Bidirectional_Max_Piat_Ms、Bidirectional_Min_Ps。数据按类别与来源分层划分为训练集70%、验证集15%、测试集15%。ANFIS模型每输入变量设5个隶属函数(Membership Function, MF;3个高斯(Gaussian)+2个广义钟形(Bell)),MF中心由k-means初始化,采用变元-wise前件(Antecedent)选择并结合结构化规则剪枝(Rule Pruning,依据后件权值(Consequent Weight, W)绝对值之和阈值),初始211条规则经训练期分阶段剪枝后保留88条活跃规则。后件层为零阶Takagi–Sugeno模型,无偏置,输出两类logit后经Softmax得概率。损失函数为加权Focal Loss加L1范数正则项(λ=5×10-5,α=[0.25,0.75],γ=1.5),优化器为AdamW(lr=3×10-3,weight_decay=1×10-4)配合OneCycleLR调度及基于验证集F1的早期停止(Patience=10)。决策阈值通过在验证集上最大化F0.7(β=0.7的F-Measure)选定(≈0.65)。对照基线含9条规则的Mamdani模糊系统(scikit-fuzzy实现,梯形/三角形MF,质心解模糊)及高容量MLP(约221k参数)。实验环境为仅CPU的工作站(Intel Core i5-1335U, 16GB RAM, Python 3.10 + PyTorch 2.7.0 CPU版),随机种子固定为42确保可复现,模型可导出为TorchScript与ONNX格式。
研究结果
5.1. Global performance on the test set(测试集全局性能指标)
研究人员在留出测试集上计算得到准确率(Accuracy)0.8980[0.8947,0.9013]、精确率(Precision)0.8518[0.8467,0.8567]、召回率(Recall)0.9638[0.9608,0.9666]、宏平均F10.9043[0.9010,0.9076]、AUC-ROC 0.9717[0.9702,0.9733],AUC-PR约0.74。归一化混淆矩阵显示攻击类(标注为DDoS)真阳性率(True Positive Rate, TPR)为0.94,正常类真阴性率(True Negative Rate, TNR)为0.93。单样本CPU推理延迟中位数为0.57 ms,第99百分位(P99)<0.65 ms,分布紧凑无重尾。
5.2. Training dynamics and rule pruning(训练动态与规则剪枝)
训练过程中按预定轮次(Epoch 15、25及训练结束后)施加结构化规则剪枝,活跃规则数从初始211条逐步降至最终88条;训练损失持续下降,验证AUC与F1同步上升并趋于稳定,表明剪枝在降低模型复杂度的同时未明显损害判别力。
5.3. Comparison with reference models(与参照模型对比)
相较Mamdani模糊系统(F1=0.52,Accuracy=0.59,延迟1.9 ms),ANFIS在F1、准确率及推理速度上均显著占优;相较MLP参照模型(F1≈0.9989,参数量≈221k,模型文件≈863 kB),ANFIS以约10%的绝对指标折损换取千字节级模型体积、亚毫秒延迟及完全可追溯的模糊规则,更契合工业边缘网关的资源与审计要求。
5.4. Error analysis(错误分析)
测试集误报(False Positive)多集中于具异常大包长或双向最大包间隔的特征组合的正常流;漏报(False Negative)多见于低包数且短双向时间间隔的攻击流——提示六维特征对极低流量微突发DDoS表征力有限。整体假阳性率(False Positive Rate, FPR)=0.07,假阴性率(False Negative Rate, FNR)=0.06。
5.5. Model interpretability and fuzzy rule relevance(模型可解释性与模糊规则相关性)
88条规则呈长尾重要性分布,前14条规则贡献约60%累积增益,最关键规则(#32、#38)相对权重分别为4.3%和3.6%。按前件变量分组显示:Bidirectional_Max_Piat_Ms+Dst2src_Mean_Piat_Ms(时间节奏维度)贡献43%,Src2dst_Max_Ps+Bidirectional_Min_Ps(包体量维度)贡献31%,Dst2src_Packets+App_Cat_Code(方向及语义上下文维度)贡献26%。MF经训练从k-means初值自适应调整,可直观检视。
讨论与结论
研究人员指出该ANFIS模型在异构IIoT流量上具良好泛化性,PR与ROC曲线附95% Bootstrap置信带证实判别力稳定;六维紧凑输入与早停+结构化剪枝使全量训练可在数分钟内于普通CPU完成,推理延迟远低于工业网关典型响应预算(<2 ms),权值仅≈0.97 kB,序列化工件(ONNX 93 kB / TorchScript 103 kB)适合驻留于受限内存。与Mamdani模糊系统比,ANFIS保留规则透明性且显著提升检测力与速度;与大型MLP比,以可接受性能折损换取极小体积、亚毫秒延迟及完全可审计决策路径,符合IEC 62443-4-2对资源受限组件的可信要求。局限含当前数据对部分工业协议和加密流量代表性不足、主要聚焦DoS/DDoS类攻击、1 ms捕获粒度可能掩盖亚毫秒突发,需在ARM平台及更长时段进一步验证漂移抗性。
综上,研究人员提出并验证了适用于IIoT边缘部署的可解释ANFIS入侵检测系统,在保持规则级可追溯性与亚毫秒CPU推理的同时取得F1=0.9043与AUC-ROC=0.9717的检测性能,较Mamdani模糊系统大幅提升准确率与速度,较深层MLP以约10%指标代价获得数量级更小的模型尺寸与原生可解释性,为工业边缘网关提供了一种兼顾性能、效率与透明度的IDS可行方案。未来工作拟扩展多类攻击检测、引入增量学习、采用高精度探针(eBPF)提升时序分辨率、纳入OPC UA/PROFINET/MQTT with TLS评估加密工业协议鲁棒性,并在ARM Cortex-A53平台开展长期现场验证及开发动态规则约束与操作员可视化解释面板。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号