AutoBoost-IoT：一种用于物联网网络入侵检测的混合模型 Mehdi Moucharraf, Mohammed Ridouani, Fatima Salahdine, Naima Kaabouch

《Future Internet》：AutoBoost-IoT: A Hybrid Model for Intrusion Detection in IoT Networks Mehdi Moucharraf, Mohammed Ridouani, Fatima Salahdine and Naima Kaabouch

【字体：大中小】 时间：2026年04月30日 来源：Future Internet 3.6

编辑推荐：

　　摘要：近年来，物联网（IoT）生态系统的快速增长显著增加了潜在威胁和攻击途径，因此需要高度准确且可扩展的入侵检测机制。本文提出了一种混合入侵检测系统，该系统结合了监督学习和无监督学习方法来检测IoT网络中存在的各种攻击。首先，采用基于随机森林的特征提取方法从高维网络流量数据中确定

　　摘要：近年来，物联网（IoT）生态系统的快速增长显著增加了潜在威胁和攻击途径，因此需要高度准确且可扩展的入侵检测机制。本文提出了一种混合入侵检测系统，该系统结合了监督学习和无监督学习方法来检测IoT网络中存在的各种攻击。首先，采用基于随机森林的特征提取方法从高维网络流量数据中确定最重要的特征。然后，使用深度自编码器（Deep AutoEncoder）模型将提取的特征压缩为潜在特征，并将其输入到多个分类器中，以将流量分类为不同的IoT攻击类别和正常流量类别。具体使用的分类器包括XGBoost、SVM、逻辑回归（Logistic Regression）、朴素贝叶斯（Naive Bayes）和多层感知器（Multilayer Perceptron）模型。通过多个IoT基准数据集（如N-BaIoT和CICIoT2023）来评估所提出的混合入侵检测系统的性能。实验结果表明，XGBoost分类器的性能优于其他分类器，在N-BaIoT和CICIoT2023数据集上的准确率分别为99.63%和98.94%。上述结果表明，所提出的架构在多种IoT环境中的泛化能力很强。从结果可以看出，将深度学习用于特征提取，并使用提升技术进行分类，可以开发出高效的入侵检测系统（IDS）。

1. 引言
随着IoT设备在医疗保健、智能家居、制造业和交通运输等不同行业的持续部署，我们相互连接和自动化任务的方式正在发生变化。由于复杂因素的影响，由于IoT技术的广泛使用，网络安全漏洞的机会也大大增加了[1]。一方面，大多数IoT设备的计算能力有限，且通常不遵循标准的安全协议，这使它们容易受到僵尸网络攻击（botnet attacks）、分布式拒绝服务攻击（DDoS attacks）和未经授权的访问尝试[2]。另一个问题是，传统的入侵检测系统（IDS）是为传统IT网络设计的，因此不适合高度动态和资源有限的IoT网络[3]。此外，在IoT网络中使用传统的机器学习（ML）建模技术需要花费大量时间手动工程化特征；然而，这无法准确描述通过整个IoT网络传输的大量流量中的复杂关系[4]。
目前，人们越来越关注开发结合无监督深度学习[5]和监督分类方法[6]的混合系统，以解决上述问题。与监督分类技术相比，自编码器在生成输入数据的更紧凑和抽象表示方面表现优异。然而，XGBoost（一种基于集成学习的分类器）在结构化网络上的表现始终优于其他分类器[7]。在这项工作中，提出了一种混合入侵检测框架，将基于自编码器的潜在特征提取与XGBoost相结合，用于IoT网络中的多类攻击检测[7]。本研究不是引入新的算法组件，而是探讨这种混合设计是否能够有效平衡检测性能[8]、对高维和潜在噪声数据的鲁棒性以及计算效率。自编码器用于获取网络流量的简洁潜在表示，然后将其作为输入提供给XGBoost分类器，以区分良性活动和恶意活动。
此外，本研究的目的不是开发一个新的独立算法，而是评估在IoT入侵检测特定背景下结合无监督表示学习与基于集成的分类方法的有效性。这种设计的动机是在涉及高维和不平衡IoT流量数据的场景中，实现检测准确性和计算效率之间的平衡。
为了分析所提出的混合模型的有效性，使用了N-BaIoT和CICIoT2023等不同的IoT基准数据集进行了实验。N-BaIoT和CICIoT2023数据集包含了IoT网络正常运行期间以及受到攻击时的实际网络流量。在N-BaIoT数据集中，有九个设备的流量日志，代表了包括Mirai和Gafgyt在内的多种形式的恶意软件攻击。相比之下，CICIoT2023数据集使用了大规模和复杂的IoT架构进行了各种类型的攻击。实验结果表明，所提出的混合模型在检测准确性和跨多个攻击类别及正常流量条件的泛化能力方面，达到了或超过了现有方法的性能。此外，深度无监督表示学习与强大的集成分类的结合提高了模型处理高维和潜在不平衡IoT数据的能力。
我们提出的方法利用了深度学习和集成学习之间的协同作用，这两种技术传统上通常是分开处理的。与仅依赖深度学习或集成系统的先前模型不同，我们的集成模型同时使用了深度学习系统和基于树的分类系统（如XGBoost）的规则化机制。因此，我们的方法能够设计出一个高度可扩展且性能优异的系统，能够在需要快速响应入侵的智能IoT环境中实时有效运行。

本文的主要贡献如下：
- 提出了一种轻量级的混合入侵检测框架，将基于无监督自编码器的特征提取与XGBoost相结合，用于IoT网络中的多类攻击检测。
- 研究了将潜在特征表示学习与基于集成的分类相结合的有效性，以应对高维和潜在噪声的IoT流量数据。
- 提供了全面的计算效率分析，包括推理延迟和内存占用，强调了该框架适用于实时IoT监控。
- 在包括N-BaIoT和CICIoT2023在内的多个IoT数据集上进行了广泛的实验，证明了所提出框架的鲁棒性和泛化能力。

本文的结构如下：第2节回顾了混合IDS方法的相关工作。第3节详细介绍了所提出的方法，包括预处理、特征提取和分类。第4节阐述并分析了实验结果。最后，第5节总结了本研究的主要发现，并探讨了进一步研究的方向。

2. 相关工作
随着安全威胁的数量增加到令人担忧的水平，使用机器学习（ML）、深度学习（DL）和类似技术来创建IoT网络的智能入侵检测系统（IDS）的研究越来越多[9]。过去，许多原始研究人员主要关注开发传统的机器学习分类器，如支持向量机（SVM）、决策树（Decision Trees）和随机森林（Random Forests），以识别基于IoT的流量中的异常[10,11]。一般来说，这些分类器易于理解和实现，但在高维特征空间或面对动态攻击环境时泛化能力较差。因此，随着IoT技术的进步和复杂性的增加，研究人员正朝着更快、更自动化的入侵检测系统开发和部署方法发展。
通过使用自编码器（一种深度学习模型[12]）来检测IoT安全中的设备特定异常，研究人员发现了改进传统机器学习方法的重大机会[13]。自编码器可以从高维输入数据中学习有意义的特征，且几乎不需要人工干预，使其特别适合IoT环境。通常，自编码器会在良性流量上训练，并模拟被监控设备的正常行为特征。任何偏离这种模式的都是对这些设备发起攻击的迹象，可以被自编码器检测到。例如，[14]的作者引入了N-BaIoT数据集，并使用深度自编码器以高精度检测针对IoT设备的攻击[14]。
[15]的作者提出了一种混合方法，结合了堆叠稀疏自编码器（SSAE）来提取深度特征和XGBoost分类器来检测入侵。他们创建该模型的主要目的是为了克服未知攻击检测的困难以及网络流量中类别不平衡的问题。实验结果表明，他们的模型在相同数据集上的准确率和效率都优于其他当前的入侵检测方法[15]。
在分类方面，XGBoost作为一种可扩展的集成学习技术受到了广泛关注，它具有内置的规则性特征，从而在结构化数据上具有更高的准确性[16]。这是由于XGBoost的鲁棒性及其在安全应用（如入侵检测、恶意软件分析和攻击预测）中的实用性。
除了XGBoost之外，[17]的作者评估了六种专为无线传感器网络（WSN）设计的算法，用于检测网络攻击；这些算法包括GBM、LightGBM、CatBoost、随机森林（Random Forest）、KNN和高斯朴素贝叶斯（Gaussian Na?ve Bayes）。使用WSN-DS数据集对检测准确性、检测概率、误报率、内存消耗和处理时间进行了评估。结果表明，提升算法（特别是LightGBM）具有最高的准确率和最低的误检率。由于这些因素，提升算法非常适合在资源受限的环境中使用，如WSN和IoT系统[17]。
[18]的作者提出了一个优化的混合IDS框架，该框架利用信息增益方法进行特征选择，并使用自编码器作为降维技术，同时集成了由XGBoost、Light-GBM和CatBoost分类器组成的分类器集成。使用包含超过100万条记录的CICIDS2018数据集进行评估；他们的模型在频繁攻击类型（如DDoS）上的准确率超过了99%，召回率至少为80%；然而，在较少见的攻击类型（如僵尸网络攻击或暴力攻击）上的性能显著较低[18]。研究进一步表明，混合架构能够提高可扩展性和模块化，从而增加了其作为实时入侵检测系统的适用性。此外，研究还指出了需要进一步研究的领域，以解决类别不平衡和提高罕见攻击类型检测的问题。
深度学习的最新进展催生了结合混合技术的HIDS（Hybrid Intrusion Detection Systems），这些技术利用深度学习进行特征提取，并使用监督机器学习进行算法训练。例如，[19]开发了一种新的混合模型，该模型使用自编码器生成潜在特征，并通过监督学习使用XGBoost算法识别异常，准确率为97.6%，F1分数为98.36%，用于识别Modbus TCP数据中的异常类型[19]。这表明混合模型可能适用于多种类型的连接设备。此外，[20]的作者开发了一个HIDS框架，其中使用仅从良性数据中学习到的低维良性流量特征表示作为多个ML和DL分类器的输入，以识别异常行为模式[20]。他们的发现进一步证实了使用基于自编码器的特征学习可以提高IoT环境中的检测准确性[20]。
[21]的作者提出了一种混合方法，使用堆叠稀疏自编码器减少深度特征，并使用LightGBM进行分类。他们的技术在减少特征集方面效率超过80%，在NSL-KDD和Bot-IoT数据集上的准确率超过99%[21]。这表明它适用于可扩展的IDS部署。这进一步支持了使用自编码器和提升技术的组合可以帮助当前的IDS获得高准确性和低资源利用率的观点。
同时，最近的研究越来越多地探索基于时空特征学习的深度学习架构用于IoT入侵检测。CNN、RNN、LSTM和基于Transformer的模型是构建机器学习模型的例子，这些模型可以学习变量之间的时间依赖性以及网络流量数据中特征的复杂交互。这些类型模型在流量模式显示顺序或时间依赖性时表现出强大的检测能力。然而，这些架构可能会产生较高的计算负载、较大的模型规模以及相对较长的训练和推理时间；因此，它们可能不适合在资源受限或实时的物联网（IoT）环境中使用。相比之下，XGBoost是一个集成模型的例子，其规模比许多其他模型架构要小得多，但在处理结构化表格数据时仍具有强大的性能。因此，这激发了进一步探索表示学习与高效集成分类器之间结合使用的兴趣。除了入侵检测解决方案外，文献还关注了预防性IoT安全方法，这些方法旨在在漏洞被利用之前检测到它们。在这方面，从设备到协议的不同层面分析了IoT设备的弱点[22]，特别关注认证阶段和通信过程。实际上，最近的研究已经检查了与重放攻击或认证滥用相关的问题，以评估IoT设备在面对恶意攻击时的韧性。所提出的方法需要对设备进行主动分析，以检测仅通过被动分析难以发现的潜在安全弱点[23]。虽然这些预防性解决方案可以补充入侵检测系统（IDS）在检测安全风险方面的能力，但当前的研究采用了一种数据驱动的检测策略来评估入侵威胁。

在以往工作的基础上，我们的工作通过开发一个适用于IoT环境的混合入侵检测系统，为这一研究方向做出了贡献。所提出的模型结合了自动编码器从高维且大部分未标记数据中提取无监督特征的能力，以及XGBoost在多类分类方面的优势。与许多将特征工程和分类视为独立步骤的现有方法不同，该框架利用深度表示学习将高维IoT流量数据转换为紧凑且信息丰富的潜在特征，随后用于准确分类。该模型在多个IoT数据集上进行了评估，包括N-BaIoT和CICIoT2023，并在准确区分各种攻击类型和良性流量方面表现出色。结果强调了所提出方法在应对IoT入侵检测中的重大挑战（特别是多类分类和跨不同攻击场景的泛化能力）方面的有效性。

为了进一步了解现有的研究现状，表1总结了IoT入侵和异常检测领域的代表性研究，突出了使用的数据集、采用的方法及其关键贡献。表1. 基于机器学习/深度学习的IoT环境中的入侵检测方法比较。

3. 方法论
图1中描述的结构是一个混合学习架构，旨在准确识别和检测IoT生态系统中的多种类型的入侵。这一过程从IoT数据集（包括N-BaIoT和CICIoT2023数据集）中获取原始流量开始，随后进行数据预处理阶段，去除重复和无关记录，并使用StandardScaler进行特征标准化，以确保所有特征在训练过程中贡献相同。为了确保评估的公平性和一致性，所有数据集都使用相同的预处理和特征提取流程。图1. 所提出框架的工作流程。

为了应对在网络行为的高级表示学习中经常伴随的维度灾难问题，我们采用了一个深度自动编码器来进行无监督特征提取。自动编码器的编码器组件将高维输入压缩成紧凑的潜在表示，解码器随后通过均方误差（MSE）最小化重建损失来重建原始输入[37]。这使得系统能够在忽略或最小化冗余或噪声的同时提取更多有信息量的特征。接下来，一个多类XGBoost分类器将使用这些编码后的潜在特征。如前所述，XGBoost是一个可扩展且正则化的梯度提升框架，能够学习区分良性流量和十种不同的IoT攻击类型。XGBoost的一个优点是它具有处理类别不平衡的能力以及学习复杂决策边界的能力，因此非常适合异构的IoT入侵数据。

模型的性能将通过使用标准分类评估指标（如准确性、精确度、召回率和F1分数）来进行评估。将整体评估分类器的准确性，并分别评估每个类别的准确性。此外，还将记录所有分类器类型的超参数调整，并包括所有指标以及分类器性能的可视化表示，并在多种超参数配置下进行评估。

3.1. 数据集描述
本研究使用了N-BaIoT数据集[14]，这是一个广泛认可的基准数据集，用于评估IoT环境中的入侵检测系统。该数据集是通过观察九个消费级IoT设备产生的，其中一些设备处于良性状态，而另一些设备处于恶意状态。恶意流量是通过使用两个广为人知的僵尸网络Mirai和Gafgyt创建的，包括十种不同类型的攻击，这些攻击包括TCP和UDP泛洪、扫描和组合攻击的多种变体。数据库中的每个条目都包含了从网络流中提取的115个统计特征，这些特征监测了诸如数据包长度、到达间隔时间和连接状态（主机和目的地）等指标。N-BaIoT数据集支持二分类（良性 vs. 恶意）和多类分类（十种攻击类型 + 一种良性类型），数据集的评估允许测量细粒度的入侵检测效果。

除了超过180万个标记实例外，N-BaIoT还提供了一个丰富多样性和体积庞大的语料库，适合作为训练和验证实际IoT攻击场景中机器学习模型的数据集。数据集的丰富性和体积不仅允许评估检测准确性，还允许评估机器学习模型在其他设备和攻击行为类别上的扩展性和泛化能力。如图2所示，数据集在各种攻击类型上的分布是不对称的，这反映了类别之间的重要不平衡。为了应对类别不平衡问题，我们的方法采用了两种过采样技术（如SMOTE）来保持训练中类别的均匀分布，从而提高泛化能力。图2. N-BaIoT数据集中的攻击类型分布。此外，为了验证所开发框架的泛化能力，还在CICIoT2023数据集上进行了实验分析[38]。具体来说，CICIoT2023数据集是一个最新的基准数据集，用于涉及实时IoT网络中模拟的攻击的IoT IDS任务，该数据集包含105个互连设备。数据集包括33种类型的攻击，分为七组，如DDoS攻击、DoS攻击、侦察攻击、基于Web的攻击、暴力攻击和Mirai攻击。值得注意的是，上述所有攻击都是由连接到同一网络的恶意IoT设备发起的。

在这项研究中，从初始数据集中选择了11种不同类型的攻击子集，以便采用更现实的方法，同时确保实验设置的计算效率。这样的决定确保了计算复杂性和数据变异性之间的适当平衡。与N-BaIoT数据集不同，后者包含了在更大规模网络环境中发生的更多种类的攻击，因此可以被认为是验证所提出解决方案质量的更合适基准。

3.2. 数据预处理
为了确保特征提取和分类模型在结果上具有更好的准确性和可靠性，从N-BaIoT和CICIoT2023数据集收集的原始数据经过了一些数据处理步骤，这些步骤旨在提高数据质量并避免建模过程中的任何偏见。为了进行公平比较，这两个数据集都使用了相同的数据处理流程。首先，找到并删除了数据集中的重复记录。在N-BaIoT数据集的情况下，删除这些重复记录后，数据集的大小从1,854,174条减少到了1,531,807条。使用StandardScaler标准化方法将所有特征中心化并缩放到单位方差，以使所有特征在训练过程中贡献相同。为了平衡数据集，由于类别不平衡的存在，使用了SMOTE技术（合成少数类过采样技术）[39]从训练集中的少数类生成额外的数据实例。下表2显示了在N-BaIoT数据集上应用SMOTE技术前后的类别分布。对于CICIoT2023数据集也使用了类似的技术。表2. 应用SMOTE技术前后的类别分布。为了直观展示SMOTE技术[39]的影响，图3显示了过采样前后的类别分布。原始数据集在类别之间存在显著不平衡，而应用SMOTE后这种不平衡得到了有效缓解，从而实现了更均匀的分布。图3. 应用SMOTE技术前后的类别分布可视化。为了检测特征之间的线性依赖性和可能的冗余性，对标准化后的特征集进行了皮尔逊相关性分析。在处理IoT流量特征的多维空间时，这一步骤非常重要，因为特征集内的多重共线性可能会对模型稳定性和分类性能产生不利影响。

图4展示了特征集的相关性矩阵，其中显示了高度正相关和负相关的特征。高度正相关表明数据集中存在一些冗余特征，尤其是在来自不同传感器的相似行为测量值的情况下。另一方面，负相关的特征对（蓝色）显示了流量特征之间的反向关联，从而有助于区分良性流量和恶意流量。图4. N-BaIoT数据集中的特征相关性热图。基于上述发现，本工作中使用自动编码器是合理的，因为自动编码器能够将非线性关系编码到模型的潜在空间中。通过去除冗余信息同时保留必要信息，自动编码器提高了下游分类器（如XGBoost）的性能。

3.3. 特征选择
为了提高输入数据的质量并避免初始特征空间中的冗余，我们在提取深度特征之前进行了特征选择预处理[40]。网络流量数据集通常具有高维度，因为使用了大量与不同时间间隔的网络活动相关的统计特征来描述IoT设备。尽管这种表示提供了有价值的信息，但它也可能包含一些冗余和不相关的元素，从而影响分类准确性。在当前研究中，使用了两个高维的IoT网络流量数据集，即N-BaIoT和CICIoT2023。如果应用数据集提供的所有特征，可能会由于噪声的存在和维度的增加而使算法的训练过程变得复杂。这个问题通过基于随机森林的方法来确定特征的重要性[41]得到了解决。使用随机森林的思想是基于选定的特征构建多个决策树来对数据样本进行分类。特征重要性是根据平均减少不纯度指标来衡量的。随机森林算法使用通过SMOTE方法平衡后的训练数据集进行应用，以避免在确定特征重要性时偏向多数类。确定了所有特征的重要性，并选择了20个最重要的特征。

选择20个特征是基于对重要性分布的实证分析。观察到一小部分排名较高的特征捕获了大部分的区分信息，同时显著降低了输入空间的维度。增加超过这个阈值的特征数量并没有带来明显的性能提升，而减少特征数量则会导致分类准确性的下降。图5展示了所选特征的重要性排名。这种选择减少了特征空间的维度，同时保留了网络流量的最相关特征。然后，这些选定的特征被用作自动编码器的输入，自动编码器进一步提取紧凑的潜在表示用于分类。图5. 随机森林识别的前20个重要特征。通过结合特征选择和深度特征提取，所提出的框架在降低噪声和冗余的同时，提高了计算效率和整体检测性能，适用于物联网（IoT）入侵检测任务。类似的特征选择过程也被应用于CICIoT2023数据集，证实了一组精选的顶级特征就足以保留不同IoT数据集中的最具区分性的信息。

3.4 特征提取
在完成特征选择后，将使用深度自编码器网络进行无监督学习以提取新特征。自编码器将使用特征选择阶段生成的简化特征集，通过选择最重要的20个特征来进行训练。这一点很重要，因为选定的特征子集将消除一些冗余特征，从而使自编码器任务更易于执行，同时不会增加计算复杂性。
IoT网络中的网络流量通常具有高维特征空间，并且特征之间的关系复杂；因此，有必要学习数据的压缩潜在表示，以降低计算复杂性，同时保留网络流量行为的相关特征。
在我们的研究中，将使用深度自编码器来压缩从N-BaIoT和CICIoT2023数据集中学习到的网络流量特征。自编码器是一种神经网络，它可以学习数据的压缩高效编码，以便重构输入数据；这种架构有助于学习非线性关系并降低数据特征的维度。
从自编码器获得的选定特征的潜在变量表示有助于提高特征表示的质量，从而提高后续分类器（如XGBoost）的性能。

自编码器架构：
自编码器由两个主要组成部分构成：
编码器：通过一系列全连接层将高维输入映射到一个简洁的潜在表示。在我们的架构中，编码器包括三个隐藏层，分别拥有64、32和16个神经元，并使用ReLU激活函数。这种设计使模型能够捕捉数据中的非线性依赖性和抽象模式。
解码器：使用对称结构（两个隐藏层，分别拥有32和64个神经元）从编码表示中重构原始输入，然后是一个与原始115维输入大小相匹配的线性输出层。这种对称性确保模型学习到的嵌入空间与重构目标保持一致。

训练细节：
自编码器进行无监督训练，以减少输入与其重构之间的均方误差（MSE）。采用Adam优化器，学习率为0.001，并通过5个训练周期的耐心机制实现早期停止，以防止过拟合。模型最多训练50个周期，批量大小为256。训练完成后，我们仅保留自编码器的编码器组件，将原始特征向量转换为潜在表示。处理后的低维嵌入保留了原始输入数据的基本特征，作为多类入侵检测任务中分类器的输入。这种结合深度无监督学习和监督分类器的过程，旨在利用两种方法的优势，为高维、不平衡的IoT数据集提供可扩展且准确的解决方案。

3.5 多类分类
下一步是评估几种不同的机器学习分类算法，以确定最适合多类入侵检测问题的方法。本文考虑的分类器包括：逻辑回归（LR）、朴素贝叶斯（NB）、支持向量机（SVM）、XGBoost和多层感知器（MLP）。
LR作为第一个基准分类器，因为它简单易懂。该算法使用L2正则化和lbfgs求解器在训练数据上进行训练。收敛的最大迭代次数设置为1000次。
NB基于特征独立性的假设进行实现。它通过高斯朴素贝叶斯算法实现，可以作为比较的基线模型。
SVM作为第二个基于非线性边界的分类器，能够捕捉编码特征之间的更复杂关系。
此外，还使用多层感知器（MLP）作为基于深度学习的分类器，在潜在特征空间上操作。MLP架构包括三个全连接层，分别拥有128、64和32个神经元，每个层后都跟随ReLU激活函数。层间应用了0.3和0.2的Dropout正则化，以减轻过拟合。输出层使用softmax激活函数进行多类分类。模型使用Adam优化器进行训练，损失函数为分类交叉熵，批量大小为256，训练周期最多为50个周期。训练完成后，我们仅保留自编码器的编码器组件，将原始特征向量转换为潜在表示。这些处理后的低维嵌入保留了原始输入数据的基本特征，作为深度学习过程后分类器的输入。这种结合深度无监督学习和监督分类器的过程，是利用两种方法的优势，为高维、不平衡的IoT数据集提供可扩展且准确的解决方案。

3.6 评估指标
为了正确有效地评估所提出的入侵检测模型的有效性，我们选择了一些适用于分类问题的评估参数，这些参数包括准确性、精确度、召回率和F1分数。这些评估参数将让我们大致了解入侵检测模型在正确分类不同类型入侵和正常流量方面的有效性。
准确性量化了所有类别中正确预测实例的总体比例，提供了分类成功的一般指示。
精确度表示准确检测到的攻击事件与预期为攻击的事件总数之间的比率，表明了分类器在减少误报方面的可靠性。
召回率衡量成功检测到的实际攻击事件的比例，突出了模型在捕捉威胁方面的完整性。
F1分数提供了一种平衡精确度和召回率的度量方法，同时在考虑精确度或召回率时特别有用。

3.7 提出模型的分析性论证
将自编码器与XGBoost分类器结合的理由在于无监督表示学习和监督梯度提升决策树的互补优势。

使用自编码器进行降维：高维IoT流量数据可能包含冗余或噪声特征，这些特征会妨碍传统分类器的性能。自编码器将输入空间压缩为低维的潜在表示，从而在保留重要结构的同时减少原始数据的维度并消除噪声。这是通过最小化重建损失函数来实现的，该函数量化了原始输入x与其重构之间的差异。
通过XGBoost进行类别区分：选择XGBoost是因为它能够建模非线性关系并高效处理多类分类。它构建了一个弱学习器的集成，优化以下目标函数：
其中l是损失函数（例如，用于多类分类的softmax），是控制过拟合的正则化项。
组件的互补性：首先通过自编码器从原始流量中提取出鲁棒、去噪的特征，从而减轻了分类器进行噪声过滤和分类的负担。下游的XGBoost模型因此受益于改进的特征可分性，从而提高了预测性能。
对类别不平衡的鲁棒性：自编码器学习与类别分布无关的全球表示，而XGBoost支持类别加权并通过定制的损失函数有效处理不平衡数据。这使得混合架构适用于正常流量占主导的入侵检测场景。
计算效率：在分类之前降低维度可以减少训练和推理期间的操作次数和内存消耗——这对于资源受限的IoT边缘环境中的部署至关重要。

4 结果与讨论
使用多个IoT数据集（包括N-BaIoT和CICIoT2023数据集）评估了所提出的入侵检测框架的有效性，这些数据集包含了在正常和恶意场景下由多个IoT设备生成的网络流量。此外，使用SMOTE方法解决了IoT数据集中常见的类别不平衡问题，确保在训练阶段所有攻击类别都得到了充分表示。然而，在训练阶段之前，数据集首先使用StandardScaler方法进行了标准化。
所有实验都在配备Intel Core i7处理器、16 GB RAM和64位操作系统的机器上进行。训练和评估过程中没有使用GPU加速。报告的计算指标（包括训练时间和推理延迟）取决于这种硬件配置，主要用于评估模型之间的相对比较。
在预处理阶段之后，采用了基于随机森林的方法从网络流量中提取的115个特征中选择最相关的特征。根据计算出的值，确定了最重要的20个特征，然后将其作为输入传递给深度自编码器，使用这些特征进行无监督特征提取。
为了确定入侵检测问题的最佳分类器，使用定义的特征表示方法测试了不同的机器学习模型，包括逻辑回归、朴素贝叶斯、SVM和XGBoost。值得一提的是，所有分类器都在相同的条件下进行评估，以便进行公平比较。
图6展示了所有分类器的比较性能指标，包括准确性、精确度和F1分数。如图6所示，XGBoost在所有评估指标上均优于其他分类器，表明其在有效建模IoT网络中的复杂模式方面的能力。表3总结了所有分类器的分类性能结果。从表3可以清楚地看出，XGBoost的准确性显著高于本研究中使用的其他分类器。XGBoost的准确性、精确度、召回率和F1分数分别为99.63%、99.64%、99.63%和99.63%，表明它在学习或拟合复杂模式方面非常有效。
多层感知器（MLP）分类器也展示了有竞争力的性能，准确率为91.97%，精确度为95.16%，召回率为91.97%，F1分数为89.62%。虽然MLP能够在潜在特征空间内建模非线性关系，但其性能仍低于XGBoost，表明基于树的集成方法在这种背景下更适合IoT流量的结构化表格表示。
另一方面，支持向量机分类器的准确率为89.74%，精确度为94.40%，召回率为89.74%，F1分数为87.22%。尽管SVM在本研究中获得了较高的精确度，但其整体性能低于XGBoost，因为SVM难以在IoT网络中建模复杂的多类模式。
逻辑回归模型的准确率为86.93%，精确度为83.48%，召回率为86.93%，F1分数为84.45%。作为线性分类器，逻辑回归在识别特征之间的非线性相关性方面能力有限，这解释了其相对于基于树的集成方法较低的性能。
朴素贝叶斯分类器在评估的模型中表现最差，准确率为71.02%，F1分数为66.87%。这个结果可以归因于朴素贝叶斯中固有的强独立性假设，在复杂的网络流量数据中，这种假设很少成立，因为多个特征以非线性方式相互作用。
进行了消融研究，通过仅使用选定的特征训练XGBoost分类器来确定自编码器的影响。在没有使用自编码器的情况下，XGBoost在准确性、精确度和F1分数方面的表现良好，分别为98.76%、98.75%和98.76%。然而，添加自编码器后，这些指标都提高到了99.63%。
这些改进表明，使用自编码器进行更好的特征表示，可以减少非线性和冗余，从而在一定程度上提高了模型的性能。这意味着尽管增益并不显著，但学习到的潜在特征仍然有助于提高模型的检测能力。根据研究结果，将自动编码器作为特征提取的一部分，并结合使用XGBoost作为分类器，被证明是物联网（IoT）系统中入侵检测的有效方法。自动编码器的使用能够获得简洁且相关的数据表示，然后由集成机器学习算法XGBoost进行分析。额外的消融测试表明，尽管单独使用XGBoost的效率很高，但与自动编码器结合使用可以提高入侵检测的效率。为了更深入地了解所提出模型的分类行为，对完整的混淆矩阵进行了分析。图7中的混淆矩阵展示了使用测试数据预测的所有类别之间的值，显示了混合入侵检测模型在预测攻击类型和良性流量方面的能力。混淆矩阵中的结果显示了该模型在准确分类方面的整体有效性；显然，大多数结果与混淆矩阵的对角线一致。这种混合入侵检测模型能够以近乎完美的准确性区分良性流量和恶意流量，这对于任何入侵检测系统来说都是一个关键属性。这种能力可以减轻警报疲劳，并在实时环境中提高系统的运行效率。

混淆矩阵还证明了该模型在检测多种攻击类型（如mirai_syn、gafgyt_udp和mirai_scan）方面的强大性能，这些攻击类型与IoT设备相关，且始终表现出高准确率和很小的重叠。这表明该模型能够检测到由于各种类型攻击导致的网络行为变化中的复杂模式。然而，在具有共同流量模式的攻击类别之间观察到了轻微的混淆，例如mirai_udp和mirai_udpplain攻击类别。这些攻击类别经常共享相同的数据包格式和时间传输模式，使得高级模型难以区分它们。这些攻击类别之间的少量误分类也为未来使用基于注意力的模型或特征增强来进一步细化这些攻击类别提供了途径。总体而言，从混淆矩阵中获得的结果证实了所提出的结论，即该模型具有以低误分类率进行细粒度多类判别的能力，这对于需要高准确性和类别可解释性的IoT入侵检测系统至关重要。

总体分类性能表明了所建议框架的有效性。然而，对所提出模型的类别级评估将提供有关其在区分不同类型攻击方面的有效性的额外见解。表4展示了使用XGBoost分类器对不同流量数据类别获得的类别级评估指标。从提供的结果来看，该框架几乎在所有流量类别上都能取得高性能。特别是“mirai_syn”和“mirai_udpplain”攻击类型的分类性能最佳，精确度、召回率和F1分数均为100%。这是因为这些攻击类型具有可以通过学习到的表示来捕捉的独特特征。此外，“gafgyt_udp”、“mirai_ack”和“mirai_scan”攻击类型的检测率也接近完美，F1分数超过99.9%。在检测良性流量方面也表现良好，精确度为100%，召回率为99.77%。这在入侵检测系统中非常重要，因为它有助于减少误报。少数类别的性能略低于其他类别。例如，gafgyt_combo的F1分数略低，为97.70%。这是因为其流量行为与其他Gafgyt攻击相似。总体而言，所提出的混合框架在准确检测良性流量以及不同类型的IoT攻击方面的性能得到了验证。研究结果证明了所提出方法在使用特征选择、基于自动编码器的特征提取和基于XGBoost的分类组合过程中，能够有效检测不同类型的攻击模式。

除了观察分类准确性之外，评估入侵检测模型的另一个重要指标是在资源受限环境（如IoT）中的计算效率。入侵检测模型不仅能够实时检测入侵，还对使用的内存量、进行预测所需的时间以及训练时间有显著影响。随着部署可能发生在边缘设备或处理能力有限的设备上，这四个指标变得越来越重要。表5显示了四种机器学习分类器（XGBoost、逻辑回归、朴素贝叶斯、SVM和MLP）及其计算开销的比较结果。结果包括多个指标，如模型大小（以字节计）、总处理时间（以秒计）和平均预测时间（以微秒计）。XGBoost模型的计算成本分布均匀，大小为1.68 MB，执行时间为20.08秒，每个测试样本的预测时间为0.0189毫秒。这使得XGBoost非常适合实时入侵检测，因为该算法能够在不牺牲预测性能的情况下实现非常高的精确度。决策树和提升方法的使用帮助XGBoost捕捉结构化IoT数据中的潜在关系。多层感知器（MLP）表现出中等的计算效率，模型大小为0.073 MB，处理时间为1.81秒，每个样本的平均预测延迟为0.0592毫秒。尽管MLP相对轻量且训练速度比更复杂的深度学习模型快，但其推理延迟高于XGBoost，且在本研究中的整体检测性能较低。逻辑回归在消耗计算机内存方面非常高效，因为其模型很小（0.002 MB），且推理延迟极低（0.0007毫秒）。另一方面，逻辑回归的训练时间很长（132.03秒），因此对于频繁变化的环境来说效率较低。朴素贝叶斯在所有考虑的算法中具有最低的计算复杂性，模型大小为0.0036 MB，处理时间短（0.13秒），预测延迟相对较低（0.00665毫秒）。如上所述，朴素贝叶斯适用于资源受限的环境，但在检测方面表现不佳。SVM具有最高的计算开销，模型大小为21.15 MB，处理时间长（416.05秒），每个样本的预测延迟非常高（11.793毫秒）。这主要是由于建模非线性决策边界所需的基于内核的计算。因此，SVM不适合实时入侵检测，因为在IoT环境中低延迟至关重要。

为了进一步评估所提出方法的泛化能力，使用了CICIoT2023数据集进行了测试。值得一提的是，该数据集代表了比之前使用的N-BaIoT数据集更多样化和更复杂的攻击集，因此这个测试案例提供了关于创建模型鲁棒性的可靠结果。分析显示，所提出的AE + XGBoost分类器的准确率达到了98.94%。此外，还实现了高精确度、召回率和F1分数。如下所示，该模型在应用于具有不同特征的其他数据集时仍保持高效。值得注意的是，在类别级测试中，所有类别的F1分数都超过了0.90。由于某些攻击之间的复杂性和相似性，性能可能会有一些变化。总体而言，这些发现表明所提出框架的鲁棒性和高泛化潜力。要了解所提出的入侵检测模型的分类过程细节，需要分析其混淆矩阵。图7中的混淆矩阵展示了测试数据集上所有预测的类别间值，并揭示了攻击检测的效率。为了评估所提出的混合模型是否比在N-BaIoT数据集上评估的现有最先进方法更有效，我们使用相同的数据集与其他类似方法进行了比较。表6展示了从先前研究中获得的性能指标（BiLSTM-CNN [42]、FL-CNN [43]、AE + RF [44] 和 DNN [45]），结果表明，结合了自动编码器和XGBoost的模型在用于评估它们的每个指标上都超过了所有竞争对手，显示出在分类准确性、精确度、召回率和F1分数方面的优越性能。此外，这一比较进一步支持了我们的方法在IoT网络环境中成功抵御不同类型攻击的能力，并能在多种攻击类型之间良好泛化。

对于实际的IoT入侵检测来说，考虑所提出模型可以部署的位置和方式非常重要。由于许多IoT终端设备的计算资源有限，AutoBoost-IoT框架并不适合直接在单个传感器或嵌入式设备上运行。相反，它更适合部署在IoT网关、边缘服务器或云辅助监控层，这些地方有足够的计算资源。在部署过程中，IoT设备创建的数据将首先在边缘节点或网关节点收集。提取的数据将使用预训练的自动编码器进行分析，以创建用于通过XGBoost算法进行分类的潜在表示。为了确保未来的持续性能，应包括性能监控技术，以测量检测精确度、误报和分类结果等参数。随着网络行为的变化（称为概念漂移），算法的性能可能会受到影响。因此，必须定期使用新数据重新训练模型。训练阶段可以使用高级计算资源离线执行。一旦训练完成，新模型可以上传到监控节点。总体而言，这种部署策略允许所提出的框架在现实世界的IoT环境中平衡检测性能、计算效率和实际可行性。

在这项研究中，通过结合基于自动编码器的无监督特征学习和XGBoost的多类分类，开发了一个用于IoT网络的混合入侵检测框架。自动编码器能够将高维网络流量转换为紧凑的潜在表示，同时保持基本的行为特征，从而减少输入维度。这些潜在特征随后被XGBoost分类器用来有效区分良性流量和多种攻击类型。使用N-BaIoT和CICIoT2023等多个IoT数据集分析了所提出框架的有效性。结果显示，在N-BaIoT数据集上的准确率达到了99.63%，在CICIoT2023数据集上的准确率为98.94%。此外，还观察到了良好的精确度、召回率和F1分数，表明了出色的结果。这一事实突显了所提出模型对不同IoT设备的可靠性和泛化能力。推理延迟分析和内存开销的测量证明了该模型在资源有限的情况下适用于实时IoT威胁检测的低重量和适用性。此外，从效率的角度来看，使用所提出的混合方法是合理的，因为它与计算成本较高的复杂神经网络架构相比表现更好。未来，使用XAI方法开发所提出的模型、应用在线学习算法并在真实世界的分布式环境中测试该模型可能是有益的。

热点排行