《Internet of Things》:Dual Convolutional Neural Networks deep learning for proactive caching to enhance the performance of fog/edge computing networks
编辑推荐:
Bahareh Shafaie|Marjan Kuchaki Rafsanjani|Brij B. Gupta伊朗卡兹温伊斯兰自由大学计算机与信息技术工程学院卡兹温分校摘要物联网(IoT)上设备的快速增长导致移动数据流量显著增加,从而在包括医疗保健和交通在内的各种应用中引发了网络
Bahareh Shafaie|Marjan Kuchaki Rafsanjani|Brij B. Gupta
伊朗卡兹温伊斯兰自由大学计算机与信息技术工程学院卡兹温分校
摘要
物联网(IoT)上设备的快速增长导致移动数据流量显著增加,从而在包括医疗保健和交通在内的各种应用中引发了网络拥堵、延迟和成本增加等重大挑战。雾计算通过提供雾节点(FNs)在更接近用户的地方处理请求,提供了一种分散式的解决方案,这减少了延迟并优化了带宽利用率。在这些雾节点中实施缓存策略进一步改善了响应时间,特别是对于实时应用而言。鉴于电影文件对雾计算网络前端负载的显著贡献,我们专注于使用用户请求的电影的实时数据集。然而,电影请求数据集的不平衡可能会对机器学习(ML)预测产生负面影响。为了解决这个问题,我们提出了一个两阶段模型,该模型采用卷积神经网络(CNN)来提高电影流行度预测的准确性,即双重卷积神经网络(DCNN)。我们使用MovieLens的真实世界数据集评估了我们的方法性能,并使用PyTorch框架进行了模拟。与称为基于深度学习的内容缓存(DLCC)的基线方法相比,这种方法将缓存命中率(CHR)提高了41.5%以上,平均延迟减少了58.97%,成本降低了59.1%,并且具有可接受的可扩展性。此外,与其他技术相比,它在CHR延迟和成本方面表现更好。因此,我们的主动策略提高了雾计算环境中的整体性能并增加了用户满意度。
引言
过去十年中,物联网设备的迅速扩展以及它们生成的大量数据导致移动数据流量急剧增加。这种激增导致了严重的网络拥堵和延迟问题,特别影响了用户日常生活以及农业、医疗保健、教育、交通、现代经济、可再生能源、智能家居和环境监测等行业。因此,需要新的管理解决方案来应对日益增长的流量负载,这成为需要立即关注的最重要挑战之一。一种解决方案是雾计算,它在分散式环境中利用服务器、路由器、交换机、网关、雾接入点(F-AP)和用户设备(UEs)等雾节点。这种方法在更接近用户的地方提供有限的计算和存储能力。根据这些雾节点的资源,它们响应用户请求;如果无法满足请求,则可以将请求转发到云端进行处理。这种配置减少了延迟和成本,优化了带宽使用,改善了网络流量管理,减少了重复流量,并促进了能源效率、安全性和隐私[1]、[2]、[3]、[4]、[5]、[6]、[7]。为了实现这些目标,缓存是一种有效的解决方案,它使雾节点能够在有限的存储空间中存储特定请求,从而更快地响应用户请求。这种方法对于实时应用(如医疗保健、多媒体、智慧城市、视频监控、增强现实、视频流媒体和游戏)特别有益,在这些应用中延迟最为明显。主动缓存是一种有效的解决方案,通过准确预测最受欢迎的内容并将其存储在雾节点中,从而减少发送到云数据中心的流量。这种方法提高了用户满意度,因为雾节点位于更接近最终用户的位置,从而实现了更快的响应时间。因此,许多研究人员正在关注主动缓存[8]、[9]、[10]、[11]、[12]、[13]。
研究人员经常使用真实世界的数据集来评估他们的方法;然而,许多人忽视了每部电影请求数量的不平衡,这对机器学习和深度学习技术的学习过程产生了负面影响,导致电影流行度预测不准确。其中一个数据集是MovieLens[14],它向全球研究人员开放,并常用于评估各种方法的性能。为了解决这个问题并提高电影流行度预测的准确性,同时提高缓存命中率(CHR)并减少MovieLens数据集中的延迟和成本,我们提出了一种新模型,该模型首先根据电影的请求模式对电影进行分类,然后采用可以并行运行的两阶段CNN方法。第一阶段预测所有电影的类别标签,特别关注类别零。第二阶段应用于仅包含被分类为1、2和3的电影的数据集,最后将它们结合起来。我们使用这个真实世界的数据集评估了DCNN的性能。综合评估的结果表明,与传统的政策和我们的基线方法DLCC相比,我们的方法在CHR、延迟和成本方面取得了显著改进。我们在本文中的贡献如下。
•使用CNN学习接收最多请求的电影的类别,然后使用该模型预测未来电影的类别。
•使用另一个CNN专注于学习请求最少的电影的类别标签,并使用该模型进行未来的类别预测。
•结合两个模型的预测以提高未来类别标签预测的准确性,用于缓存受欢迎的内容。
表1显示了本文中使用的所有缩写。
本文的结构如下。第2节讨论与我们主题最相关的工作。第3节介绍系统模型,第4节介绍DCNN(提出的方法)。第5节讨论模拟结果。第6节进行简要讨论,最后一节提出我们的结论。
章节片段
相关工作
已经使用各种技术在雾计算环境中进行了广泛的缓存研究,包括启发式方法[15]、博弈论(GT)[16]、排队论[17]、拍卖论[18]以及机器学习(ML)方法,如神经网络(NN)[19]、[20]、深度学习(DL)[21]、[22]、[23]、[24]、[25]、[26]、[27]、[28]、联邦学习(FL)[29]、[30]、[31]、[32]、[33]、[34]、[35]、强化学习(RL)[36]、[37]、[38]、[39]、[40]、迁移学习
系统模型
我们考虑了M个具有相同存储容量的雾节点(FNs),它们通过互联网连接到云服务器。此外,有N个用户设备通过有线/无线链接向FNs发送请求。我们将用户集合表示为U={1,2..., N},将FN集合表示为F={1,2,3...M}。所有训练阶段都在云服务器上进行,只有结果被发送到FNs以在其存储中缓存最受欢迎的内容。任何网络上的文件传输
提出的方法(DCNN)
本文的目的是预测用户未来请求数据内容的概率。我们应该提到,准备数据集的预处理步骤与[44]中概述的步骤相同。首先,在完成预处理阶段(包括数据清洗、主成分分析(PCA)、K均值聚类和形状转换)后,我们获得了带有标签的新数据集。我们将其命名为MovieLens2。我们应用K均值聚类对电影进行聚类
模拟结果
在本节中,我们使用了一个具有以下规格的系统进行模拟:第12代Intel(R)Core(TM)i7-12650H处理器,运行频率为2.30 GHz,配备16.0 GB RAM。我们使用Python 3.9和MovieLens数据集[14]进行了模拟,以评估DCNN的有效性。为了评估DCNN,我们将模拟结果与DLCC方法[44]、随机选择和先进先出(FIFO)[52]、[53]以及最小
讨论
在DLCC模型中,即使FN有足够的能力,也不缓存最不受欢迎类别的电影。此外,由于MovieLens数据集的不平衡性质,一些属于1、2或3类别的电影被错误地归类为类别零,导致FN错过了缓存的机会。DCNN整合了两个模型,其中一个专门用于预测1、2和3类别电影的类别标签。这种方法确保这些电影永远不会
结论
在本文中,我们提出了一种新颖的方法(DCNN),它结合了DLCC模型和额外的CNN模型来预测电影流行度。这种策略使得位于更接近用户的FN能够主动缓存最受欢迎的电影,从而实现更快的响应时间和更低的延迟,最终提高了用户满意度,并具有适当的可扩展性。此外,通过在这些FN中有效缓存更多文件,我们的方法减少了带宽使用和能源
CRediT作者贡献声明
Bahareh Shafaie:撰写——原始草稿,验证,调查。Marjan Kuchaki Rafsanjani:验证,方法论,形式分析。Brij B. Gupta:撰写——审阅与编辑,监督,概念化。
利益冲突声明
作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。