在需求和供应不确定性下,为智能边缘服务实现稳健的资源分配

《RELIABILITY ENGINEERING & SYSTEM SAFETY》:Robust resource allocation for intelligent edge services under demand and supply uncertainties

【字体: 时间:2026年04月24日 来源:RELIABILITY ENGINEERING & SYSTEM SAFETY 11

编辑推荐:

  云边协同架构通过整合边缘节点的低延迟与云端计算能力,有效支持AI服务的高效部署,但面临需求波动和节点故障的双重不确定性。本文提出两阶段鲁棒优化框架,首阶段决策云边节点布局,次阶段动态调整多周期任务接收与卸载策略,结合样本路径随机化算法建模节点可用性,并采用嵌套列生成约束法高效求解非线性混合整数规划,实证任务完成率达92.9%以上。

  
白哲|李金|沈华晓
西安交通大学管理学院,中国陕西省西安市710049

摘要

云边协作是一种将边缘节点的低延迟与中心云的计算能力相结合的架构,对于推进对延迟敏感的人工智能(AI)服务至关重要。然而,这种模式带来了复杂的资源分配问题,涉及战略基础设施部署和多期运营任务调度。服务提供商必须应对双重不确定性:用户需求的波动以及由于随机故障导致的边缘节点的可用性不确定性。本文通过提出一个两阶段鲁棒优化框架来解决这一挑战。我们将战略节点选择作为第一阶段决策,而多期服务接收和任务卸载则构成第二阶段的适应性行动。为了捕捉供应端的不确定性,我们开发了一种定制的样本路径随机化算法来估计节点的瞬时可用性,并将其整合到鲁棒模型中。需求波动通过基于预算的不确定性集来表征。最终的多层混合整数非线性规划问题可以通过嵌套的列生成和约束生成算法得到有效解决。在我们的方法在真实世界需求数据上的验证表明,任务完成率超过了92.9%,证明了其在设计可靠且成本高效的人工智能服务系统方面的有效性。

引言

人工智能(AI)的迅速发展推动了边缘计算架构的采用,以满足智能应用的实时响应需求。通过将计算能力嵌入网络边缘,更接近最终用户,这一模式有望实现显著增长;预计到2032年,全球边缘AI市场的规模将从2022年的152亿美元激增至1436亿美元[1]。行业分析预测,到2027年,绝大多数企业将依赖云提供商提供的边缘服务来满足严格的性能和数据合规要求[2]。然而,一个根本性的挑战是:边缘节点本身资源有限,限制了它们高效处理计算密集型AI模型的能力。
为了解决这一挑战,云-边协作模型应运而生,特别是对于基于大型语言模型(LLMs)的服务[3]。这种混合架构将边缘节点的低延迟访问与中心云的强大计算能力相结合。图1展示了这一过程,用户查询旅行计划时,首先由边缘节点处理,该节点利用其本地存储的静态知识(例如地理信息)快速响应。对于需要动态信息(例如实时天气数据或酒店可用性)的复杂子任务,工作负载会被卸载到中心云。在那里,大规模模型进行密集推理,访问外部数据,并整合最终结果[4]。
为了有效协调这一工作流程,服务提供商必须做出两个关键的操作决策。首先是服务接收,即选择最佳的边缘节点作为实时AI推理任务的接收节点。这一决策必须仔细平衡传输延迟、节点的可用计算能力及其当前运行状态等因素。接下来是任务卸载,决定是否以及从接收节点向中心云传输多少工作负载。这主要是为了确保整个任务在严格的延迟和计算约束内完成,即使本地节点的资源不足。
多期任务响应的做法进一步加剧了运营挑战,这种策略越来越多地被用来提升用户体验。如图2的操作时间线所示,单个用户请求不是作为一个整体任务来处理的,而是分阶段在不同时间段内执行。这种方法有几个优势:首先,计算量较小的子任务允许在边缘和云之间更灵活和细致地分配资源[5];其次,周期性处理有助于平衡系统负载,减少延迟峰值[6];最后,对于复杂查询,这种方法为用户提供有价值的实时反馈和中间结果,显著提高了交互质量[7]、[8]。因此,一个有效的分配模型不仅需要决定在哪里处理任务,还需要决定如何在多个时间段内调度其组成部分。
上述运营复杂性处于更广泛的战略背景之下。如图2所示,整个决策过程是分层的。在任何操作调度之前,服务提供商必须解决一个关键的长期战略决策:边缘节点的初始选择和放置。这一资本密集型选择必须在对未来存在重大不确定性的情况下做出,直接影响系统的运营效率和韧性。我们确定了必须管理的两个主要不确定性来源。
需求端不确定性。AI服务(特别是LLMs)的交付取决于两个关键因素:管理资源需求的固有波动性和严格遵守响应时间要求[9]。首先,AI技术的广泛采用可能导致不可预测的需求激增,例如来自自动驾驶车辆的突然数据爆发或LLM训练请求的激增,使得准确预测变得困难[10]、[11]。因此,有效的资源分配策略必须结合多期调度,并对这些波动保持鲁棒性,以防止服务退化或失败。
供应端不确定性。尽管边缘节点提高了响应能力,但由于资源异质性和边缘环境通常缺乏备份策略,它们的可靠性往往低于传统的集中式数据中心[12]。这些节点更容易受到其组成虚拟机(VMs)故障的影响,随后的修复过程会导致资源可用性的短暂中断。节点可用性的这种动态和不可预测性对一致的服务交付构成了重大挑战,并使资源规划变得复杂[13]。
分层决策(战略和运营)与双重不确定性(需求和供应)的结合产生了一个高度复杂的优化问题。这个问题的特点是其显著的组合结构以及建模异构、动态不确定性的挑战,因此需要一个先进且集成的解决方案框架。
本文开发了一个全面的框架来应对上述挑战,旨在为云-边AI服务中的资源分配提供实用且鲁棒的解决方案。本文的主要贡献有三个方面:
  • 集成决策框架:我们提出了一个两阶段自适应鲁棒优化模型,统一了战略和运营决策。第一阶段解决当前边缘节点选择的决策,第二阶段确定多期任务接收和卸载的自适应策略。据我们所知,这是云-边背景下首次联合优化多层决策、多期调度和多种网络延迟的研究。
  • 全面的不确定性管理:我们开发了一种方法来同时管理需求和供应不确定性。对于需求端的波动性,我们采用了基于预算的不确定性集。对于供应端的风险,我们引入了一种定制的样本路径随机化(SPR)算法来模拟异构边缘节点的故障和修复动态。这种基于模拟的方法提供了节点瞬时可用性的现实估计,然后将其正式整合到优化模型中,以捕捉关键的运营风险来源。
  • 高效的解决方案方法:所提出的模型被构建为一个多层混合整数非线性程序(MINLP),这在计算上具有挑战性。我们设计了一种高效的嵌套列生成和约束生成(C&CG)算法来最优地解决这个问题。该算法有效地分解了问题,并通过精确的线性化技术解决了内在的非线性问题,使得该框架在实际规模实例上具有可计算性。
这些贡献推进了云-边系统鲁棒资源调度的理论,并为服务提供商提供了有效的决策支持工具,以应对未来需求和资源可用性的复杂情况。
论文结构。第2节回顾了相关文献并指出了研究空白。第3节正式化了建模框架。第4节描述了我们的解决方案方法,包括SPR算法和嵌套的C&CG方法。第5节进行了计算实验并进行了性能分析。第6节总结了论文并提出了未来的研究方向。

节选

文献综述

本研究位于三个关键领域的交叉点:云-边系统中的资源分配、这些服务中的不确定性建模以及在不确定性下的决策优化方法。我们回顾了这些领域的文献,以准确定位我们的贡献并突出现有的研究空白。

建模框架

本节为资源分配问题开发了数学框架。我们首先提供了问题设置的全面描述及其关键特征。然后,我们构建了一个两阶段鲁棒优化模型,捕捉了战略和运营决策的分层性质。最后,我们详细介绍了运营阶段的具体模型以及需求和供应不确定性的表征。

解决方案方法

本节详细介绍了为解决所提出的两阶段鲁棒优化模型而开发的全面解决方案方法。我们面临三个主要挑战:(1)生成节点瞬时可用性的可行表示;(2)将多层非线性优化问题求解到最优;(3)确保整个算法框架的有效实施。我们依次解决这些挑战。首先,我们提出了一种定制的模拟算法

计算研究

为了评估我们提出的模型和解决方案方法的性能和实际适用性,我们基于中国一家领先的云-边服务提供商的案例研究进行了一系列计算实验。该研究旨在回答几个关键问题:我们的算法是否可靠地收敛?最优分配策略的结构是什么?这些策略对现实世界的不确定性有多鲁棒?以及可以从中得出哪些管理见解

结论

本文为云-边AI服务中的资源分配开发了一个全面的框架,解决了长期战略节点部署和多期运营调度的耦合挑战。我们的方法应对了这些系统中固有的双重不确定性——波动的任务需求和随机的节点可用性。我们提出了一个两阶段鲁棒优化模型,该模型独特地结合了使用样本路径随机化的基于模拟的方法来进行表征

CRediT作者贡献声明

白哲:撰写——原始草稿、方法论、正式分析、数据整理。李金:撰写——审阅与编辑、监督、调查、资金获取、概念化。沈华晓:撰写——审阅与编辑、方法论、资金获取、正式分析、概念化。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

致谢

李金感谢国家自然科学基金 [资助编号 72372131]的支持。沈华晓感谢国家自然科学基金 [资助编号 72371255]和广东省基础与应用基础研究基金 [资助编号 2026B1515020018]的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号