导航性能-弹性三难困境:BAHYA,一种面向预算感知的混合深度强化学习(DRL)方法用于计算连续体中的关键任务应用部署

《Future Generation Computer Systems》:Navigating the performance-resilience trilemma: BAHYA, a budget-aware hybrid DRL approach for the mission-critical application placement in computing continuum

【字体: 时间:2026年05月29日 来源:Future Generation Computer Systems 6.2

编辑推荐:

  摘要翻译 计算连续体中的应用部署必须满足现代服务日益复杂的需求。虽然该范式有效地整合了边缘(Edge)与云(Cloud)资源,但也引入了一个关键三难困境:同时优化低延迟、能源效率和高弹性(Resilience)。现有的先进策略通常优先考虑性能和效率,将弹性

  
摘要翻译
计算连续体中的应用部署必须满足现代服务日益复杂的需求。虽然该范式有效地整合了边缘(Edge)与云(Cloud)资源,但也引入了一个关键三难困境:同时优化低延迟、能源效率和高弹性(Resilience)。现有的先进策略通常优先考虑性能和效率,将弹性视为次要、静态约束,这对于关键任务应用而言是不够的。本文提出了BAHYA(Budget-Aware HYbrid drl Approach),一种通过混合深度强化学习(DRL)与启发式架构解决三难困境的新型部署方法。BAHYA设计的核心在于将应用的服务级别协议(SLA)错误预算视为可动态管理的资源。该机制使DRL智能体能够在相互竞争的目标之间进行战略性权衡。通过基于仿真的综合实验,研究人员证明BAHYA在高负载条件下在性能与可靠性方面显著优于最先进的基线方法。结果验证,通过战略性地消耗可控的错误预算部分,BAHYA在保持可预测、符合SLA的性能的同时实现了更优的弹性,为未来一代系统提供了更稳健的解决方案。
论文解读
研究背景与问题提出:计算连续体(Computing Continuum)通过整合边缘(Edge)、雾计算(Fog)与云(Cloud)计算,构建从网络边缘到核心的分层基础设施,旨在缓解集中式计算的传统局限性,包括高延迟、带宽受限和数据隐私问题。该架构能够支持延迟敏感、资源密集型及关键任务应用。然而,连续体的异构性与大规模部署带来了复杂的资源优化挑战。具体而言,部署策略需同时优化多个冲突目标以保证服务质量(QoS):最小化端到端延迟、降低资源及能耗消耗、并考虑服务器的有限容量。分布式系统的不可靠性进一步加剧了问题,例如电力故障、网络中断和主机崩溃可能消耗应用的错误预算(Error Budget),导致服务不可用、数据丢失及SLA违规。这构成了性能-弹性-能效三难困境:为提升弹性分布副本会增加延迟与能耗,而为节能而合并副本则降低弹性。现有研究多优先考虑性能与能效,将弹性视为次要或静态约束,无法满足关键任务应用对持续性和高可用性的需求,如自动驾驶、实时病患监控及智能电网控制场景。

研究方法与贡献:为解决该关键问题,研究人员提出BAHYA(Budget-Aware HYbrid drl Approach),一种预算感知(Budget-Aware)自适应部署策略,核心在于将应用的SLA错误预算视为动态资源。BAHYA通过混合深度强化学习(DRL)与启发式规则(Heuristic)相结合的架构实现安全优化,启发式机制保证即时SLA合规性,DRL智能体学习长期策略以最大化动态加权的目标。主要贡献包括:(1)提出兼顾延迟、弹性与能效的自适应部署策略,将SLA错误预算用于动态调节奖励函数,实现目标之间的战略性权衡;(2)设计混合DRL-启发式架构,确保安全探索的同时提升长期优化效果。

技术方法概述(≤250字):研究人员通过构建多层次计算连续体模拟环境,包括边缘节点、交换机及云服务器,采用EdgeSimPy v1.1.0离散事件模拟框架进行实验。应用BAHYA算法在仿真中部署副本,结合SLA错误预算的动态管理,DRL智能体在启发式规则保障下学习优化策略,实现延迟、弹性及能效的协调。实验基于城市网格化地图模型构建基础设施,覆盖17个基站、17个交换机和9台服务器。

研究结果:
- **学习动态验证**:通过仿真实验,DRL智能体有效学习策略,平衡延迟、能耗与弹性目标,实现SLA合规性。
- **基线算法比较**:与最先进基线方法相比,BAHYA在高负载条件下显著提升性能与弹性,表现出更稳定的副本分布策略。
- **性能评估**:在系统整体负载增加时,BAHYA通过战略性消耗错误预算,实现副本合理分布,增强故障容忍(Fault Tolerance)能力,同时保持延迟可控与SLA遵循。

讨论与结论:研究人员强调BAHYA的创新在于将延迟从单一约束转化为可管理的错误预算,以支持弹性优化。通过智能分配副本和动态管理SLA预算,BAHYA显著提升了关键任务应用的容错能力,减少服务中断风险,同时保证性能的可预测性与SLA遵守。这一策略提供了一种面向未来计算连续体的稳健应用部署方案,为关键任务系统在大规模、异构环境下的可靠运行提供实践指导。《Future Generation Computer Systems》发表的论文显示,BAHYA代表了性能-弹性-能效三难困境优化的前沿方法,为后续研究提供理论与实践基础。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号