基于控制屏障函数的安全关键非线性系统自学习鲁棒控制

《Neurocomputing》:Control barrier function-based self-learning robust control of safety-critical nonlinear systems

【字体: 时间:2026年05月26日 来源:Neurocomputing 6.5

编辑推荐:

  研究人员针对带有外部扰动的连续时间安全关键非线性系统,提出了一种基于自适应动态规划(Adaptive Dynamic Programming, ADP)的自学习鲁棒安全控制方法。首先,设计扰动观测器以获取精确的扰动信息。随后,通过将哈密顿-雅可比-贝尔曼方程(

  
研究人员针对带有外部扰动的连续时间安全关键非线性系统,提出了一种基于自适应动态规划(Adaptive Dynamic Programming, ADP)的自学习鲁棒安全控制方法。首先,设计扰动观测器以获取精确的扰动信息。随后,通过将哈密顿-雅可比-贝尔曼方程(Hamilton-Jacobi-Bellman, HJB)与鲁棒控制屏障函数(Robust Control Barrier Function, RCBF)相结合,构造约束优化问题,刻画系统在安全性与最优性之间的权衡关系。在此基础上,结合凸优化理论与ADP技术,构建拉格朗日函数并推导Karush-Kuhn-Tucker最优性条件,得到最优安全控制律。为实现在线近似求解,研究人员建立了执行者-评价者(Actor-Critic)框架,用于逼近最优安全控制策略。理论分析表明,该方法能够在外部扰动存在的情况下保证系统的稳定性与安全性。仿真实验采用单连杆机械臂与柔性机械臂验证所提方法的有效性。
该研究发表于《Neurocomputing》,聚焦于安全关键非线性系统(Safety-Critical Nonlinear Systems, SCNSs)在外部扰动下的自学习鲁棒安全控制问题。当前,控制屏障函数(Control Barrier Functions, CBFs)已广泛用于保障系统安全,但传统方法仅能保证安全约束,难以兼顾稳定性与最优性。同时,现有基于自适应动态规划(ADP)的安全控制方法多依赖系统变换处理矩形约束,且常假设扰动上界已知,限制了实际应用。为此,研究人员提出一种融合CBF、ADP与凸优化理论的新型自学习鲁棒安全控制(Self-Learning Robust Safe Control, SLRSC)方案。
关键技术方法包括:设计扰动观测器精确估计外部扰动;构建仅需Lipschitz连续性假设的鲁棒控制屏障函数(RCBF),放宽传统正定单调递减要求;将HJB方程与RCBF结合形成约束优化问题;利用Actor-Critic框架在线学习近似最优安全控制律。研究通过单连杆机械臂与柔性机械臂仿真验证方法有效性。
研究结果如下:
问题建模:建立带外部扰动的连续时间SCNS模型,定义安全集并引入RCBF描述安全约束。
控制策略设计:通过扰动观测器获取扰动信息,结合HJB与RCBF构造约束优化问题,推导KKT条件获得最优控制律,并采用神经网络实现Actor-Critic在线求解。
稳定性与安全分析:严格证明闭环系统在扰动存在下的稳定性与安全性,确保状态始终处于安全集内。
仿真验证:在单连杆机械臂与柔性机械臂平台上测试,结果表明所提方法在保证安全的同时实现了最优控制性能。
讨论与结论指出,该SLRSC方案突破了传统方法对矩形约束与扰动上界的依赖,显著提升了安全关键系统在复杂环境下的适应性与可靠性。研究为无人机、自动驾驶等高风险应用场景提供了理论支撑,对推动智能控制系统在安全与能效方面的协同发展具有重要意义。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号