基于控制屏障函数的安全关键非线性系统自学习鲁棒控制

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Neurocomputing》：Control barrier function-based self-learning robust control of safety-critical nonlinear systems

【字体：大中小】 时间：2026年05月26日 来源：Neurocomputing 6.5

编辑推荐：

　　研究人员针对带有外部扰动的连续时间安全关键非线性系统，提出了一种基于自适应动态规划（Adaptive Dynamic Programming, ADP）的自学习鲁棒安全控制方法。首先，设计扰动观测器以获取精确的扰动信息。随后，通过将哈密顿-雅可比-贝尔曼方程（

研究人员针对带有外部扰动的连续时间安全关键非线性系统，提出了一种基于自适应动态规划（Adaptive Dynamic Programming, ADP）的自学习鲁棒安全控制方法。首先，设计扰动观测器以获取精确的扰动信息。随后，通过将哈密顿-雅可比-贝尔曼方程（Hamilton-Jacobi-Bellman, HJB）与鲁棒控制屏障函数（Robust Control Barrier Function, RCBF）相结合，构造约束优化问题，刻画系统在安全性与最优性之间的权衡关系。在此基础上，结合凸优化理论与ADP技术，构建拉格朗日函数并推导Karush-Kuhn-Tucker最优性条件，得到最优安全控制律。为实现在线近似求解，研究人员建立了执行者-评价者（Actor-Critic）框架，用于逼近最优安全控制策略。理论分析表明，该方法能够在外部扰动存在的情况下保证系统的稳定性与安全性。仿真实验采用单连杆机械臂与柔性机械臂验证所提方法的有效性。

该研究发表于《Neurocomputing》，聚焦于安全关键非线性系统（Safety-Critical Nonlinear Systems, SCNSs）在外部扰动下的自学习鲁棒安全控制问题。当前，控制屏障函数（Control Barrier Functions, CBFs）已广泛用于保障系统安全，但传统方法仅能保证安全约束，难以兼顾稳定性与最优性。同时，现有基于自适应动态规划（ADP）的安全控制方法多依赖系统变换处理矩形约束，且常假设扰动上界已知，限制了实际应用。为此，研究人员提出一种融合CBF、ADP与凸优化理论的新型自学习鲁棒安全控制（Self-Learning Robust Safe Control, SLRSC）方案。

关键技术方法包括：设计扰动观测器精确估计外部扰动；构建仅需Lipschitz连续性假设的鲁棒控制屏障函数（RCBF），放宽传统正定单调递减要求；将HJB方程与RCBF结合形成约束优化问题；利用Actor-Critic框架在线学习近似最优安全控制律。研究通过单连杆机械臂与柔性机械臂仿真验证方法有效性。

研究结果如下：

问题建模：建立带外部扰动的连续时间SCNS模型，定义安全集并引入RCBF描述安全约束。

控制策略设计：通过扰动观测器获取扰动信息，结合HJB与RCBF构造约束优化问题，推导KKT条件获得最优控制律，并采用神经网络实现Actor-Critic在线求解。

稳定性与安全分析：严格证明闭环系统在扰动存在下的稳定性与安全性，确保状态始终处于安全集内。

仿真验证：在单连杆机械臂与柔性机械臂平台上测试，结果表明所提方法在保证安全的同时实现了最优控制性能。

讨论与结论指出，该SLRSC方案突破了传统方法对矩形约束与扰动上界的依赖，显著提升了安全关键系统在复杂环境下的适应性与可靠性。研究为无人机、自动驾驶等高风险应用场景提供了理论支撑，对推动智能控制系统在安全与能效方面的协同发展具有重要意义。

联系信箱：

粤ICP备09063491号

热点排行