线性-二次动态博弈作为递减视界变分不等式

《IEEE Transactions on Automatic Control》:Linear-Quadratic Dynamic Games as Receding-Horizon Variational Inequalities

【字体: 时间:2026年04月08日 来源:IEEE Transactions on Automatic Control 7

编辑推荐:

  动态博弈中约束优化问题的闭环纳什均衡求解与稳定性分析,通过扩展空间将开放闭环纳什均衡关联到线性二次调节器,推导显式成本函数表达式,证明有限时间约束博弈等价于非对称变分不等式问题,并设计递退闭环控制器实现渐近稳定。

  

摘要:

我们研究了具有线性动态和二次目标函数的动态博弈。我们发现,在扩展空间中,无约束的开环纳什均衡(NE)与线性-二次调节器是一致的,从而推导出了到达成本的显式表达式。将这种到达成本作为终端成本,我们证明了有限视界、受约束博弈的滚动时域解的渐近稳定性。此外,我们还表明该问题等价于一个非对称变分不等式,而这个不等式并不对应于任何纳什均衡问题。对于有约束的闭环纳什均衡,我们推导出了一个与无限视界解等价的滚动时域控制器,并确保了其渐近稳定性。

引言

我们考虑了一个受约束的离散时间线性-二次(LQ)动态博弈的调节问题,当代理人在优化自身目标的同时有兴趣达到并维持一个已知吸引子时,就会出现这个问题。动态博弈(更确切地说是它们的连续时间对应物——微分博弈)首次在开创性论文[1]中被研究。它们描述了一个由多个输入控制的离散时间动态系统,每个输入都由一个具有自身利益目标的决策者(或代理人)进行控制。应用领域包括机器人技术[2]、[3]、鲁棒控制[4]、物流规划[5]和能源市场[6]等。如果没有任何代理人能够通过单方面改变来改进某个输入策略,则称该策略为纳什均衡(NE)。有趣的是,根据问题的信息结构,动态博弈可能存在不同类型的纳什均衡。特别是,对于每个代理人来说,如果其轨迹是对其他代理人轨迹的最优响应,则称为开环纳什均衡(OL-NE);相反,闭环纳什均衡(CL-NE)是在给定当前状态和其他代理人的控制策略下的最优反馈策略。众所周知,线性无限视界的CL-NE策略与耦合的代数Riccati方程(AREs)的解有关;参见例如[7],命题6.3。最近,Monti等人[8]为类似的OL-NE特征提出了新的充分条件。在[9]中,无限视界的连续时间CL-NE问题被关联到寻找不变线性子空间的问题:这一观察推动了该领域的重要发展[10],以及基于几何方法的解决方案算法[11]。其他算法基于Lyapunov方程或Riccati方程的迭代求解,在[12]、[13]和[14]中有所介绍。最近的工作[15]和[16]研究了微分博弈的近似解,而[17]提供了一种分布式计算方法。关键的是,这些工作都没有考虑约束的包含,目前也不存在计算无限视界NE轨迹的成熟算法,只有[14]为离散时间CL-NE场景提供了事后局部收敛性保证。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号