
-
生物通官微
陪你抓住生命科技
跳动的脉搏
线性-二次动态博弈作为递减视界变分不等式
《IEEE Transactions on Automatic Control》:Linear-Quadratic Dynamic Games as Receding-Horizon Variational Inequalities
【字体: 大 中 小 】 时间:2026年04月08日 来源:IEEE Transactions on Automatic Control 7
编辑推荐:
动态博弈中约束优化问题的闭环纳什均衡求解与稳定性分析,通过扩展空间将开放闭环纳什均衡关联到线性二次调节器,推导显式成本函数表达式,证明有限时间约束博弈等价于非对称变分不等式问题,并设计递退闭环控制器实现渐近稳定。
我们考虑了一个受约束的离散时间线性-二次(LQ)动态博弈的调节问题,当代理人在优化自身目标的同时有兴趣达到并维持一个已知吸引子时,就会出现这个问题。动态博弈(更确切地说是它们的连续时间对应物——微分博弈)首次在开创性论文[1]中被研究。它们描述了一个由多个输入控制的离散时间动态系统,每个输入都由一个具有自身利益目标的决策者(或代理人)进行控制。应用领域包括机器人技术[2]、[3]、鲁棒控制[4]、物流规划[5]和能源市场[6]等。如果没有任何代理人能够通过单方面改变来改进某个输入策略,则称该策略为纳什均衡(NE)。有趣的是,根据问题的信息结构,动态博弈可能存在不同类型的纳什均衡。特别是,对于每个代理人来说,如果其轨迹是对其他代理人轨迹的最优响应,则称为开环纳什均衡(OL-NE);相反,闭环纳什均衡(CL-NE)是在给定当前状态和其他代理人的控制策略下的最优反馈策略。众所周知,线性无限视界的CL-NE策略与耦合的代数Riccati方程(AREs)的解有关;参见例如[7],命题6.3。最近,Monti等人[8]为类似的OL-NE特征提出了新的充分条件。在[9]中,无限视界的连续时间CL-NE问题被关联到寻找不变线性子空间的问题:这一观察推动了该领域的重要发展[10],以及基于几何方法的解决方案算法[11]。其他算法基于Lyapunov方程或Riccati方程的迭代求解,在[12]、[13]和[14]中有所介绍。最近的工作[15]和[16]研究了微分博弈的近似解,而[17]提供了一种分布式计算方法。关键的是,这些工作都没有考虑约束的包含,目前也不存在计算无限视界NE轨迹的成熟算法,只有[14]为离散时间CL-NE场景提供了事后局部收敛性保证。