基于高斯过程(Gaussian Process, GP)自适应交互多模型粒子滤波(Interacting Multiple Model Particle Filter, IMMPF)的非线性随机系统数据驱动状态估计

《Automation》:Data-Driven State Estimation for Nonlinear Stochastic Systems Using Gaussian Process-Based Adaptive Interacting Multiple Model Particle Filtering

【字体: 时间:2026年06月19日 来源:Automation 2

编辑推荐:

  摘要:本文研究具有多个切换模型的非线性随机系统的状态估计问题,尤其针对系统动力学未知且转移概率矩阵(Transition Probability Matrix, TPM)均匀分布的困难条件。研究人员采用高斯过程回归(Gaussian Process Regre

  
摘要:本文研究具有多个切换模型的非线性随机系统的状态估计问题,尤其针对系统动力学未知且转移概率矩阵(Transition Probability Matrix, TPM)均匀分布的困难条件。研究人员采用高斯过程回归(Gaussian Process Regression, GPR)从离线离散数据集学习未知系统动力学,并将其集成到交互多模型粒子滤波(IMMPF)框架中。GPR实现了对状态转移函数和观测函数的数据驱动学习。为应对模型不确定性及无信息先验转移知识(特别是在均匀初始化TPM下),进一步引入基于隐马尔可夫模型(Hidden Markov Model, HMM)推断的双层自适应TPM更新策略。最后,通过仿真验证所提方法并与不同系统动力学及TPM假设下的IMMPF进行比较。结果表明,即便在无系统动力学先验知识及精确TPM信息时,所提GP-AIMMPF仍保持鲁棒且准确的状态估计性能。
论文解读:基于高斯过程自适应交互多模型粒子滤波的非线性随机系统数据驱动状态估计
研究背景与意义
非线性随机系统因连续状态动力学与离散模型切换相互作用,被广泛用于复杂工程过程建模。传统状态估计依赖精确已知的系统状态转移方程与观测方程,但在实际工程中受物理复杂性与环境不确定性影响,往往难以建立准确的数学模型,导致基于模型的滤波算法性能显著退化甚至发散。交互多模型(Interacting Multiple Model, IMM)算法通过并行交互机制可有效处理系统模型动态切换,结合粒子滤波(Particle Filter, PF)形成的IMMPF可应对非线性非高斯特性。然而经典IMMPF严重依赖各子滤波器精确的系统动力学模型及转移概率矩阵(Transition Probability Matrix, TPM),当系统动力学未知或TPM设置偏离实际时,模型交互失效,估计精度下降甚至滤波发散。数据驱动建模方法中,高斯过程回归(Gaussian Process Regression, GPR)作为非参数贝叶斯方法,在小样本学习、非线性建模及不确定性量化方面优于神经网络与支持向量回归(Support Vector Regression, SVR),其预测均值与协方差可直接融入贝叶斯滤波框架。此外,TPM的未知或错误设定是IMM性能瓶颈。为此,研究人员开展将GPR嵌入IMMPF并设计双层自适应TPM更新的研究,提出GP-AIMMPF算法,发表于《Automation》。
主要关键技术方法
研究人员针对含m个运动模型、状态转移函数fj(·)与观测函数hj(·)均未知的非线性随机切换系统,首先为每个模型分别构建GPR模型,以{xk, xk+1?xk}为训练输入输出学习状态增量,以{xk, zk}学习观测映射,核函数选用径向基函数(Radial Basis Function, RBF)并通过最大化对数边际似然(Log-Marginal Likelihood)优化超参数。将训练好的GPR集成入IMMPF框架形成GP-IMMPF,粒子预测步采用GPR预测均值加高斯噪声传播,观测预测亦由GPR给出,据此计算粒子权重并更新模型概率,经交互—预测—更新—融合标准流程实现滤波。为解决TPM未知或均匀初始化问题,设计双层自适应TPM更新:底层基于滑动窗口内观测序列,用隐马尔可夫模型—期望最大化(Hidden Markov Model-Expectation Maximization, HMM-EM)算法求TPM闭式解实现长期统计一致估计;上层引入基于模型概率变化率的极化函数(Polarization Function)对TPM做瞬时修正以补偿EM更新延迟。算法在均匀及对角占优TPM下与IMMPF、GP-IMMPF比较,通过一维强非线性切换系统、二维机动目标场景及两轮差速驱动车辆动力学仿真验证性能,并做窗口长度L、训练样本数、极化增益因子及核函数敏感性分析。
研究结果
Problem Formulation
研究人员考虑含m个运动模式的一阶Markov链切换非线性随机系统,xk为状态向量,zk为观测向量,过程噪声与测量噪声为零均值高斯,模式转移由TPM Π描述,元素πij=P(rk+1=j|rk=i)。明确fj(·)与hj(·)显式形式未知,需由GPR对每个模型j学得其状态转移与观测映射的均值μf,j、Σf,j与μh,j、Σh,j
Proposed Approach: GP-AIMMPF — Gaussian Process Regression
GPR定义为均值函数m(x)与协方差/核函数k(x,x'),选用RBF核k(x,x')=σf2exp(?‖x?x'‖2/(2l2)),超参数σf、l通过梯度上升最大化对数边际似然获得。给定训练集,测试点预测分布为N(μ*, Σ*),其中μ*=K(x*,X)[K(X,X)+σn2I]?1y,Σ*=k(x*,x*)?K(x*,X)[K(X,X)+σn2I]?1K(X,x*)。
Gaussian Process-Based Interacting Multiple Model Particle Filter (GP-IMMPF)
滤波流程含:(1)模型交互——按上一时刻模型概率混合粒子状态与协方差;(2)GPR预测状态更新——粒子经各模型GPR预测均值μf,j(xik)叠加过程噪声传播得x?jk+1|k,GPR预测观测得?jk+1|k;(3)权重更新与重采样——基于观测似然N(zk+1; ?jk+1|k, R)更新粒子权值并系统重采样;(4)模型概率更新——由各模型粒子权值和计算模型后验概率μj(k+1);(5)估计融合——最终状态为各模型估计以模型概率为权的加权和,之后重置粒子权值为1/N。
Dual-Layer Adaptive Transition Probability Matrix
底层(Base Layer):在长度为L的滑动窗口内,用前向—后向变量计算ξij(k)=P(rk=i,rk+1=j|Zk?L:k)与γi(k)=P(rk=i|Zk?L:k),M步中TPM元素更新为π?ij=∑kξij(k)/∑kγi(k)。顶层(Correction Layer):定义模型概率变化率Δμi(k)=μi(k)?μi(k?1)并经指数加权移动平均平滑,构造极化修正量Δπij(k)=α·sgn(Δμ?i(k))·(δijij(k?1)),α为增益因子,对HMM-EM输出的TPM做元素级修正后按行归一化,使匹配模型间转移概率增大、不匹配模型间减小,快速响应模式切换。
Experiment — Simulation Analysis of One-Dimensional Strongly Nonlinear Systems
Scenario 1(对角占优TPM Π=diag(0.9,0.05,0.05)排列):GP-IMMPF在无显式系统方程时仍能跟踪真轨迹,GP-AIMMPF因自适应TPM进一步降低RMSE;模型概率能正确跟踪模式切换,TPM元素随时间演化趋向实际切换特性。定量显示GP-AIMMPF位置RMSE低于GP-IMMPF,计算耗时较GP-IMMPF仅微增。
Scenario 2(均匀TPM Πij=1/3):传统IMMPF与GP-IMMPF估计误差明显增大、模型概率退化,GP-AIMMPF通过在线重塑TPM维持高精度,RMSE最低,模型概率正确反映切换。滑动窗口长度L敏感性表明L=30时RMSE最低,过小受扰动过大、过大致滞后;训练样本100对时RMSE最小体现GPR小样本优势;极化增益因子α存非线性最优区间。
Simulation Analysis of State Estimation Based on Complex Maneuver Trajectories
二维目标含左转弯(constant turn, CV+CT)、匀速直线(CV)、右转弯三阶段运动。IMM-EKF因强非线性线性化误差大,IMMPF改善,GP-AIMMPF获最低位置与速度RMSE,证实自适应TPM可快速提升匹配模型权重、解决固定TPM模型失配问题。
Simulation Analysis of Two-Wheeled Differential Drive Vehicle
以两轮差速驱动小车平面位姿[x,y,θ]T为状态,GPR输入为[xk,ykk,vkkLR]T,输出为Δx,Δy,Δθ,Δv,Δω分别建5个单输出GPR。结果:三种算法均能跟踪轨迹,GP-AIMMPF误差最小。核函数对比RBF核RMSE最低,Matérn 5/2接近,Matérn 3/2较差。非理想工况(测量噪声×4、含5%异常值 outliers、车辆参数±10%扰动)下GP-AIMMPF RMSE始终低于GP-IMMPF,在含异常值时误差降低约30.6%,证明双层自适应TPM增强对非高斯干扰与参数不确定性的鲁棒性。
讨论与结论(翻译自Results/Conclusion部分)
本文提出了一种适用于系统动力学未知且TPM先验知识有限的基于高斯过程(GPR)的自适应交互多模型粒子滤波(GP-AIMMPF)方法,用于非线性随机系统状态估计。该方法通过GPR非参数化学习状态转移与观测过程,其概率输出自然提供预测不确定性以融入粒子滤波;通过双层自适应TPM更新(基于滑动窗口HMM-EM的统计层确保长期统计一致性,基于极化函数的修正层补偿更新延迟以增强对突变模式切换的响应),解决了传统IMM框架下不准确TPM初始化导致的模型竞争退化和估计发散问题。大量仿真结果表明,即便在系统方程未知且TPM均匀初始化的严苛条件下,GP-AIMMPF仍保持高状态估计精度和可靠的模型辨识能力,相较传统IMMPF及无自适应TPM的GP-IMMPF在收敛速度、跟踪精度与鲁棒性上具明显优势,为严重先验信息缺失的非线性随机系统状态估计提供了有效解决方案。未来可进一步研究事件触发或自适应计算机制以降低GPR引入的计算负担,同时保留对突变模型切换的响应能力。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号