《Technologies》:Transformer- and GRU-Based Identification of Open-Chain Robot Kinematics Using Product-of-Exponentials Coordinates
编辑推荐:
本文研究从有限时间窗内的异构信号(包括指令关节参考值、实测关节状态及末端执行器位姿观测)中数据驱动地辨识开链机器人的形态。与假定已知运动学拓扑的传统标定流程不同,所提公式同时估计离散结构量与连续运动学坐标:主动关节数目、转动/移动(R/P)标记序列、螺旋指数积
本文研究从有限时间窗内的异构信号(包括指令关节参考值、实测关节状态及末端执行器位姿观测)中数据驱动地辨识开链机器人的形态。与假定已知运动学拓扑的传统标定流程不同,所提公式同时估计离散结构量与连续运动学坐标:主动关节数目、转动/移动(R/P)标记序列、螺旋指数积(Product-of-Exponentials, POE)螺旋轴以及末端执行器零位位姿。采用时序Transformer编码器作为主估计器,并在相同数据集、相同输出头及多任务物理感知目标函数下与门控循环单元(Gated Recurrent Unit, GRU)基线进行比较。连续目标以POE坐标而非Denavit–Hartenberg(DH)表表示,因为POE直接描述空间关节轴线并可避免若干坐标系选取歧义。在含48种串联机器人族的带噪基准上的仿真结果表明,两种序列模型在测试库内轨迹上均能恢复离散结构,而其连续重构误差揭示了螺旋轴、零位位姿及轨迹重构精度方面的不同权衡。研究还讨论了非活跃槽掩码(inactive-slot masking)、库外形态行为、合成至真实数据局限、持续激励(persistent excitation),以及所得模型作为后续标定精化初始值的作用。
论文解读:《基于Transformer与GRU的基于螺旋指数积(Product-of-Exponentials, POE)坐标的开链机器人运动学辨识》
研究背景与意义
传统机器人运动学标定通常假定关节拓扑结构已知,仅对几何或动态参数进行估计,难以适用于模块化机械臂、可重构机器人或名义模型缺失/退化的服务系统。针对此,研究人员提出一种混合离散—连续问题的数据驱动辨识框架:从含指令参考值、关节位置、关节速度及末端笛卡尔位姿(位置加标量首部单位四元数)的同步多信号时间窗中,推断结构族、自由度(Degree of Freedom, DOF)数目、转动/移动(Revolute/Prismatic, R/P)关节类型序列、各主动关节的空间螺旋轴(screw axis)及末端执行器零位位姿(home pose)。连续目标采用POE坐标而非Denavit–Hartenberg(DH)参数,因POE在空间固定系中直接参数化关节螺旋轴,避免了DH表中帧分配不唯一的问题。本研究发表于《Technologies》期刊,通过引入时序Transformer与GRU架构进行对比,探讨深度序列模型在机器人自建模与形态辨识中的可行性及架构差异,为后续非线性最小二乘标定提供数据驱动初始化。
主要关键技术方法
研究人员构建了含48种3至8 DOF的R/P开链机器人族仿真基准,由标准DH参数生成并按式(13)转换为空间POE目标。动态轨迹由多正弦指令二阶关节伺服仿真生成,关节状态与末端位姿叠加高斯白噪声。数据被分割为固定长度T的时间窗作为输入。网络分别采用时序Transformer编码器(带位置编码与多头自注意力)和堆叠GRU(取末态隐层)提取时序特征,后接六个并行输出头:结构族分类、DOF分类、R/P标记序列(带非活跃槽掩码)、归一化POE螺旋轴回归(带掩码smooth?L1损失)、零位位置回归及零位四元数回归。总损失为多任务加权求和,含分类交叉熵、掩码标记损失、掩码POE smooth?L1、零位位置与四元数误差、基于采样关节角由预测POE计算末端位姿与真值比较的位姿一致性项,及螺旋轴物理合理性正则项。长轨迹推断时对多个时间窗离散概率取平均、连续量取中位数,并按预测激活槽置零非活跃POE分量后按式(6)重构位姿。训练采用Adam优化器,相同数据流水线分别在NVIDIA RTX 5090 GPU上进行。
研究结果
5.1. Quantitative Transformer–GRU Comparison(Transformer—GRU定量比较)
在相同库内48族长轨迹测试集上,Transformer与GRU均取得完美离散辨识:结构族准确率、DOF准确率及R/P标记序列准确率均为1.000,表明所选族在仿真数据分布下可分离。连续指标显示差异:Transformer在全分量POE均方根误差(Root Mean Square Error, RMSE)与轨迹姿态误差上略优,GRU在零位位置RMSE及训练/推理耗时上略优。说明自注意力更有益于姿态敏感重构,GRU是计算代价更低的有力循环基线。
5.2. Representative POE and Home-Pose Reconstruction(代表性POE与零位位姿重构)
典型PPRRRP轨迹的末端重构显示两模型均跟踪笛卡尔位置且姿态误差有界。POE分量对比表明离散结构恢复精确,但中间转动关节螺旋轴分量存在偏离——源于仅靠末端观测对中部关节螺旋轴可观测性有限(受有限激励影响)。代表性算例的主动关节螺旋轴角部与平移部误差范数显示Transformer最大角部偏差在关节2,GRU关节2–5角部误差总体较小但平移误差相当。零位位姿绝对误差方面Transformer四元数某些分量更小,GRU零位平移分量更小,与前述整体指标一致。
讨论与结论翻译
表3中报告的完美离散准确率须限定于合成基准范围:训练与测试族同源且仅为48个预定义族而非3至8 DOF间全部504个R/P序列,故结果证明选定库内形态可分离而非开放集识别能力。若遇库外形态两网络均会将其归为最近库内族,除非加入基于最大类概率与POE重构误差阈值的拒绝机制。真实机器人含编码器偏置、时延、摩擦、间隙、柔性与非高斯传感误差,会降低分类置信度与连续POE精度,部署版应引入域随机化、延迟与摩擦/间隙建模、可能的中间连杆传感及实机验证;所学POE模型应视为后续标定阶段的结构与数值初值而非精密测量替代。表3–5中连续误差有意义,因POE螺旋轴与零位位姿直接决定正运动学;厘米级零位位置误差与有界姿态误差可满足自建模初值需求,但高精度工业标定仍需激光跟踪仪等外部测量精化。图9中间转动关节偏差可能与持续激励不足有关——多正弦参考虽激励所有关节但不保证各螺旋分量由末端观测等可观测,更严谨的激励设计与不确定感知估计是未来方向。GRU基线表明架构作用:两者同目标同损失使比较孤立于时序编码器,GRU计算轻量且离散识别相当,Transformer降低轨迹姿态误差暗示自注意力更好利用位姿演化的非局部关联,循环门控是具竞争力的低开销替代。未来可加入多层感知机(Multilayer Perceptron, MLP)、时序卷积网络(Temporal Convolutional Network, TCN)、长短期记忆网络(Long Short-Term Memory, LSTM)及经典标定基线,并探索将学得POE初值送入非线性最小二乘标定的混合流程。
本文提出一种基于POE坐标从多信号时间窗辨识开链串联机器人形态与连续运动学的框架,可估计结构族、DOF、R/P标记、螺旋轴及零位位姿。时序Transformer与GRU基线在相同多任务损失下训练并直接比较。两模型在48族合成基准上均实现完美库内离散辨识,连续误差揭示螺旋轴与零位位姿重构的不同权衡:Transformer获更低轨迹姿态误差,GRU提供更轻量循环基线及更短训练与评估时间。研究支持基于POE的深度机器人自建模可行性,同时指出当前局限:依赖合成数据、有限候选库、连续重构误差及缺实物验证。未来工作将涉及穷举族枚举、开集形态拒识、持续激励设计、中间连杆传感及实机械臂标定精化。