基于长短期记忆协同框架的退役电池机器人拆解规划方法

《Symmetry》:A Robotic Disassembly Planning Method for Retired Batteries Based on a Long Short-Term Memory Collaborative Framework

【字体: 时间:2026年06月10日 来源:Symmetry 2.2

编辑推荐:

  本研究针对退役动力电池人机协作拆解过程中的非稳态场景(包括部件老化、指令模糊和传感器漂移),提出一种整合长期与短期记忆的规划领域定义语言(PDDL)生成框架。该框架将大语言模型(LLM)与知识图谱(KG)结合作为长时记忆模块,用于符号任务分解和领域语义规则泛化

  
本研究针对退役动力电池人机协作拆解过程中的非稳态场景(包括部件老化、指令模糊和传感器漂移),提出一种整合长期与短期记忆的规划领域定义语言(PDDL)生成框架。该框架将大语言模型(LLM)与知识图谱(KG)结合作为长时记忆模块,用于符号任务分解和领域语义规则泛化;同时采用元启发优化算法作为短时记忆模块,基于实时传感器反馈对动作参数进行自适应优化。通过长时记忆引导与短时记忆适应的闭环机制,该框架解决了传统PDDL在面对开放、时变、异构的工业拆解场景时,符号动作模型难以捕捉真实物理系统中的不确定性和不可预测干扰的问题,从而限制了其在复杂非稳态场景中的实用性。此外,系统建立了从短时记忆到长时记忆的反馈机制,通过将场景信息转化为补充理解,增强了在非稳态环境中的拆解能力。研究在真实拆解平台上验证了该方法。与传统PDDL、仅使用大语言模型(LLMs)的规划方法以及启发式算法的基线相比,该方法实现了88.0%的任务成功率(显著优于传统PDDL的38.0%)。
论文解读文章

**研究背景与问题**

随着电动汽车保有量的快速增长,退役动力电池的拆解成为资源回收与节能减排的关键环节。现有自动化回收方案依赖高度结构化环境或针对特定产品的大规模训练,难以适应非稳态场景(如部件老化、指令模糊、传感器漂移)带来的高异质性和不确定性。人机协作拆解被工业界视为最优方法:人类操作员负责精细柔性任务,机器人承担重载高重复任务。然而,现有方案向全自动化智能演化时面临严重鲁棒性瓶颈——在非稳态环境下,系统感知与决策逻辑的成功率骤降。传统规划领域定义语言(PDDL)基于封闭世界假设,难以建模非稳态环境中的随机变化;大语言模型(LLMs)虽具备语义推理能力,但其静态逻辑与动态场景之间存在语言-感知-动作三层鸿沟,无法实时局部调整。为此,研究人员提出一种基于长短期记忆协同框架的机器人拆解规划方法,旨在弥合静态逻辑与非稳态物理环境之间的差距,提升机器人的执行鲁棒性。该论文发表在《Symmetry》。

**主要研究方法**

研究人员构建了三层分层协同架构:多模态感知层、长短期记忆(LTM-STM)框架层和物理执行层。关键技术包括:(1)长时记忆模块:整合大语言模型(GPT-4,通过OpenAI API调用)与基于Neo4j构建的退役电池拆解知识图谱(约150实体节点、300关系边,经三位领域专家验证),实现符号任务分解和领域语义规则泛化,生成PDDL骨架;(2)短时记忆模块:采用遗传算法(种群50,交叉概率0.8,变异概率0.1,最大迭代100)作为元启发优化器,基于实时传感器反馈对动作参数自适应优化,生成适配当前场景的PDDL实例;(3)实验平台:UR5六自由度协作机器人配合Intel RealSense D435i深度相机(眼在手安装),使用真实退役电池模块(含腐蚀紧固件、高压线束、铜母排等)在非稳态场景下进行验证。实验主要对比了固定PDDL、仅LLM的PDDL和仅遗传算法的PDDL三种基线方法。

**研究结果**

**4.1 实验设计(Experimental Design)**
研究人员针对非稳态环境的三种典型失效机制(物理属性随机演化、语义感知模糊、传感器反馈动态扰动),设计了渐进式实验逻辑:实验A作为标准条件基线,实验B引入模糊指令,实验C和D引入物理干扰(螺栓偏移、腐蚀、视野遮挡),以检验LTM-STM框架在不同非稳态程度下的表现。

**4.2 实验环境设置(Experimental Environment Setup)**
搭建了包含视觉感知、自然语言理解和力控操作能力的机器人实验平台,采用UR5协作机器人、RealSense D435i相机,并构建了包含高代表性物理结构的退役电池模块作为实验对象,充分考虑了非稳态环境下的闭环反馈需求。

**4.3 方法比较与验证(Method Comparison and Verification)**
通过消融实验对比四种方法,定义语义任务准确性(STA)、执行成功率(SR)、平均规划时间(APT)和故障恢复成功率(RSR)四个指标。结果表明:LTM-STM框架在STA(96.0%)和SR(88.0%)上显著优于固定PDDL(92.0%/38.5%)、LLM-PDDL(82.0%/52.0%)和GA-PDDL(71.0%/71.5%)。APT为24.8秒,低于GA-PDDL的56.4秒,略高于固定PDDL的8.3秒。RSR达91.0%,远高于LLM-PDDL的32.0%和GA-PDDL的55.0%。这验证了知识图谱(KG)抑制大模型逻辑幻觉、长时记忆缩小短时记忆搜索空间以及短时记忆元启发算法进行在线参数进化的协同效果。

**4.4 实验流程(Experimental Process)**
设计了四类挑战性实验场景:标准条件拆解、人机协作噪声(模糊空间语义)、非稳态环境拆解(螺栓孔偏移、模拟紧固件老化、局部视野遮挡)。实验分五个阶段:感知与检索、逻辑规划、参数进化、闭环执行、评估记录。每个任务重复50次。

**4.5 实验结果与性能分析(Experimental Results and Performance Analysis)**
在实验A(标准条件)中,系统达到98%语义准确率和95%执行成功率;实验B(模糊指令)中,语义准确率仍保持92%;实验C和D(模拟实际退役条件)中,尽管执行成功率较标准条件下降,但故障恢复成功率仍达89.5%。平均任务时间随复杂度增加而上升,主要来自知识图谱检索、大语言模型推理和遗传算法种群进化。整体上,该框架在处理非稳态拆解任务中表现出显著优势。

**讨论与结论**

讨论部分指出,该框架在非稳态场景下通过长时记忆逻辑引导与短时记忆参数进化的闭环机制,显著提升了规划质量,任务完成率较传统方法提升约35–50%。同时承认局限性:依赖人工构建的先验知识图谱限制了零样本可扩展性;短时记忆适应仅聚焦末端执行器参数,缺乏整臂动态避障机制;验证限于单臂场景。未来工作将围绕多模态感知增强、多智能体任务协作和自主技能学习展开。

**研究结论翻译**:本文针对退役动力电池人机协作拆解过程中的非稳态场景,提出了一种基于长短期记忆框架协同的机器人任务规划方法。该方法通过知识图谱(KG)和大语言模型(LLM)构建长时记忆,实现拆解任务逻辑骨架的推理;同时利用元启发算法构建短时记忆,实现对非稳态场景的自适应实例化进化。实验结果表明,在包含部件腐蚀、位姿偏差和模糊语义指令的非稳态任务中,所提框架的语义任务准确性达到96.0%,任务执行成功率达到88.0%。引入物理干扰后,故障恢复成功率提升至91.0%,有效验证了该框架在处理高不确定性拆解任务中的稳定性和鲁棒性。与固定PDDL、LLM-PDDL等主流规划方法的对比实验证明,该方法在逻辑合理性、执行成功率和参数进化效率方面均表现出显著优势。这表明长短期记忆框架的协同机制在非稳态场景下对提高规划质量起到了关键作用,整体任务完成率较传统方法提升约35–50%。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号