通过具有可学习激活函数的新型可解释网络理解复杂制造进给系统中六自由度热误差的热力学机制

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《INTERNATIONAL JOURNAL OF MACHINE TOOLS & MANUFACTURE》：Understanding thermodynamic mechanisms of 6-DOF thermal errors in complex manufacturing feed systems via a novel interpretable network with learned activation functions

【字体：大中小】 时间：2026年04月08日 来源：INTERNATIONAL JOURNAL OF MACHINE TOOLS & MANUFACTURE 18.8

编辑推荐：

　　先进制造中热致变形建模的根本挑战，在于如何协调黑箱式数据驱动方法与物理可解释性之间的权衡。尽管高预测精度至关重要，但为保证工业可靠性，同样需要严格的透明性。为弥合这一关键鸿沟，本文提出一种由动态时序Kolmogorov-Arnold网络（DT-KAN）驱动的广

先进制造中热致变形建模的根本挑战，在于如何协调黑箱式数据驱动方法与物理可解释性之间的权衡。尽管高预测精度至关重要，但为保证工业可靠性，同样需要严格的透明性。为弥合这一关键鸿沟，本文提出一种由动态时序Kolmogorov-Arnold网络（DT-KAN）驱动的广义物理信息可解释建模框架。研究人员将该方法应用于精密计算机数控（CNC）机床六自由度（6-DOF）热误差的表征、预测与实时补偿。由于复杂的宏-微观热-机械耦合，这类误差在新型同轴双丝杠进给驱动系统中仍是持续存在的关键难题。

所提出的DT-KAN将显式的、基于物理的时序特征工程与可学习激活函数架构进行协同融合。不同于标准多层感知机（MLP），该网络以边上的可学习B样条（B-spline）替代固定权重。这一结构性转变使模型在保留与热叠加相关的物理归纳偏置的同时，能够自主提取高保真函数映射。在针对未见工况的严格交叉验证下，DT-KAN取得了决定系数R²=0.958和均方根误差（RMSE）0.91 μ rad，且在精度和参数效率上均显著优于基准模型。除卓越的预测性能外，该模型还通过自主解耦底层物理机制展现出更强的可解释性。模型明确识别出累积热量是热记忆的驱动因素，而热梯度则是动态热滞后的来源。最后，研究人员在一台双驱动磨削中心上通过闭环实时补偿系统验证了该框架的工业可行性。所提方法将最大体积误差从31.6 μm降低至5.2 μm，提升幅度达83.5%，有效使系统恢复至冷态精度。针对直线导轨滑块的实际精密磨削试验进一步证实，该方法可在热不稳定条件下保证工艺稳定性与零缺陷率。这些发现凸显出，可解释建模有望成为现代制造中实现透明且可靠热误差补偿的重要路径。

本文发表于《INTERNATIONAL JOURNAL OF MACHINE TOOLS 》。研究聚焦于现代精密制造中机床热误差这一长期制约加工精度的关键问题。机床在运行过程中受到主轴轴承、伺服电机、丝杠摩擦以及环境温度波动等多热源共同作用，形成复杂且动态变化的非均匀温度场，由此引发结构热变形。既有研究表明，热误差通常占机床总加工误差的40%至75%，因此，围绕热误差生成机理、精确预测与在线补偿建立系统性方法框架，已成为高性能制造系统的重要研究前沿。

本文特别关注复杂进给系统中的六自由度（6-DOF）热误差问题。与传统一维轴向热伸长模型不同，现代多轴机床进给系统包含复杂结构回路、分布式热源以及运动学约束，热-机械耦合作用会诱发不仅沿坐标轴方向的线性膨胀，还会产生弯曲、扭转等更复杂的结构响应，最终在刀具中心点（TCP）形成包含三向平移误差Δx、Δy、Δz以及三个角误差Θx、Θy、Θz的六维误差场。尤其重要的是，角误差会通过阿贝误差（Abbe error）与正弦误差（sine error）机制放大为显著体积定位误差，因此其对加工精度的影响具有非对称放大特征。与此同时，这六个误差分量并非相互独立，而是在底层热结构动力学中表现出显著的跨轴耦合、强非线性以及明显的时间迟滞，也即热记忆效应。正是由于这一复杂性，当前领域在六自由度热误差的深层定量表征方面仍存在明显不足，这从根本上限制了后续建模与控制的有效性。

围绕热误差预测，现有研究大致形成两条技术路线：基于机理的物理建模与数据驱动建模。有限元法（FEM）等第一性原理方法具有清晰的物理意义，适合在设计阶段分析热结构行为并优化热稳定性，但在实际在线补偿中面临显著障碍。一方面，高保真FEM模型依赖详尽的几何、材料、边界条件与换热参数信息，而其中接触热阻、对流换热系数等参数不仅难以准确测量，而且会随工况动态变化；另一方面，热弹耦合偏微分方程的求解计算量巨大，难以满足毫秒级实时预测要求。因此，数据驱动方法逐渐成为热误差预测的主流方向。早期多元线性回归（MLR）和支持向量回归（SVR）难以刻画问题中的强非线性与时间动态特征；之后，反向传播神经网络（BPNN）、卷积神经网络（CNN）与长短期记忆网络（LSTM）等方法提高了预测能力，尤其是CNN-LSTM等混合模型在精度方面表现突出。然而，这类方法多依赖固定节点激活函数的多层感知机（MLP）结构，内部映射机制不透明，难以揭示温度刺激与几何变形之间的因果链条，也难以确认模型参数变化是否对应真实物理规律，导致其在未见工况下的泛化能力与工业可信度受到限制。

除预测本身外，理论预测与工程补偿之间还存在明显脱节。现有工业控制系统多数仅能处理一维或最多三维平移误差补偿，而要实现六自由度误差的动态闭环补偿，则需要在数控系统中建立更复杂的运动学补偿算法与控制接口。由于相关基础设施与实施难度较高，这类全六自由度实时补偿在公开研究中较为少见。基于上述背景，本文的核心目标并非单纯追求更高预测精度，而是突破热误差建模中“精度—可解释性”的传统帕累托边界，使模型能够从复杂多传感器数据中自主解耦出累积热记忆、非线性热滞后等基本热力学机制，从而同时服务于科学认知与工程应用。

为此，研究人员提出了一种通用的、内禀可解释的六自由度热误差建模框架，并以新型同轴双丝杠复杂进给系统作为科学验证对象。该结构具有“双热源、共享结构”的鲜明特征，能够形成强烈的宏-微观热-机械耦合环境，因此适合作为诱发与观测复杂非线性热误差动态的理想试验平台。在完成对该双驱系统热误差行为的实验表征后，研究人员进一步构建动态时序Kolmogorov-Arnold网络（DT-KAN）模型。该模型相对于传统神经网络的关键区别，在于以边上的可学习B样条函数替代固定权重，并采用显式、基于物理的时序特征工程来表达热惯性，而不是像循环神经网络（RNN）那样依赖不可见的隐状态表征记忆。这种设计使热叠加、累积效应和动态响应等物理先验被保留在透明输入空间中，从而增强模型的可解释性与泛化能力。最终，研究人员还设计并验证了与现代CNC基础设施兼容的实时补偿算法，完成了从智能建模到工业落地的完整闭环。

研究人员开展本研究主要采用了以下几类关键技术方法：首先，构建同轴双驱复杂进给系统试验平台，对机床刀具中心点（TCP）的六自由度热误差进行实验表征；其次，基于物理机制设计显式时序特征，将热惯性、热累积与梯度效应编码为可学习输入；再次，引入动态时序Kolmogorov-Arnold网络（DT-KAN），以边函数形式的可学习B样条实现高保真非线性映射与符号表达提取；最后，将预测模型嵌入Siemens SINUMERIK ONE数控平台，构建闭环实时补偿系统，并通过精密坐标磨削与直线导轨滑块加工试验验证工业有效性。

以下结合论文主体结构，对研究结果进行浓缩解读。

一、A coaxial dual-drive complex feeding system
本节主要介绍研究对象及其工程背景。研究人员指出，进给驱动系统是决定先进机床精度与效率的核心功能单元。与传统滚珠丝杠进给系统、直线电机系统或常规宏-微复合架构相比，本文采用的新型同轴双丝杠驱动结构在动力学与热学上更为复杂。其双热源在共享结构中的耦合作用，会导致更加显著的热负载叠加与结构响应耦合。论文借助该系统作为实验载体，不仅为了验证模型性能，更是为了在极端复杂的热力学环境中揭示六自由度热误差的生成规律。该系统的选择构成全文的实验与方法基础，说明研究并非针对简化场景，而是在高挑战性工业环境中展开。

二、Theoretical framework: The Kolmogorov-Arnold network shift
本节围绕理论建模框架展开。研究人员首先从逼近理论角度回顾MLP及其时序变体在热误差建模中的局限，指出传统网络通过仿射变换与固定逐点非线性递归组合逼近目标函数，虽然具有拟合能力，但内部结构难以对应明确物理机制。为突破这一限制，论文引入Kolmogorov-Arnold Network（KAN）范式，用可学习的边函数替代固定权重。进一步地，本文提出DT-KAN，将时序维度与物理信息显式嵌入模型输入，并通过B样条激活结构学习热误差与多源温度响应之间的复杂函数关系。该框架的重要意义在于，它并不将时间依赖封装于难以解释的隐状态，而是将热记忆等动力学现象显式映射为可分析的函数形式，从结构上为可解释性提供支撑。模型在未见工况上的交叉验证结果显示，DT-KAN取得R²=0.958、RMSE=0.91 μ rad，说明其在精度和参数效率上均优于对比模型。

三、Understanding of 6-DOF thermal errors: From data-driven learning to physical insight
本节是全文的科学核心，重点在于从数据驱动学习迈向物理认知。研究人员强调，热误差预测模型的价值不仅在于数值精度，更在于其是否能够解释热刺激如何演化为几何变形。相较于LSTM等高精度但缺乏透明性的模型，DT-KAN能够从复杂传感器数据中自主抽取具有人类可读性的符号表达式，并将这些表达式与物理合理的热力学关系对应起来。论文指出，模型显式识别出累积热量对应热记忆效应，即系统当前误差状态与历史热输入积分存在稳定关联；同时，模型还识别出热梯度是动态滞后的主要来源，说明不同部位温升差异所引起的非均匀热传导与结构变形响应，是导致系统表现出路径相关与迟滞特性的关键因素。该发现标志着模型不再只是“拟合数据”，而是实现了底层热力学机制的解耦与表达，从而为热误差建模提供了可验证、可审查、可迁移的知识基础。

四、Real-time closed-loop compensation and industrial viability validation
本节验证方法的工程闭环价值。研究人员在高精度坐标磨削中心试验平台上，构建了基于Siemens SINUMERIK ONE数控系统的实时闭环补偿架构。该平台采用宏-微双驱进给体系，与前述研究对象在物理结构上保持一致，因此适合验证预测模型向实际控制指令的转换能力。实验结果表明，基于DT-KAN的补偿系统将最大体积误差由31.6 μm显著降低至5.2 μm，误差改善幅度达到83.5%，使设备精度基本恢复至冷态水平。这一结果说明，模型不仅能够进行离线预测，而且能够满足工业现场对实时性、稳定性和控制兼容性的要求。进一步的直线导轨滑块精密磨削试验表明，在热不稳定条件下，该补偿框架仍能够保持加工过程稳定并实现零缺陷率，从而验证了其面向先进制造应用的实际可行性。

五、讨论部分总结
从全文讨论来看，研究人员重点回应了当前热误差研究中长期存在的“黑箱高精度”与“白箱低效率”之间的矛盾。DT-KAN的提出表明，通过将物理信息约束、显式时序特征工程与可学习函数结构相结合，可以在保持高预测精度的同时获得更强的物理透明性。论文并未停留于模型性能比较，而是进一步展示了模型内部表达与热力学机制之间的一致性，使累积热量、热梯度、热记忆和热滞后等概念从经验描述转化为可计算、可解释的数学关系。这种从“经验拟合工具”向“物理认知工具”的转变，是本文最重要的学术贡献之一。同时，研究通过六自由度实时闭环补偿证明了可解释模型并不意味着牺牲工程性能，反而能够提升在复杂未见工况下的可靠性与工业信任度。

六、研究结论翻译
本研究提出了一种面向精密制造系统六自由度热误差表征、可解释预测与实时补偿的通用物理信息框架。通过引入动态时序Kolmogorov-Arnold网络（DT-KAN），该研究成功弥合了黑箱人工智能的高预测保真度与工业可靠性所要求的严格物理透明性之间的根本二分。研究结果表明，所提框架不仅能够高精度预测复杂热误差，还能够自主提取与底层热力学机制一致的可读函数关系，明确揭示累积热量与热记忆、热梯度与动态滞后之间的联系。通过在精密机床上的闭环实时补偿验证，研究进一步证实该方法能够显著降低体积误差并恢复系统冷态精度，展现出在现代先进制造中实现透明、可靠热误差补偿的巨大潜力。

联系信箱：

粤ICP备09063491号

热点排行