物理信息神经网络与多阶段迁移学习在电渣重熔过程电磁场预测中的应用

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Materials Research and Technology》：Physics-Informed Neural Networks with Multi-Stage Transfer Learning for Electromagnetic Field Prediction in Electroslag Remelting Process

【字体：大中小】 时间：2026年06月04日 来源：Journal of Materials Research and Technology 6.2

编辑推荐：

　　电渣重熔（ESR）需要快速且物理一致的电磁场预测，以控制焦耳热、熔池形态、夹杂物去除和凝固质量。传统的有限元和有限体积模拟虽然准确，但计算成本高且难以针对新操作条件重新配置，而纯数据驱动模型在稀疏且含噪声的工业测量下不可靠。本研究开发了一种具有多阶段迁移学习的

电渣重熔（ESR）需要快速且物理一致的电磁场预测，以控制焦耳热、熔池形态、夹杂物去除和凝固质量。传统的有限元和有限体积模拟虽然准确，但计算成本高且难以针对新操作条件重新配置，而纯数据驱动模型在稀疏且含噪声的工业测量下不可靠。本研究开发了一种具有多阶段迁移学习的物理信息神经网络（PINN），用于ESR电磁场预测。麦克斯韦方程残差、轴对称边界约束和稀疏磁通密度测量被嵌入复合损失函数中。训练过程依次经过50 Hz基线模型、10–50 Hz频率迁移以及0.15–0.21 m渣池厚度的几何参数化。基线模型预测磁通密度的平均相对误差为0.16%，最大点误差为0.27%，同时保持16%的功率平衡偏差和小于13%的电流守恒误差。频率迁移表明，将频率从10 Hz增加到50 Hz会使渣池功率分数从64%升高至85%。将渣池厚度从0.15 m增加到0.21 m会使该分数从62%升高至88%，并将特征钢锭加热深度从0.26 m降低至0.15 m。消融和噪声测试证实了物理约束和数据约束的互补作用，在10%训练数据噪声下预测误差为5.44%。该框架为ESR软测量、工艺优化和数字孪生开发提供了快速计算核心。

## 论文解读文章

### 研究背景与问题

电渣重熔（Electroslag Remelting, ESR）是一种先进的特殊冶金精炼技术，通过电流在熔渣池中产生的焦耳热熔化自耗电极，并在水冷结晶器中定向凝固，生产出化学成分均匀、组织致密、表面质量优异的高品质钢锭，广泛应用于航空发动机涡轮盘、核电设备关键部件、大型模具钢和高端轴承钢等领域。在ESR过程中，电磁场扮演多重关键角色：交流电流通过低电导率的渣池产生大量焦耳热，作为维持高温渣池和熔化电极的主要热源；电流与自感磁场相互作用产生的洛伦兹力驱动渣池和熔池内的电磁搅拌，显著影响传热传质过程，进而决定熔池形态和凝固前沿温度梯度分布；电磁力还对渣池中非金属夹杂物的运动轨迹产生重要影响，直接影响夹杂物去除效率和钢锭最终洁净度。因此，准确预测电磁场分布对ESR工艺优化、质量控制和新型工艺开发具有重要理论意义和实用价值。

然而，传统数值方法（有限元法FEM和有限体积法FVM）在ESR电磁场模拟中已取得显著进展，但仍存在固有局限：三维瞬态多物理场耦合计算通常需要数小时甚至数天，无法满足工业实时性要求；电磁场在趋肤深度内的急剧变化需要高度精细的局部网格，增加了建模复杂性和计算负担；每当几何尺寸或工艺参数改变时，需要重新划分网格并从头计算，无法快速探索设计空间；传统数值方法无法直接利用在线测量数据来校正模型预测。为克服这些局限，纯数据驱动方法（如深度神经网络）虽具备推理速度快、易与在线检测系统集成等优势，但缺乏物理一致性保证，泛化能力有限，且需要大量标注数据，而ESR高温环境使实验数据获取成本极高。

### 研究内容与意义

针对上述挑战，研究人员提出了一种基于多阶段迁移学习的物理信息神经网络（Physics-Informed Neural Network, PINN）方法，用于ESR电磁场预测。该研究首次系统地将PINN应用于ESR电磁场建模，建立了一个融合麦克斯韦方程物理约束与稀疏实验数据的混合驱动模型，实现了磁场、电流密度、焦耳热和电磁力等关键物理量的高精度预测。论文发表在《Journal of Materials Research and Technology》。

### 主要关键技术方法

（1）构建二维轴对称准静态电磁场物理模型，基于磁矢量势（Magnetic Vector Potential）的亥姆霍兹型方程，分解为实部和虚部两组耦合方程。（2）设计全连接前馈神经网络结构，含8个隐藏层（每层128神经元，Tanh激活函数），在输出端对轴向边界条件进行硬编码。（3）构建复合损失函数，包含偏微分方程（PDE）残差损失和数据拟合损失（磁通密度相对误差），并采用分阶段递减数据权重策略（200→50→10）。（4）采用分区精细化采样策略分配配点，渣池、电极、钢锭及测量区域附近分别设置不同密度配点。（5）提出三阶段迁移学习策略：阶段1在50 Hz基准工况（渣池厚0.15 m，电流8000 A，电压50 V）下联合PDE约束和20个磁场测量数据训练基线模型；阶段2基于阶段1初始化，对10–50 Hz五个频率进行纯PDE约束迁移训练；阶段3将网络输入扩展为(r, z, h_slag)，对渣池厚度（0.15、0.18、0.21 m）进行几何参数化训练。

### 研究结果

**阶段1 基准训练结果**：在50 Hz标准工况下，基线模型在8009个epoch后收敛，总损失5.36×10^-3，PDE损失1.57×10^-3，数据损失7.73×10^-5。磁通密度预测与实验值相比，平均相对误差仅0.16%，最大单点误差0.27%（位于r=0.668 m）。通过自动微分计算电流密度、焦耳热密度和电磁力矢量场，揭示了电流在电极-渣池界面的“电流汇聚效应”以及电磁力指向轴心的向心力场分布。物理自一致性验证显示：焦耳热积分功率335 kW，与电源输入功率400 kW偏差16%（低于20%工程接收阈值）；6个截面的轴向电流在7.0–8.6 kA范围内波动，最大偏差13%。这些偏差主要源于数值积分误差和模型简化，而非物理建模缺陷。

**阶段2 频率迁移学习结果**：借助阶段1预训练权重初始化，各频率模型在15000个epoch内收敛到PDE损失10^-5–10^-6量级。频率从10 Hz增加到50 Hz时，渣池功率比例从64%升高至85%，上部钢锭功率比例从36%减少至15%。该趋势归因于趋肤深度δ ∝ 1/√f的物理机制：钢的趋肤深度在10 Hz时约18.9 mm，50 Hz时约8.4 mm，高频下电流更集中于钢锭表面薄层，有效加热体积减小，总焦耳热向渣池转移。低频（10–20 Hz）适合大直径钢锭生产、低过热度控制和定向凝固组织均匀性控制；高频（40–50 Hz）适用于高熔化效率、增强夹杂物去除和薄渣层操作。

**阶段3 几何参数化结果**：将渣池厚度h_slag作为网络输入后，模型可在0.15–0.21 m范围内连续预测电磁场分布。当渣池厚度从0.15 m增加到0.21 m时，高焦耳热密度区域纵向延伸，峰值从约180 MW/m³降低至约150 MW/m³但分布更均匀；渣池功率比例从62%升高至88%，上部钢锭功率比例从38%降低至12%，同时钢锭内特征加热深度（焦耳热密度衰减至界面值的1/e处）从0.26 m减小至0.15 m。模型在非训练厚度（0.17 m、0.19 m）上的插值预测保持物理合理性，验证了平滑映射能力。

**消融实验分析**：纯PDE约束模型（无数据）虽PDE损失可收敛至1.74×10^-4，但磁场预测误差高达1003%，远场出现非物理振荡，揭示了缺乏尺度信息时解的非唯一性问题。纯数据拟合模型（无PDE）在1000个epoch内数据损失降至10^-13，但PDE残差高达3.5×10⁵，较完整PINN高出8个数量级，表明在20个测量点相对于1.3×10⁵网络参数下必然发生过拟合。完整PINN通过同时约束数据损失（7.73×10^-5）和PDE损失（1.57×10^-3），在帕累托前沿上实现了数据拟合与物理一致性的最优折衷。

**噪声鲁棒性分析**：在2%、5%、10%三个典型噪声水平下，PINN在无噪声测试数据上的预测误差分别为1.74%、4.51%、5.44%，噪声过滤率随噪声水平增加而提高（10%噪声时过滤率达46%）。PDE约束相当于施加低通滤波效应，高频噪声难以在学习过程中被网络同时满足物理方程，从而自动滤除。

### 讨论与结论

讨论部分指出，PINN方法的主要优势包括：高数据效率（20个稀疏测量点即可实现0.16%平均预测误差）、无需网格生成、参数化能力（训练后通过改变输入参数适应新工况）、物理约束确保预测满足控制方程。局限性包括：训练损失存在波动，收敛稳定性需改进；功率平衡偏差16%表明精度与效率的权衡仍需优化；基于二维轴对称假设，向三维扩展面临多重挑战。与FEM相比，PINN推理速度约快10⁵倍（<1 ms/点），但训练需约5分钟（GPU环境）；PINN在数据融合和参数化方面具有独特优势，而FEM在多物理场耦合方面更成熟。未来研究方向包括：耦合传热、流体和凝固的多物理场PINN；发展三维非轴对称模型；将频率和渣池厚度作为连续可调输入；引入在线学习和不确定性量化；结合工业测量和高保真仿真进行泛化验证。

研究结论如下：

（1）三阶段迁移学习PINN框架实现了ESR多工况电磁场的高精度快速预测。在50 Hz标准工况下，基线PINN模型在20个验证点上的磁场预测平均相对误差仅0.16%，最大单点误差不超过0.27%；功率平衡偏差控制在16%以内（低于工业软测量20%工程接收阈值），轴向电流守恒误差小于13%。这表明所构建的PINN框架能够在平衡数据拟合精度的同时较好地满足基本物理守恒定律，为后续多工况扩展建立了可靠基础。

（2）频率迁移学习定量揭示了趋肤效应主导的功率分配规律，为频率优化提供了依据。通过10–50 Hz范围内的基于PDE约束的迁移训练，模型捕捉到频率变化对渣池和钢锭间功率分配的影响规律：频率从10 Hz升至50 Hz时，渣池功率比例从64%增至85%，上部钢锭功率比例从36%降至15%。该趋势与钢和渣的趋肤深度反比于频率平方根的关系一致，定量反映了“低频有利于增加钢锭近表层有效加热厚度，高频有利于强化渣池集中加热”的工艺特征，为变频ESR工艺在不同区间的频率选取提供了参考。

（3）几何参数化PINN模型揭示了渣池厚度对功率分配和特征深度的耦合影响，为渣池液面控制提供了定量支撑。通过将渣池厚度作为网络输入参数，实现了0.15–0.21 m渣池厚度范围内电磁场分布的连续建模。结果表明，当渣池厚度增加40%（0.15 m→0.21 m）时，渣池功率比例从62%增至88%，上部钢锭功率显著下降，钢锭内特征深度从0.26 m降至0.15 m。这些结果定量描绘了“厚渣池促进功率向渣层集中、降低钢锭内部有效加热厚度”的趋势，为渣池厚度工艺规范和在线调整提供了定量依据。

（4）消融实验系统揭示了PINN中物理约束与数据约束的协同增强机制，阐明了其优于纯PDE/纯数据方法的根本原因。对比纯PDE模型、纯数据模型和完整PINN的结果表明：纯PDE模型在缺乏尺度信息的情况下磁场预测误差高达1003%；纯数据模型虽在测量点实现近零误差拟合，但PDE残差增加数个数量级，明显偏离麦克斯韦方程。完整PINN通过同时引入PDE残差和数据拟合项，将数据损失和PDE损失分别控制在10^-4和10^-3量级，在数据拟合与物理一致性之间实现了相对合理的折衷，从机制上验证了“物理先验+数据”的协同优势。

（5）噪声鲁棒性测试表明，所提方法适用于工业现场“脏数据”环境，为数字孪生和在线控制奠定了基础。在2%、5%、10%三个典型噪声水平下，PINN在无噪声测试数据上的预测误差分别为1.74%、4.51%、5.44%，即使在10%测量噪声条件下仍保持约5%的预测精度，展现了物理约束对高频随机噪声的显著滤除效应。该特性降低了对传感器精度的依赖，使所提出的PINN框架能够在噪声环境中稳定运行，为构建ESR过程数字孪生、实现在线软测量和模型预测控制提供了可靠的电磁场计算核心。

联系信箱：

粤ICP备09063491号

热点排行