基于物理信息神经网络的弹粘塑性材料建模

《Soft Matter》：Modeling elastoviscoplastic materials using physics-informed neural networks

【字体：大中小】 时间：2026年05月28日 来源：Soft Matter 2.8

编辑推荐：

　　弹粘塑性（EVP）材料因其非线性流变行为，尤其在大振幅振荡剪切（LAOS）条件下，给预测性建模带来了重大挑战。尽管已有多种模型被提出以描述屈服和粘弹性转变，但由于计算复杂性、泛化能力差以及难以拟合噪声数据，其在实验数据上的应用仍然有限。本研究采用物理信息神经网

弹粘塑性（EVP）材料因其非线性流变行为，尤其在大振幅振荡剪切（LAOS）条件下，给预测性建模带来了重大挑战。尽管已有多种模型被提出以描述屈服和粘弹性转变，但由于计算复杂性、泛化能力差以及难以拟合噪声数据，其在实验数据上的应用仍然有限。本研究采用物理信息神经网络（PINN）方法重新评估了EVP材料的流变建模，该方法将一个修正的Saramito模型嵌入训练框架。通过直接拟合典型EVP材料的时间依赖性应力数据，该方法规避了从噪声测量中估计梯度的需求，并为传统拟合方法提供了一种数据高效、可微且可泛化的替代方案。研究人员引入了一种剪切稀化公式，以反映在较高应变幅度下粘度的下降。所提出的PINN方法通过合成数据和实验数据进行了验证，展示了物理参数的稳定恢复、增强的可解释性以及在一系列应变幅度下改进的预测能力。该框架将微观结构变形模式与流变建模相结合，为理解和预测软物质中的非线性粘弹性行为提供了强大的工具。

弹粘塑性（EVP）材料存在于许多应用中，包括涂层、基于液滴的喷墨打印和3D打印，它们在这些过程中承受着各种应力加载条件。在医学研究和诊断领域，人们对分析和建模滑液和人血的EVP行为日益感兴趣。它们表现出复杂的力学响应，其特征是弹性、塑性和粘性行为的相互作用。屈服应力是EVP材料的一个关键特性，标志着其从类固体变形向类流体流动转变的临界点。在本文中，研究人员将“屈服”一词特指在振荡应变测量中观察到的弹性-塑性转变。这个定义可能不同于经典的宾汉（Bingham）屈服概念，后者意味着在临界应力阈值下材料表现为刚体。

图1显示了一种典型的III型非线性行为的振幅扫描曲线，以说明取决于施加应变幅度的弹性、塑性和粘性主导区域。弹性主导区域位于低应变幅度下，此时储能模量（G）显著大于损耗模量（G″），且两者对应变相对不敏感。在此区域，材料表现得像固体，弹性地储存能量，意味着微观结构基本保持完整。超出线性的弹性主导区域后，G下降而G″增加，这是由于结构重组导致材料开始屈服。这个中间区域被称为塑性或转变区域，通常延伸到G = G″的交叉点。超过该点，即G″超过G后，屈服后的类流体行为反映了由于结构分解导致整体流体化而产生的不可逆流动中粘性耗散的主导地位。浓缩纳米乳液作为具有III型非线性行为的EVP材料的一个例子，具有丰富的结构、性质和应用，突显了研究其流变学的重要性。通常，稀乳液表现为牛顿行为，而分散相体积分数足够高的乳液则变为粘弹性和EVP。

针对条件离散EVP模型中屈服拟合的主要挑战在于数值拟合的复杂性。模型拟合通常依赖于基于梯度的优化方法，该方法从一组初始参数猜测开始，并通过评估模型在当前参数集下是否满足控制方程来迭代更新参数。这种方法还需要对数据进行有限差分计算以最小化微分方程的残差，当处理噪声数据时，这可能会产生误导。即使通过直接求解方程绕过噪声数据的受扰梯度，数值求解器也必须遍历所有数据点，这意味着求解器的迭代循环必须位于优化迭代循环内部。这可能使收敛变得极其耗时，而离散模型中的不连续性也可能导致在每次循环求解方程时发散。

为了解决与数值拟合相关的所有挑战，研究人员采用物理信息神经网络（PINN）方法来拟合本构方程。近年来，PINN已成为在许多工程和科学领域（包括材料科学、化学、流体力学，特别是流变学）中求解和拟合微分方程的有效数学工具。

与经典神经网络方法（像没有物理直觉的黑箱预测器）不同，PINN嵌入了一个本构模型以建立有意义的理论基础。PINN拟合算法使用梯度下降逻辑或更复杂的梯度下降变体（如Adam优化器）。与传统数值方法相比，唯一的区别在于神经网络的输出可以作为实验数据和模型之间的中间体，以缓解与数据点缺乏或噪声相关的挑战。该方法用于流变学模型的详细说明及示例由Mahmoudabadbozchelou等人提供。

PINN通过最小化称为数据损失的相应损失函数来优化神经网络，使其输出预测与实验数据对齐。同时，它以最小化称为物理损失的相应损失函数的方式优化用户建议的控制方程的系数，使其解与期望值匹配。这两个损失函数的同时优化基于它们加权和的最小化。与传统数值方法（可能因对噪声数据微分而变得不稳定）不同，PINN仍然可以收敛到物理一致的解决方案，因为正则化可以防止对数据噪声的过拟合。此外，神经网络的梯度计算效率更高。这是因为神经网络本身是一个连续、可微的函数，即使我们只在离散点评估它，并且自动微分可以同时提供所有梯度值。相比之下，传统的有限差分近似需要逐步计算，速度要慢得多。

除了PINN的优势之外，传统梯度下降方法的一些局限性依然存在。首先，不适当的学习率容易导致收敛耗时，并跳过损失函数的全局最小值，或陷入局部最小值而不是定位全局最小值。另一个显著的局限性源于实验数据的质量。数据中的稀疏性和噪声仍然会影响PINN的准确性。因此，PINN需要在数据驱动损失和基于物理的残差损失之间仔细权衡。这种平衡防止了神经网络对噪声的过拟合，并强制输出遵循模型的物理原理，这引入了额外的超参数（α）。根据模型的复杂性，仅从一个流变测量协议提供一个数据集可能不足以让PINN恢复复杂模型的正确参数。

很少有研究使用PINN或任何其他拟合方法直接将流变模型拟合到LAOS数据。据研究人员所知，没有一项研究最终得到一个模型能够用单一的拟合参数集准确覆盖各种应变幅度。因此，本研究解决了两个挑战。首先，研究人员建议了一个模型，该模型能够捕捉从线性到非线性区域各种应变幅度下的物理行为。其次，他们开发了一个新的两步PINN框架，将建议的模型同时拟合到不同应变幅度的多个应力数据集。他们没有通过梯度计算直接惩罚残差，而是通过应力的累积重构积分来强制执行控制方程，这消除了PINN公式中常用的显式初始条件约束，从而实现了更快的收敛。

本研究采用的弹粘塑性材料本构模型是Pierre Saramito提出的流行模型之一，该模型足够简单，甚至可以用于数值模拟。在该模型中，引入了一个控制狭缝（也称为固体摩擦元件）来表示屈服行为（图2c）。研究人员用τ表示归因于图2c中蓝色虚线框标记的模型下部的应力。考虑添加到τ的可恢复阻尼器（η）的应力贡献，总应力（σ）变为：σ = η + τ。在归因于τ的模型部分中，弹簧（G）与不可恢复的阻尼器（以红色图示，标记为η_p）串联。这个不可恢复的阻尼器本身与一个激活应力为τ₀的狭缝元件并联。当τ < τ₀时，狭缝保持静止，不让并联的η_p参与。因此，模型有效地简化为一个基于激活的G和η的线性开尔文-伏特（Kelvin–Voigt）模型。然而，当该部分施加的应力超过τ₀时，狭缝开始移动，允许图2c中的红色阻尼器激活，这为模型引入了不可恢复的塑性变形和非线性。τ的方程是一个有条件的麦克斯韦（Maxwell）模型。

考虑屈服作为不可恢复应变变得有效的点，可以将Saramito模型的屈服应力（σ₀）与τ₀关联起来：σ₀ = η_y + τ₀，其中y是狭缝被激活时的应变率，取决于频率和应变幅度。因此，取决于y，σ₀发生变化。需要注意的是，σ₀指的是塑性流动的开始，而不是从静止状态开始的流动。

虽然Saramito模型常用于表示EVP材料，但据研究人员所知，没有研究成功将该模型拟合到流变数据。例如，Cheddadi等人使用Saramito模型模拟泡沫流动，是根据先前的实验估算模型的参数，而不是拟合数据。这种方法不使用模型来预测流动行为，而是评估模型解释EVP行为的能力。在另一项研究中，Abdelgawad等人使用带有Herschel–Bulkley不可恢复阻尼器的Saramito模型模拟Pluronic F127溶液通过单个周期性波纹通道的流动，并从实验中估算模型的恒定参数。他们观察到流动场和速度剖面仅定性匹配，并未与实验数据完全一致。Fraggedakis等人尝试使用非线性回归方法将Carbopol数据拟合到Saramito模型，通过最小化实验与模拟动态模量之间的误差，而不是直接将模型拟合到应力数据。然而，这种方法失败了，为了解决这个问题，他们用一个各向同性-运动硬化（IKH）模型取代了线性狭缝控制阻尼器。虽然他们实现了令人满意的拟合，但这种方法在将模型拟合到数据的非线性区域中的G和G″时，仅考虑了应力的第一次谐波。

正如研究人员在结果与讨论部分所示，对于真实III型材料在所有应变幅度下，该模型没有唯一的单一参数集。这意味着在不同应变幅度下模型参数恒定的假设是无效的，因为底层的微观结构形成和变形可能是应变相关的。实验结果表明，模型的参数调整反映了其固有地捕捉不同变形幅度下粘弹性和塑性贡献连续演化的能力不足。

为了将Saramito模型扩展到更全面的版本，研究人员提出了一种更新模型的新方法。首先，他们提出了Saramito模型的每个组件与控制流变学的底层结构现象之间的物理意义对应关系。表1列出了Saramito模型每个元件中不同能量储存或耗散现象的例子。在乳液中，当材料结构可逆地变形时，在移除应力载荷后，能量和应变都保持可逆。这反映了弹性行为，可以用弹簧元件表示。相反，一些过程涉及能量耗散但不导致永久变形，例如胶体材料中颗粒的相互滚动，或颗粒向相邻空位的局部空位扩散。这些现象由可恢复阻尼器（即与弹簧并联的阻尼器）捕获。其余不可逆的结构分解导致同时的能量耗散和不可恢复的变形，这由不可恢复的阻尼器表示，它在屈服点以上被激活。

为了改进模型，研究人员建议引入一个非线性的应变率稀化可恢复阻尼器（η(γ?_e)）。该修正模型将与热力学第二定律保持热力学一致性。基于施加功率（P）和储存能量（S），模型必须满足：D = P ? ?≥ 0。其中γ_e是弹性应变，指与弹簧相关的总应变份额。通过推导，对于所有正值的η(γ?_e)，模型保持热力学一致性。对于修正的Saramito模型，他们将图2c（黑色阻尼器）中可恢复阻尼器的η重新定义为方程（9），以捕捉导致不可恢复阻尼器有效性减弱的底层连续结构分解：η(γ?_e) = η_∞ + (η₀ - η_∞)e^-γ?_e/*。在该方程中，η₀、η_∞和*分别表示零剪切粘度、无限剪切粘度和临界剪切率。为了进一步简化和减少参数，固定η_∞ = 0，因为期望在应变下失效的结构主要表现出不可恢复的能量耗散，可恢复阻尼器的贡献消失。虽然经典Saramito在屈服上下分别切换开尔文和麦克斯韦模型，但引入衰减的可恢复阻尼器使模型在开尔文和麦克斯韦之间平滑切换，中间呈现逐渐的Oldroyd转变。在结果与讨论部分，研究人员展示了对模型的这一修改使其能够表示从线性到非线性应变幅度区域的振荡行为。

为了验证所开发的模型，研究人员制备了油包水纳米乳液作为EVP材料的示例。第一步，他们在十二烷基硫酸钠（SDS）水溶液中混合25%体积分数的聚二甲基硅氧烷（PDMS），通过磁力搅拌形成粗乳液。下一步是通过超声处理进行均质化，将粗乳液转化为纳米乳液，直到达到平均液滴尺寸为125 nm。最后，他们让水相中的水在室温和恒定湿度下蒸发，将纳米乳液浓缩至40%体积分数。总SDS表面活性剂浓度在蒸发后调整为180 mM。制备样品后，使用平行板流变仪（Hybrid HR-3，TA Instruments）在10 rad s^?1频率下施加1%到100%范围的振荡剪切，以捕捉线性和非线性李萨如（Lissajous）曲线。由于HR-3流变仪是应力控制的，它产生噪声数据。研究人员还测试了其他典型的EVP样品，如卡夫真实蛋黄酱酱和高露洁全效牙膏。这些样品使用应变控制流变仪（ARES-G2，TA Instruments）测量，产生更干净、噪声更少的数据。

研究人员为拟合Saramito模型实现了两种定制的PINN算法，详见附录。第一种算法是对经典Saramito模型在单一应变幅度下应力数据的简单PINN拟合（图3）。第二种是一个两步方法（图4），用于将修正的Saramito模型同时拟合到多个应变幅度的应力数据。

研究人员首先通过拟合经典Saramito模型的合成数据来验证PINN拟合。图5a和b比较了拟合模型与使用参数集生成的合成数据。对应力随时间的拟合是可接受的，所有拟合变量都收敛到其相应的预期原始参考值。为了研究权重因子α对PINN性能的影响，他们在10⁴个epoch后比较了α在0.6到1.5范围内的四个值的拟合结果。尽管总损失有变化，但恢复的λ、η、η_p和τ₀值在不同α值下保持相对稳定，仅显示轻微偏差。这表明PINN的总体框架对于参数估计是足够鲁棒和稳定的。α = 0.6产生了最低的损失，估计参数非常接近预期值，表明它可能提供了数据拟合和物理模型约束执行之间最可靠的权衡。

研究人员观察到，当τ₀与弹簧中感应的应力相当时，在大应变幅度的振荡周期中观察到更显著的屈服转变。屈服在应力-应变李萨如曲线中产生更强的扭曲。为了在数据信息不足时改进参数恢复，研究人员提出了两步拟合方法：第一步，通过用开尔文-伏特模型拟合线性数据获得G和η；第二步，固定这些参数，用PINN拟合非线性屈服振荡应力数据以获得τ₀和η_p。该方法表现出更快的性能。

验证了合成数据方法后，研究人员评估了Saramito模型对真实III型材料的可信度。使用纳米乳液样品，图6a显示了在频率10 rad s^?1和各种应变幅度下拟合到实验应力的Saramito模型。对于这种真实的噪声数据，物理损失和数据损失之间的平衡防止了神经网络对显著噪声的过拟合，提供了适合不同样品的参数化和比较研究的平滑李萨如曲线。与合成数据不同，实验数据缺乏用于验证拟合模型有效性的系数的直接参考值。即使忽略这一挑战并假设可以在每个应变幅度下实现完美拟合，也会获得不同的拟合系数组合。因此，单步拟合（图6a）最多只能表示材料在该特定变形区域内的行为，并且算法可能在每次运行中收敛到各种拟合参数组合。

为了评估Saramito模型对真实III型材料的预测能力，研究人员在应变幅度0.5下拟合数据，然后将模型预测与更低和更高应变幅度下的实验数据进行比较（图6b）。模型在应变幅度低于0.5时显著低估应力大小，在应变幅度高于0.5时高估应力大小。然而，一个有意义的拟合模型应该能够使用相同的参数常数集预测未见过的实验数据。否则，它对于模拟和实际应用是无用的。

为了提出一个适用于所有应变幅度的有意义的拟合模型，两步拟合可能是一个合适的方法。研究人员接下来拟合了修正的Saramito模型，该模型假设了一个如方程（9）所示的衰减可恢复阻尼器。由于指数衰减函数，增加的参数数量使拟合复杂化。因此，他们使用了增强版的两步拟合框架（图4）。首先，可以在非常小的应变幅度（如0.01）的线性区域中将G和η₀拟合到模型。其余参数可以使用单独的PINN进行拟合，但使用针对非线性区域中多个应变幅度的聚合损失函数。这里考虑了等权重的累积损失函数，因此优化对所有应变幅度的敏感性相等。

图7a显示了用更新的衰减可恢复阻尼器拟合的Saramito模型与纳米乳液样品的拟合结果（50⁴个epoch）。除了修正Saramito模型的增强拟合外，两步方法还用单一参数集对从线性到非线性的广泛区域提供了公平的拟合。然而，在应变幅度0.1（弹性到塑性转变发生处）存在轻微预测偏差。这是由于假设恒定的不可恢复阻尼器和尖锐的屈服转变，这是为了避免过度参数化的权衡。

图7b和c还包括了对经典Saramito和KDR模型的拟合。通过采用类似的两步拟合方法来固定从线性数据拟合的参数，并将剩余参数拟合到非线性数据集，这两个模型都无法有意义地收敛。这些问题在于增强线性区域拟合的准确性会降低非线性区域拟合的准确性，反之亦然。

为了评估修正Saramito模型的不确定性，采用了Bootstrap分析。通过五次Bootstrap分析，阶段-1参数G和η₀在Bootstrap重复中保持不变。在阶段-2参数中，屈服应力τ₀、塑性粘度η_p和速率软化参数*在Bootstrap运行中显示出相对较小的变异性。根据表5，τ₀保持在约204–218 Pa的狭窄范围内，而η_p在约22.4至25.7 Pa s之间变化。

在图8中，研究人员展示了将修正Saramito模型拟合到卡夫真实蛋黄酱酱和高露洁全效牙膏的另外两个例子。两步拟合的输入数据应变幅度必须捕捉到从线性到完全屈服的区域。因此，应变幅度的选择取决于材料。例如，对于蛋黄酱，考虑了2的应变幅度以覆盖完全屈服区域。数据中的显著屈服是拟合模型的信息性模式。该模型作为III型软物质，显示了蛋黄酱的良好拟合。他们还包含了牙膏作为I型材料的例子，该模型仍然提供了可接受的近似，但在较高幅度下由于较小的屈服而精度较低。

在总结讨论部分，研究人员指出，本研究重新审视了用于建模EVP材料的Saramito本构方程，以克服传统EVP模型的关键局限性以及拟合这些模型时的可辨识性挑战。此外，他们讨论了单一拟合参数集无法描述从线性到非线性区域广泛应变幅度下的流动行为。因此，他们提出了Saramito模型的一个修改版本。为了解决更新模型的拟合复杂性，包括对噪声的敏感性、对数值不稳定梯度估计的依赖以及不连续屈服点带来的困难，研究人员引入了两步PINN拟合方法。他们表明，通过累积损失PINN拟合的修正Saramito模型能够用单一参数集捕捉线性和非线性区域。尽管在弹塑性转变附近存在轻微偏差，但该方法显著提高了预测能力，同时保持了物理解释性。这项工作强调，纳入应变依赖的可恢复性对于建模III型EVP材料至关重要，并提出了未来纳入频率依赖性以实现跨越应变和频率域的预测流变学研究的扩展方向。

热点排行