《Engineering》:Active Learning-Assisted High-Throughput Construction of Multi-Component Non-Equilibrium Phase Maps
编辑推荐:
具有非平衡相(non-equilibrium phases)的材料,例如金属玻璃(metallic glasses),近年来因其优异的力学、物理和化学性能而引起了广泛关注。非平衡相图(non-equilibrium phase map)对于加速开发这些材料的可
具有非平衡相(non-equilibrium phases)的材料,例如金属玻璃(metallic glasses),近年来因其优异的力学、物理和化学性能而引起了广泛关注。非平衡相图(non-equilibrium phase map)对于加速开发这些材料的可行合成策略非常理想。然而,由于需要对广阔搜索空间进行全面调查,快速构建此类相图仍然具有挑战性。虽然高通量组合实验技术(high-throughput combinatorial experimental techniques)提供了一条加速途径,但通过将其与主动学习(active learning)相结合,可以大幅提高其效率。在本研究中,研究人员提出了一种主动学习框架,该框架将高通量实验方法与元胞自动机(cellular automata, CA)算法相结合,用于快速生成非平衡相图。该框架在来自五个多组分材料系统的高通量实验数据集上进行了验证。它仅使用穷举网格遍历所需数据点的一小部分就构建了准确的相图,达到了100%的准确率,并表现出优异的泛化能力和鲁棒性。
非平衡相材料(如金属玻璃(metallic glasses))因具有优异的力学、物理和化学性能而受到广泛关注,但非平衡相图(non-equilibrium phase map)的构建对开发其合成策略至关重要。传统方法依赖试错,在多组分系统中耗时且成本高;高通量实验结合主动学习(active learning)可提升效率,但现有策略需专业知识和参数调整。本研究提出一种整合高通量实验与元胞自动机(cellular automata, CA)的主动学习框架,用于快速构建非平衡相图。研究人员利用该框架在五个多组分材料系统(数据集I–IV来自高通量离子束沉积(IBD)系统,数据集V来自参考文献[38])上验证,仅用极少数据点即实现100%准确率,并具备优异泛化性与鲁棒性。该研究发表在《Engineering》上。
主要关键技术方法包括:①高通量离子束沉积(IBD)制备具有连续成分分布的组合样品,结合退火处理;②实时相识别:通过X射线衍射(X-ray diffraction, XRD)获取二维图案,转换为一维强度–2θ(散射角)曲线,经背景扣除、滚动球算法去噪、小波滤波后,拟合峰参数(半高宽FWHM、峰高),与标准粉末衍射文件(PDF)卡匹配确定相结构;③元胞自动机(CA)模型:基于Delaunay三角剖分生成三角形网格,定义邻居关系;模式I采用二分法沿样品边缘搜索相边界种子点;模式II从种子点向内传播,通过采样共同邻居并依据相识别结果更新种子点,直至所有边界完成。
**3.1 模型性能**:以数据集I为例,通过初始化、模式I沿Cu–Co边缘搜索相边界种子点、模式II向内扩展边界等步骤,CA模型仅用386个数据点(全网格1326点)即精确勾勒所有相边界,利用率达97.3%,表征率24.8%,与穷举网格搜索100%一致。对数据集II–IV的验证显示,利用均超94%,说明该方法高效、准确、无需参数调整,且效率接近理论极限。
**3.2 模型泛化能力**:将CA方法应用于数据集V(多边形样品、初始方形网格),通过Delaunay三角剖分转换为三角形网格后,采用相同流程(模式I沿边缘搜索、模式II向内扩展),成功构建非平衡相图,证明该方法适用于任意形状样品和网格分布,具有良好的泛化性。
**3.3 模型鲁棒性**:在数据集II中随机插入20个“无法识别相”点模拟噪声或损坏,CA算法将其视为第三相并生成新种子点对,绕过障碍仅额外增加12个表征点(总从329增至341),且不影响相边界准确性,证明算法对不完美数据具有鲁棒性。
**讨论与结论**:讨论部分指出,CA方法的主要优点包括:基于相律而非纯数学计算,提供物理稳健的边界确定基础;直接实验测量消除不确定性;无可调参数,避免参数优化误差。其结构简单、计算高效,适合实时自适应实验设计。结论翻译如下:在本研究中,研究人员开发了一个高通量框架,用于快速构建非平衡相图,该框架将主动学习与CA模型相结合以指导自适应采样。其主要优点(高效率、无可调参数、直接可解释性)直接源于这种结合。该框架在五个跨越不同复杂系统的大型数据集上成功验证。结果表明,CA算法通过可靠追踪相边界并动态优化实验设计,将相图构建速度提升了一个数量级。该框架对推动转变动力学理解和加速材料研发具有重要前景。由于数据分析模块是模块化和可替换的,自动化每一步没有根本障碍,为完全自主智能系统实现高效性能图构建和材料筛选铺平道路。此外,将该方法与原位实验结合对于实现实时、即时材料研究至关重要。