《Advanced Intelligent Systems》:Tandem Neural Network Rapidly Solves Multivalued Inverse Problems: Application to Oxide-Semiconductor Characterization
编辑推荐:
半导体器件的逆分析通常遭受非唯一解困扰,即在大规模参数空间内 known as 多值性(multivaluedness)。研究人员展示了一种串联神经网络(tandem NN),该网络将预训练正向模型耦合至逆模型并联合最小化预测与重建损失,克服了非晶 In–Ga
半导体器件的逆分析通常遭受非唯一解困扰,即在大规模参数空间内 known as 多值性(multivaluedness)。研究人员展示了一种串联神经网络(tandem NN),该网络将预训练正向模型耦合至逆模型并联合最小化预测与重建损失,克服了非晶 In–Ga–Zn–O 薄膜晶体管的这一挑战。网络训练于 1000 条模拟转移曲线,覆盖六个本征材料参数,变化范围比之前研究宽三至五个数量级,能在小于 1 ms 内从单条电流–电压曲线推断多个物理参数,决定系数 R2 = 0.99。推断参数无需额外拟合即可重现实验室制备器件的实验电流–电压特性,确认了物理有效性。与传统技术计算机辅助设计(TCAD)迭代拟合相比,串联神经网络提供了显著加速,并为材料发现的自主实验、下一代晶体管制造中的数字孪生框架以及其他多值逆问题领域铺平了道路。
在半导体与晶体管工艺开发中,快速准确地求解逆问题对于器件优化至关重要。逆问题指从观测或测量结果推断未知因果参数,传统策略通常通过反复求解正向问题来迭代优化输入参数,直至模拟输出匹配实测结果。然而,这种基于有限元方法(FEM)的模拟计算成本高昂,涉及复杂器件结构与非线性微分方程求解,极其耗时。尽管机器学习(ML)被用于开发更快的代理模型,但现有方法在实际工艺开发周期中适用性有限。主要限制在于“多值性”问题,即单一器件特性可能源于多组不同的材料参数,导致现有 ML 模型仅在极窄的参数范围内训练成功,远小于实际半导体器件所需的范围,严重限制了对实际器件的分析能力。
针对上述挑战,研究人员在《Advanced Intelligent Systems》发表论文,开发了一种神经网络模型,用于从晶体管参数快速直接地进行半导体参数的多值逆分析。研究人员采用串联神经网络(tandem NN),将预训练正向模型与逆模型耦合,并在总损失函数中适当加权预测误差与重建误差。研究结果表明,该方法实现了极快(0.1 ms 量级)且高精度(决定系数 R
2 > 0.99)的逆分析,预测值落在物理合理范围内。这不仅加速了半导体制造中的数字孪生应用和自主实验平台,也为材料研究领域的突破性进展铺平了道路。
为开展研究,研究人员主要关键的技术方法包括:利用 TCAD 模拟器生成 1000 组涵盖六个本征材料参数(缺陷态密度与输运参数)的模拟数据;构建包含三个隐藏层的多层感知机回归模型;引入重建损失函数优化权重比;并在实验室制备了五种不同沉积条件的非晶 In–Ga–Zn–O(a-IGZO)薄膜晶体管样本用于实验验证。
研究结果具体如下:
2.1 数据集准备与正向神经网络训练:研究人员在比之前研究宽 3 至 5 个数量级的物理合理范围内随机采样参数,生成了多样化的缺陷分布与电流 - 电压曲线。训练后的正向神经网络对所有晶体管参数预测精度极高,R
2 大于 0.99,为后续逆问题验证奠定基础。
2.2 串联逆神经网络模型训练:鉴于多值性导致直接逆预测不准,研究人员引入重建过程验证逆预测精度。简单逆模型重建误差较大,而串联神经网络通过连接预训练正向网络,最小化重建误差,显著提升了逆预测一致性。
2.3 损失函数中权重比优化:研究人员 investigated 权重比对预测偏差的影响。当权重比 w
Y/w
X 等于 10 时,所有参数标准化平均误差接近零,无整体高估或低估倾向,被选为最优条件。
2.4 半导体参数的多值性:分析显示多值性源于晶体管特性对某些参数不敏感或参数间强相关性。优化后的模型能有效抑制主导晶体管操作参数的多值性,弱影响参数也能预测在物理合理范围内,这对晶体管设计优化至关重要。
2.5 串联神经网络逆分析效率:该模型训练与预测速度显著快于传统 TCAD 基于优化的方法,且仅需 400 个训练样本即可维持高性能,大幅减少了数据集生成的模拟时间。
最后,研究人员总结讨论部分并翻译研究结论。研究人员将串联逆神经网络应用于实验室制备晶体管分析,反演得到的半导体参数重现了实验电流 - 电压特性,且能预测未用于分析的输出特性,证实了物理有效性。结论表明,研究人员开发了一种神经网络模型来解决基于晶体管参数的半导体参数分析相关的多值逆问题。简单逆神经网络无法通过简单交换描述符和目标变量来预测半导体参数。通过使用串联神经网络架构,将预训练正向神经网络连接至简单逆神经网络,并在训练期间将预测误差和重建误差纳入损失函数,研究人员实现了半导体参数的高精度预测,并在优化权重值处解决了问题的多值性。此外,通过调整损失函数中的权重比,研究人员确认在训练数据范围内可获得物理合理的结果。该模型无需任何优化步骤即可直接分析多值逆问题,支持大规模工业数据的一次性运行分析,为实时监测应用铺平了道路。尽管模型在外推参数范围上泛化能力有限,但其简单架构支持小数据集快速训练,框架具有广泛适用性。