先进的核反应堆,特别是钠冷快堆(SFR),由于其优越的中子经济性、增殖能力和通过嬗变有效管理长寿命放射性废物的潜力而受到广泛关注(Woodhead, 2016)。ABR-1000是一种1000 MWth的SFR,采用钍、铀、钚和锆组成的金属燃料合金,并采用轴向异质配置。这种设计在保持满意运行寿命和高增殖潜力的同时,具有良好的防扩散特性(Niloy等人,2023)。然而,要实现最佳性能,关键在于有效的燃料装载策略,这些策略需要在维持目标临界性范围内的同时最小化功率峰值因子(PPF)和有效增殖因子(keff)。
传统反应堆设计由于均匀富集模式,常常导致过高的PPF值,这可能导致燃料加速降解、热裕度降低以及潜在的安全限值突破。为了解决这一问题,研究人员提出了空间优化的富集分区方法来重塑反应性和功率分布(Aziz等人,2024)。然而,ABR-1000活性堆芯中有150个燃料组件,每个组件都可以具有离散的富集值,这造成了巨大的离散搜索空间,使得暴力搜索在计算上不可行。这种复杂性促使人们应用先进的元启发式算法和基于机器学习的替代模型来高效识别优化装载模式。
元启发式算法在反应堆燃料管理中的应用已经得到了广泛研究,遗传算法(GA)被证明是核工程中最成功的优化方法之一。Khoshahval等人(2010)开发了一种连续粒子群优化方法,用于PWR燃料管理,在保持keff和功率峰值因子操作约束的同时,有效实现了功率平滑。Rahmani(2017)通过优化VVER-1000反应堆在瞬态周期内的重新装载模式,引入了一种创新的权重因子方法,实现了径向功率分布的平滑,并确保了整个周期内的安全功率峰值因子。Do和Nguyen(2007)应用了改进编码程序的GA,成功解决了燃料重新装载优化的实际问题,通过精英选择和修改的交叉操作平衡了keff的最大化和PPF的最小化。最近,GA的应用扩展到了先进的快堆概念。Islam(2025)成功利用GA与OpenMC相结合,优化了气体冷却快堆(GFR)的燃料装载模式,证明GA可以在保持临界性的同时显著降低PPF。Pereira和Lapa(2003)探索了用于反应堆堆芯设计的粗粒度并行遗传算法,证明分布式GA实现不仅节省了计算时间,而且与顺序方法相比优化效果更佳。Poursalehi等人(2013)引入了Harmony Search算法作为PWR装载模式优化的另一种元启发式方法,与GA和PSO相比表现出竞争力,并在与节点扩展方法结合时具有更快的收敛速度。Chapot等人(1999)提出了基于GA的PWR燃料管理的创新List Model,避免了启发式交叉操作,仅生成有效的、非重复的装载模式,成功优化了Angra 1发电厂的重新装载。
认识到不同元启发式算法的互补优势,研究人员越来越多地探索混合优化框架。Jamalipour等人(2013)开发了量子粒子群优化(QPSO),用于WWER-1000的功率分布平滑,引入了一种变异操作(QPSO-DM),其性能优于经典PSO和标准QPSO。Gong等人(2016)提出了遗传学习粒子群优化(GL-PSO),通过双层架构有机结合了PSO和GA,遗传操作生成高质量的样本,增强了全局搜索能力和42个基准函数上的搜索效率。Hewahi和Hamra(2017)证明,先应用GA再应用带有反向传播精化的PSO可以克服局部最小值问题并提高神经网络分类精度。Roy等人(2011)引入了一种专为多目标组合优化设计的离散PSO算法,使用映射方法将离散变量转换为连续域,与SPEA和NSGA-II相比表现出更好的性能。
为了减少大规模优化搜索所需的计算负担,基于机器学习的替代建模已成为关键工具。除了优化之外,机器学习在通过快速瞬态检测和分类提高反应堆安全性方面也显示出巨大潜力。例如,Yavuz和Lüle(2025)证明了随机森林和K最近邻分类器在识别轻水反应堆瞬态子场景以支持操作员决策方面的有效性。进一步扩展,Yavuz和Lüle(2026)比较了多种ML架构,包括梯度提升和多层感知器,使用多步骤识别方法在VVER-1000系统中实现了高精度的瞬态水平确定。Radaideh和Kozlowski(2020)率先应用深度高斯过程(DeepGP)进行先进核模拟的替代建模,即使在数据量有限的情况下也能实现高精度,并自动捕获替代模型的不确定性。Li等人(2024)通过提出一种使用机器学习的中子动力学计算新方法,利用时变特性参数化空间功率变化,并结合卷积和循环神经网络,实现了1D、2D和3D反应堆模型上的准确功率预测。
Ortiz和Requena(2004a)开发了一种用于BWR燃料重新装载优化的顺序编码遗传算法,将优化与在反应堆模拟器行为上训练的神经网络相结合,大幅减少了计算时间,同时保持了可接受的精度。Ortiz和Requena(2004b)使用多状态循环神经网络扩展了这种方法,优化了BWR装载模式,提出了一种依赖于燃料组件位置和核截面的能量函数。Pang和Rybarcyk(2014)比较了多目标PSO与NSGA-II在LANSCE直线加速器优化中的应用,证明MOPSO在收敛速度上更快,达到了类似的帕累托前沿。Babazadeh等人(2009)应用改进的PSO处理离散变量,用于VVER燃料装载模式设计,成功实现了具有PPF和keff约束的多目标优化。
基于这些进展,本研究提出了一个结合机器学习辅助替代建模的ABR-1000轴向异质金属燃料堆芯的混合GA-PSO优化框架。该框架引入了几个关键因素:(1)在交替优化阶段之间进行双向精英解播种的有机GA-PSO混合;(2)对九种机器学习算法(KNN、Ridge Regression、Random Forest、GBM、XGBoost、CatBoost、SVR、GPR、DNN)的全面替代模型比较,分别优化keff和PPF预测;(3)特征工程,将150维的富集向量简化为5维特征集,捕捉空间富集特性;(4)自适应智能变异,根据替代模型预测的临界性偏差动态调整变异率和方向偏差;(5)通过500次混合优化循环的周期性OpenMC验证进行迭代替代模型细化。
GA组件通过基于多样性的锦标赛选择进行离散富集设计空间的稳健全局探索,基于区域的交叉尊重堆芯物理结构,并由替代模型预测的反应性引导智能变异。PSO组件通过基于离散Sigmoid的位置更新进行局部细化,同时限制速度,收敛到接近临界操作的燃料装载模式,同时最小化功率峰值。机器学习替代模型作为目标函数评估的快速估计器,使得每个周期可以进行数千次虚拟堆芯评估,而无需直接进行蒙特卡洛计算。这种混合安排使得在优化过程中能够高效评估模型精度并进行适应性改进,通过高保真度的OpenMC模拟定期验证和细化替代模型,确保物理一致性。
最终,本研究旨在识别一种富集模式,该模式在保持keff在目标范围内的同时,显著降低PPF,提高空间功率均匀性,增强安全裕度,并实现更高效的反应堆运行。结果表明,智能的、替代辅助的混合优化可以显著提高SFR的性能,同时有效探索复杂的高维设计空间。这种方法提供了一个适用于先进快堆设计的综合框架,在计算上比传统方法具有显著优势,同时通过蒙特卡洛耦合保持了严格的物理验证。