《Eng》:Artificial Neural Network and Non-Dominated Sorting Genetic Algorithm II for the Multi-Objective Optimization of the Graphics Processing Unit Thermal Cooling
编辑推荐:
本文提出了一种实验性的智能优化方法,以提高超频图形处理器(GPU)的热冷却性能。研究人员构建并测试了一个闭环液冷系统,该系统使用去离子水和银(Ag)纳米流体冷却剂(0.015% vol.),在不同鳍片间距的微通道热沉拓扑结构下进行实验。关键热性能指标包括GPU
本文提出了一种实验性的智能优化方法,以提高超频图形处理器(GPU)的热冷却性能。研究人员构建并测试了一个闭环液冷系统,该系统使用去离子水和银(Ag)纳米流体冷却剂(0.015% vol.),在不同鳍片间距的微通道热沉拓扑结构下进行实验。关键热性能指标包括GPU温度、冷却剂出口温度和热阻,在不同冷却剂流量下进行了测量。实验表明,提高流速和减小鳍片间隙显著增强了冷却性能,而Ag纳米流体相比水持续降低GPU温度1–3 °C。研究人员利用实验数据构建并训练了人工神经网络(ANN)替代模型,以支持预测分析和系统优化,实现了低均方根误差(RMSE)的优异预测精度。训练好的ANN模型与非支配排序遗传算法II(NSGA-II)相结合,进行多目标优化,旨在最小化GPU温度和热阻的同时提高热量移除效率。Pareto最优解揭示,基于纳米流体的冷却提供了最佳的折衷条件,最优设计出现在中等流速和较小鳍片间距下。ANN-NSGA-II多目标优化结果表明,GPU冷却系统的最佳热性能在使用Ag纳米流体(0.015 vol.%)作为冷却剂时实现,最优冷却剂流速范围为1.30–1.84 LPM,最优鳍片/通道间距为0.57–0.71 mm,产生的GPU温度为29.18–29.66 °C,冷却剂出口温度为29.06–29.41 °C,最小化热阻为0.0106–0.0152 °C/W;因此,总体而言,所提出的ANN-NSGA-II框架作为改进GPU冷却系统的实用设计工具表现良好,并可应用于其他高散热通量电子热管理应用。
本研究聚焦于高散热通量电子热管理领域,针对现代电子器件向小型化、高速化、高密度化发展趋势下GPU散热面临的严峻挑战开展研究。随着下一代GPU系统热流密度显著增加,传统空冷技术热耗散能力不足,而现有研究多集中于独立热增强机制或简化系统的分析,缺乏在实际超频高散热通量条件下对GPU液冷平台进行系统优化,更鲜有将智能数据驱动优化方法融入其中的探索。为此,研究人员开发了一种经实验验证的ANN-NSGA-II智能优化框架,结合Ag纳米流体强化传热与微通道热沉几何优化,为下一代GPU热管理系统提供实用的设计方法学。
在技术方法层面,研究人员首先基于自建实验平台获取实测数据。实验对象为搭载MSI显卡的开放式测试平台,构建包含GPU冷却模块、泵、散热器和超声波振动器的闭环液冷回路。测试采用去离子水及0.015 vol.% Ag纳米流体两种冷却剂,在0.5–3.0 LPM流速范围内,对无鳍片及鳍片间隙0.5、1.0、1.5 mm的微通道热沉配置进行热性能测试,关键测量参数包括GPU温度、冷却剂进出口温度及系统热阻。在ANN建模环节,采用双隐层前馈神经网络结构,输入变量为冷却剂类型、冷却剂流速和热沉鳍片间距,输出变量为GPU温度(T
GPU)、冷却剂出口温度(T
out)和系统热阻(R
th)。通过网格搜索法比较16种候选架构,最终选定[20, 10]神经元配置作为最优替代模型,采用 min-max 归一化处理,数据集按70:15:15比例划分为训练、验证和测试集。优化阶段采用NSGA-II进化算法,以最小化GPU温度和热阻、最大化出口温度为优化目标,设置种群规模为300,迭代200代,通过非支配排序、拥挤距离机制和精英保留策略维持解集多样性,并基于欧氏距离法从Pareto前沿中遴选最均衡的工程解。
研究结果部分,"实测数据分析"显示:GPU温度随冷却剂流速增加而降低,微通道热沉各鳍片间隙配置均优于无鳍片情况,其中0.5 mm鳍片间隙表现最佳;Ag纳米流体在各工况下均优于去离子水,低流速下热增强效果更为显著,GPU温度降低约1–3 °C。热阻变化趋势与之一致,纳米流体系统热阻更低。进一步分析揭示,流速与GPU温度、热阻呈显著负相关(相关系数分别为?0.59和?0.66),鳍片间隙与两者呈正相关(0.54和0.57),而GPU温度与出口温度的关联(0.42)反映热源至流体的热量传递。"ANN预测分析"表明:经网格搜索优化的[20, 10]架构在T
GPU、T
out和R
th预测上取得最佳平衡,GPU温度预测R2达0.9053、RMSE为0.3614 °C,出口温度预测R2为0.8408、RMSE为0.3421 °C,热阻预测RMSE为0.024 K/W。等值线图分析揭示,纳米流体在高流速、窄鳍片间隙条件下具有更优的GPU冷却潜力,且能快速降低系统热阻。"NSGA-II优化过程"部分展示了算法的收敛行为和种群多样性演化,确认优化过程稳定收敛。Pareto最优解集中于低GPU温度和低热阻区域,通过欧氏距离法筛选的最优解位于T
GPU≈29.3 °C、R
th≈0.014–0.016 °C/W。表8列出的前十项最优解均纳米流体作为冷却剂,最优流速1.30–1.84 LPM,最优鳍片间距0.57–0.71 mm,对应GPU温度29.18–29.66 °C、出口温度29.06–29.41 °C、热阻0.0106–0.0152 °C/W,各解与理想点距离非常接近,体现了优良的多目标平衡特性。
在讨论部分,研究人员分析了实际工程中的热电液力权衡问题:更小鳍片间隙和纳米流体虽提升热性能,但可能增加流动阻力、压降和泵功消耗;纳米流体还可能带来黏度增加、颗粒团聚、沉积堵塞等长期运行问题。研究局限性包括:实验基于单一GPU平台和有限工况范围,结果泛化性有待验证;未开展全面的热电液力分析,压降、摩擦因子和泵功等参数未直接测量;Ag纳米流体长期稳定性未充分评估;ANN模型主要适用于训练数据覆盖的设计空间,外推预测存在不确定性。未来研究方向建议包括:扩展至不同GPU架构和更广泛工况、深入纳米流体微观传热机理研究、开展长期循环稳定性与泵耐久性实验、融合深度学习等先进AI技术提升模型鲁棒性,以及将经济成本、能耗、可持续性等因素纳入综合优化框架。
研究结论部分总结:本研究通过实验和数值方法评估了超频GPU闭环液冷系统的热性能,对比了去离子水和Ag纳米流体(0.015 vol.%)在不同微通道热沉鳍片间隙配置下的表现。结果证实较高冷却剂流速和较小鳍片间隙通过改善强制对流和增加有效传热面积显著降低了GPU温度和热阻;Ag纳米流体持续优于水,降温1–3 °C。基于实验数据构建的ANN替代模型对T
GPU、T
out和R
th具有优异预测精度;结合NSGA-II获得的Pareto最优解表明,最优性能出现在流速1.30–1.84 LPM、鳍片间隙0.57–0.71 mm条件下,GPU温度达29.2–29.7 °C,热阻低至0.0106–0.0152 °C/W。该ANN-NSGA-II数据驱动优化框架减少了试错实验,可为高性能GPU冷却提供实用设计指导,并可扩展至CPU、电力电子、电动汽车元件等其他高散热通量电子热管理系统,以提升可靠性、稳定性和能效。