热泵辅助太阳能生活热水系统设计中机器学习替代模型的研究

《Energies》:Investigating Machine Learning Surrogates for the Design of a Solar Thermal DHW System with a Heat Pump Auxiliary

【字体: 时间:2026年06月09日 来源:Energies 3.2

编辑推荐:

  准确设计与性能评估热泵辅助太阳能生活热水系统通常需要瞬态模拟,因为系统行为取决于集热器特性、储热分层、控制逻辑、气象条件及用水时段等多重交互作用。月度简化方法如f-chart法可用于初步估算,但无法解析储热分层、恒温器运行及需求时段,在应用于分层恒温控制的系统

  
准确设计与性能评估热泵辅助太阳能生活热水系统通常需要瞬态模拟,因为系统行为取决于集热器特性、储热分层、控制逻辑、气象条件及用水时段等多重交互作用。月度简化方法如f-chart法可用于初步估算,但无法解析储热分层、恒温器运行及需求时段,在应用于分层恒温控制的系统时可能产生较大偏差。针对该类系统的可局部解释符号型与黑箱型替代模型家族的直接对比研究仍较为有限。研究人员从分钟级分辨率的年度MATLAB仿真中生成了包含10,982组案例的开发数据集,参数化变量包括集热器面积、光学效率以及一阶和二阶热损失系数。三种替代模型家族在统一协议下进行基准测试:随机森林辅助的形状约束符号回归(SR)、前馈人工神经网络(ANN)模型以及自动优化代数模型学习算法(ALAMO),并以f-chart法作为月度参考方法。预测目标为直接太阳热能定义下的12个月度太阳能保证率及对应的年度平均太阳能保证率,在独立的991组案例测试集上进行评估。SR实现了最低的平均误差(平均绝对百分比误差MAPE=0.82%;均方根误差RMSE=0.006),其次为ANN(MAPE=2.07%,RMSE=0.028)和ALAMO(MAPE=3.67%,RMSE=0.060),所有模型的纳什-萨特克利夫效率系数(NSE)均高于0.98。各模型单次目标评估耗时为0.0026–0.124秒,而一次完整年度模拟约需1000秒。这些结果确立了该研究在仿真器定义范围内的共同协议基准地位:SR具有最强的精度与局部符号可解释性,ANN保持灵活可再训练的优势,ALAMO则提供紧凑的代数评估形式及最短的学习模型运行时间。
太阳能辅助热泵技术为建筑生活热水供应提供了一种有前景的低碳解决方案,但其性能与经济性强烈依赖于气候条件、集热器规模及辅助参数配置。由于系统性能受太阳辐照、环境条件、集热器行为、储热动态、控制设定及用水时段等多重耦合、非线性且时变因素的共同影响,准确预测相关系统性能面临挑战。经典月度简化方法尤其是f-chart法因将问题简化为基于无量纲群的关联式,仍可用于快速初步估算与参数化研究,但当需要更高精度时,其基于月度平均的固有限制使其无法显式解析小时级需求时段、瞬态储罐温度,无法考虑储热分层或详细控制逻辑,动态仿真成为必要参考手段。然而详细年度仿真在需筛选大规模设计空间或嵌入更广泛决策支持工作流时计算负担沉重,这推动了对替代模型的研究兴趣,即在保持可接受精度的同时大幅降低计算成本,并兼顾计算速度、代数紧凑性、可解释性及优化或控制工作流的易集成性。

研究人员开展了热泵辅助分层太阳能生活热水系统替代模型的共同协议基准研究,以明确不同替代模型家族在预测精度、计算成本、局部符号可解释性、再训练灵活性、代数紧凑性及设计或优化工作流适用性方面的差异。研究结论包括:SR在独立测试集上展现出最高整体精度(MAPE=0.82%,RMSE=0.006,NSE=0.9999),同时提供局部可解释符号表示;ANN表现强劲(MAPE=2.07%,RMSE=0.028,NSE=0.9974),在需要再训练灵活性时更具吸引力;ALAMO精度相对较低(MAPE=3.67%,RMSE=0.060,NSE=0.988),但生成了最紧凑的显式代数替代模型且评估时间最短。三种替代模型均将单次评估时间从约1000秒的完整年度瞬态模拟大幅缩减至秒级以下(SR约0.124秒、ANN约0.0336秒、ALAMO约0.0026秒)。f-chart法在该系统中的评估显示其精度明显不足,表明月度压缩对于表征分层、恒温控制及负荷时段交互作用的系统过于粗糙。该研究发表于《Energies》( energies )期刊。

关键方法技术概述如下。研究样本来源于针对希腊雅典(38°N,24°E)2020年全年气象数据的分钟级分辨率年度仿真,采用基于TRNSYS组件库公式并在MATLAB R2023b中实现的物理仿真器,该仿真器源自Panaras等实验验证的系统模型。设计参数空间涵盖集热器面积(Ac,0.5–12 m2,19个水平)、光学效率(η0,0.50–0.87,17个水平)、一阶热损失系数(a1,1.2–8.2 W·m?2·K?1,17个水平)和二阶热损失系数(a2,0.006–0.020 W·m?2·K?2,2个水平),通过规则网格生成10,982组案例的开发数据集,另有991组独立参数组合作为测试集。

三种替代模型家族包括:形状约束符号回归(SR),采用随机森林筛选候选函数库,通过非线性最小二乘拟合局部一维符号形式,施加单调性与非负性约束,并基于条件变量网格插值构建最终预测器;前馈人工神经网络(ANN),使用MATLAB fitrnet框架为13个目标输出分别训练独立网络,经超参数调优后采用双隐层(4和24个神经元)、双曲正切激活函数、标准化输入及L2正则化的配置;以及自动优化代数模型学习算法(ALAMO),通过基于优化的稀疏基函数选择构建紧凑代数模型,采用倒数变换后进行稀疏代数拟合。性能评估采用平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、最大绝对百分比误差(MXAPE)及纳什-萨特克利夫效率系数(NSE)等指标,以f-chart法作为月度参考基准进行对比。

研究结果部分围绕以下方面展开。

f-chart基准评估显示,在采用适用范围内,f-chart预测与瞬态仿真参考适度一致(N=4928,MAE=0.023,RMSE=0.037,NSE=0.743);在范围外案例中偏差显著增大(N=6054,MAE=0.144,RMSE=0.167,NSE=0.705)。两种情况下预测值均主要位于1:1线上方,表明f-chart对该分层恒温控制系统存在系统性高估,这是由于恒温控制的热泵辅助与子系统并联竞争负荷覆盖,而非f-chart隐含的串联跟随关系。

替代模型准确性方面,所有三种学习替代模型在独立测试集上均与参考仿真器高度吻合(NSE>0.98)。SR整体误差最低,ANN保持竞争力且易于再训练,ALAMO提供最快的显式代数替代模型。SR构建为变系数形状约束加性模型,三个子模型分别由关于Ac、η0、a1的显式一维符号表达式表示,通过条件空间插值组合。ANN为灵活非线性函数逼近器。ALAMO生成显式单表达式替代模型,月度模型约24–38项,年度目标约30项。

误差分层分析显示,按太阳能保证率水平分层,绝对误差随保证率增加而增大,但SR在高保证率范围相对更精确,ALAMO在中高响应范围显著恶化,ANN保持中间行为。按季节分层,SR和ANN的MAE与MAPE在夏季最大,与高强度辐照条件下系统更强非线性行为一致;ALAMO的相对误差延续至夏季以后,在年度输出中达到最大平均偏差。

极端误差案例分析表明,ANN和ALAMO的最大偏差出现在a1=1.2 W·m?2·K?1与a2=0.02 W·m?2·K?2的混合边界案例,指向局部 collector 损失欠惩罚而非均匀月度偏差;SR的八月案例绝对误差小但参考值低导致百分比误差放大。

计算效率方面,单次目标平均评估时间SR约0.124秒、ANN约0.0336秒、ALAMO约0.0026秒,均远小于约1000秒的完整年度瞬态模拟。SR构建过程劳动强度最大,涉及候选函数筛选、重复局部符号拟合及不成功拟合的重运行。

讨论部分,研究人员指出月度方法在早期设计中仍有价值,但f-chart法对该系统过于粗糙。研究澄清了替代模型类型间的实际权衡:SR偏向精度与局部可解释性,ANN偏向灵活再训练,ALAMO偏向紧凑快速代数评估。研究局限性包括基准限定于雅典2020单气候单一年份、单一用水模式、单一储罐表征及单一控制策略,a2采样分辨率有限。替代模型可辅助优化与决策支持,建议分阶段工作流:ALAMO用于快速筛选或粗优化,SR或ANN用于有前景区域的高精度精炼,有限次数的完整瞬态仿真用于最终验证。未来工作可扩展至多气候多年份、多用水模式、多储罐配置及控制设定,增加a2采样水平,测试基于相对误差的训练目标,纳入更多替代模型基线,并与实测现场运行进行比较验证。

研究结论翻译如下:该工作的贡献在于针对确定的热泵辅助分层太阳能生活热水系统,对三种替代模型家族进行了受控的共同协议基准测试。在建模设计范围内,所有三种学习替代模型均能紧密再现分钟级分辨率瞬态仿真器,同时将评估时间降低数个数量级。SR在独立测试集上提供了最高的整体精度(MAPE 0.82%,RMSE 0.006,NSE 0.9999),同时提供局部可解释符号表示。ANN同样表现强劲(MAPE 2.07%,RMSE 0.028,NSE 0.9974),在再训练灵活性重要时仍具吸引力。ALAMO在该基准中精度较低(MAPE 3.67%,RMSE 0.060,NSE 0.988),但生成了最紧凑的显式代数替代模型且学习模型评估时间最短。平均单次目标评估时间SR约0.124秒、ANN约0.0336秒、ALAMO约0.0026秒,而一次完整年度瞬态模拟约需1000秒。在单独的开发集f-chart评估中,月度关联对该系统明显不够准确,表明月度压缩对于此处表征的分层、恒温控制和负荷时段组合过于粗糙。

这些应用特定发现并未识别出普遍更优的替代模型。在测试的仿真器设定中,当需要可检查的局部响应行为时SR最适合,当灵活再训练重要时ANN最适合,当紧凑代数形式和高吞吐量评估优先时ALAMO最适合。不同的恒温设定点、用水时段、储热配置或气象条件定义了新的运行案例,而非预训练替代模型的直接迁移案例。未来工作可将基准扩展至多种气象、需求、储热和控制变体,纳入更多替代模型家族并采用相同协议,并将仿真器确定的排序与实测现场运行进行比较。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号