基于多年代际观测的sAMY框架:一种结合RS-VAR与日尺度气候强迫的建筑能耗模拟随机天气生成器

《ENERGY AND BUILDINGS》:Scenario-Conditioned Actual Meteorological Years (sAMY): A Stochastic Weather Generator Using Multi-Decadal Observations

【字体: 时间:2026年04月25日 来源:ENERGY AND BUILDINGS 7.1

编辑推荐:

  本研究针对气候模型输出与建筑能耗模拟(BES)之间存在的“分辨率鸿沟”——即气候模型通常提供粗空间分辨率(约25–200 km)的日均数据,而BES需用点位置的小时级天气文件——提出了一种“情景驱动的实际气象年(sAMY)”框架。该框架利用多年代际(20–68年)站点观测数据学习小时级协方差结构,通过“状态切换向量自回归(RS-VAR)”分离观测训练得到的小时结构与日尺度气候强迫信号,并结合卫星太阳辐射数据(NSRDB,4 km)生成连续、随机、多模型兼容的未来天气序列(2011–2100)。验证表明,sAMY在温度RMSE上较基准(Annex 80)降低了79%(0.79 °C),太阳辐射偏差降低了64%,且在多气候区(地中海、热带、大陆性)与多模型(CORDEX、CMIP6)测试中表现稳健。该工作为保留观测真实性与气候信号保真度的气候知情天气文件提供了一条可重复的技术路径。

  
气候变化正为建筑设计与运营带来根本性挑战。全球变暖不仅体现在平均状况的逐渐偏移,还表现为极端天气事件频率、强度与持续时间的改变。这种室外热环境的变化必然会传导至室内,改变建筑热状况,加剧过热与不舒适的风险,这突显出一个迫切需求:需要可靠的未来天气数据,既能捕捉逐渐变暖的趋势,也能反映不断变化的变异模式,以支持气候知情的建筑性能评估。
建筑能耗模拟(Building Energy Simulation, BES)依赖于描述特定或代表性年份中当地温度、太阳辐射和湿度条件的小时级天气文件。传统的典型气象年(Typical Meteorological Year, TMY)文件基于气候平稳性假设,但随着观测条件日益偏离历史基线,这一假设已越来越站不住脚。然而,生成可信的未来天气文件面临一个根本的模型与应用不匹配问题:来自全球和区域模型的气候预估工作在粗空间分辨率(约25–200 km网格)和日或次日时间尺度上,而建筑模拟需要在特定点位置的小时级数据。如何将气候信号从粗尺度的预估传递到精细尺度的建筑天气,同时保留真实的次日内变率,仍然是一个核心的方法学挑战。
研究界已针对这一挑战提出了多种应对方法。变形方法及其变体因能高效地将预估的气候变化转化为模拟可用的天气文件而仍被广泛使用。经典的变形通常将月或季节变化因子应用于基线文件,而较新的实现则可以纳入更精细的时间调整。国际能源署建筑与社区节能计划(IEA EBC) Annex 80 等项目通过提供标准化的TMY和热浪年文件扩展了这一生态系统。随机天气生成器(Stochastic Weather Generators, SWGs)则提供了更大的灵活性,它们从观测中学习统计关系,生成保留观测统计特性的合成天气序列,天然支持用于不确定性量化的集合生成,并能产生任意长的序列用于年际变率分析。然而,大多数SWG为农业或水文应用而设计,运行在日分辨率,无法直接提供建筑模拟所需的小时级输入。因此,每种方法服务于不同的优先级,包括标准化的代表性文件、变换的基线年份或随机集合,这激励了为需要连续多年序列、观测学习的小时协方差和情景灵活强迫的应用开发互补的方法学。
为此,研究人员引入了情景驱动的实际气象年(scenario-conditioned Actual Meteorological Year, sAMY)框架,这是一种旨在弥合这一差距的随机天气生成方法。该框架采用明确的三项分解:(1)从多年站点记录中获取的观测衍生的气候学,捕捉当地的季节-日循环模式;(2)来自状态切换向量自回归(Regime-Switching Vector Autoregression, RS-VAR)的随机异常,该模型学习小时级多变量协方差结构;(3)从用户指定的气候预估中提取的日尺度气候信号。这种架构将观测训练的小时结构与外部气候强迫分离开来:本地协方差和持续性从历史站点数据中学习,而长期趋势和日解析的气候异常则通过模块化的信号整合引入。该框架生成的多年连续未来天气序列(2011-2100)既保留了时间持续性,也保留了多变量依赖性,从而能够在现实条件下评估热恢复力。在12公里到200公里分辨率的CMIP5和CMIP6预估中,相同的统计核心无需重新训练即可被“条件化”。该框架已针对独立观测进行了验证,并在跨越不同气候区的四个北美城市中与基于变形的代表性工作流程进行了基准测试。
为了开展这项研究,研究人员主要运用了以下几个关键技术方法:1. 利用美国国家海洋和大气管理局综合地面数据库(ISD)提供的多年(如30年)小时级地面气象观测数据(如温度、气压、湿度、风速)作为训练和验证的基础,区分基线学习期(如1991-2010)和独立验证期(2011-2020)。2. 采用状态切换向量自回归模型,从观测数据中学习多个气象变量(温度、气压、风速、太阳总辐射、相对湿度、比湿)之间的小时级协方差、自相关和状态依赖关系。3. 整合来自多个气候模型(如CORDEX, CMIP6)的日尺度输出,通过计算“气候增量信号”来提供未来情景强迫,该信号是模型未来每日均值与其自身历史基线(同一天的年平均值)的差值。4. 针对太阳辐射,锚定于国家太阳能辐射数据库(NSRDB)的高分辨率(4 km)卫星反演数据,并采用乘性增量结合几何能量平衡约束来生成太阳辐射分量。5. 建立了一套包含单变量准确性、多变量结构保存、变暖信号保真度和跨模型稳健性的综合验证框架,并与现有基准(如IEA EBC Annex 80数据集)和主流变形工具(如epwshiftr, pyFWG)进行比较。
4.1 针对观测的验证
研究人员在四个代表不同柯本-盖革气候区的北美城市(洛杉矶、迈阿密、蒙特利尔、多伦多)利用独立观测期(2011-2020)的数据对sAMY框架进行了验证。
  • 4.1.1 温度和露点验证:结果显示,sAMY在温度上的均方根误差(RMSE)平均为1.06 °C,相比基准Annex 80的3.27 °C提高了68%。其中洛杉矶的RMSE为0.79 °C,比Annex 80低79%。露点验证也显示sAMY平均RMSE为1.32 °C,优于Annex 80的2.19 °C。
  • 4.1.2 太阳辐射验证:在太阳总辐射(GHI)验证中,sAMY在四个城市的平均RMSE为162.8 W/m2,与Annex 80性能相当,但保持了物理上一致的夜间零辐射。对太阳辐射分量(直接辐射DNI和散射辐射DHI)的验证表明,该框架能较好地复现散射辐射。
  • 4.1.3 多变量依赖性保存:通过基于Copula的“等级相关差异”指标评估,sAMY在四个城市平均取得了0.075的成绩,表明其能够较好地保留观测中变量间的多变量依赖关系。
4.2 气候信号保存
研究证明,sAMY能够近乎完美地保存输入气候模型的变暖趋势。在2011-2100年间,sAMY生成的序列年均温度异常与CORDEX模型输出高度一致,世纪末(2081-2100相对于2011-2020)变暖信号的误差小于0.01 °C。这表明“气候增量”方法成功地将气候模型的强迫趋势转移到了观测锚定的天气序列中。
4.3 模型配置敏感性
  • 4.3.1 状态数量敏感性:对RS-VAR模型中潜在状态数量(k=2,3,4)的后验敏感性分析表明,主要的下游验证指标在k=2和k=3之间变化很小,不支持将模型复杂度提升到k=3以上。
  • 4.3.2 训练期敏感性:研究比较了使用短周期、高质量太阳辐射数据(NSRDB,12年)和长周期、重分析校准数据(ERA5,56-67年)进行训练的效果。对于地中海气候的洛杉矶,两者性能相当;而对于大陆性气候的蒙特利尔和多伦多,更长的训练历史显著提高了温度准确性,表明最优训练时长具有气候依赖性。
4.4 跨气候预估的稳健性
一个核心设计原则是,同一个观测训练的RS-VAR模型可以与来自多个模型源的气候增量结合,而无需重新训练。研究测试了跨越CMIP5和CMIP6两代、三种空间分辨率(12-100 km)、三种区域气候模型物理方案和两种排放情景的五种气候模型配置。
  • 4.4.1 跨模型验证一致性:在所有测试配置下,针对同一观测期的验证性能保持高度稳定。例如,在洛杉矶,温度偏差范围在-0.70 到 +0.17 °C之间,RMSE变异系数仅为13%。粗分辨率(100 km)的CMIP直接输出与细分辨率(25 km)的CORDEX输出在验证指标上差异很小,表明在此框架下,验证准确性更多地由观测学习决定,而非每日强迫源的空间分辨率。
  • 敏感性分析:研究定量评估了模型分辨率和物理方案的敏感性。发现即使气候模型分辨率粗化4-8倍,sAMY的验证RMSE也仅增加11-26%,远小于纯气候模型分辨率效应可能带来的影响。不同物理方案的区域气候模型在相同分辨率下也产生了相近的验证结果。
4.5 与最先进天气生成方法的比较
研究将sAMY与两种广泛使用的基于变形的方法(epwshiftr和pyFWG)进行了比较。
  • 方法论比较:sAMY生成基于观测统计学习的随机小时序列,支持连续长期轨迹和集合;而变形方法则是对选定基线文件应用气候变化信号,生成代表性的单一年份。
  • 结果比较:sAMY在变暖信号保存上近乎完美(设计使然),而变形方法存在不同程度的偏差。在保存基线多变量协方差结构方面,变形方法(尤其是pyFWG)由于直接变换基线文件,表现出更小的等级相关差异;sAMY因生成全新序列,此差异略大,但在多元分布匹配(KS统计量)上表现更好。
  • 对热负荷和HVAC系统规模的影响:研究发现,尽管各方法的年累计度日数可能相近,但其季节内温度结构和极端条件表示存在差异。变形方法(特别是epwshiftr)表现出明显的季节性偏移(夏季更热、冬季更冷),并且其导出的峰值冷却设计容量普遍高于sAMY集合的中位数,反映了在表征极端事件方面的不同方法论假设。
研究结论与讨论
本研究提出的sAMY框架成功地将观测驱动的小时级统计学习与日尺度气候模型强迫相结合,为建筑能耗模拟生成高质量、连续的未来天气序列。其核心创新在于通过“三项分解”和RS-VAR模型,明确分离了观测训练得到的局地天气结构与外部的气候变化信号,从而在“观测真实性”和“气候信号保真度”之间取得了良好平衡。验证表明,该框架在温度、太阳辐射精度和多变量关系保存上优于现有基准,并且对输入气候模型的来源(分辨率、物理方案)表现出较强的稳健性,降低了应用高分辨率气候模拟数据的门槛。
研究揭示了该方法与主流变形方法之间的互补性:sAMY擅长提供经过观测验证的、可用于多年度量、风险评估和不确定性分析的连续随机集合;而变形方法则在生成计算高效的代表性单一年份方面具有优势,能更好地保留基线文件的时序结构,可能对峰值设计条件的表征产生影响。因此,选择何种方法应取决于具体应用场景(如年度负荷分析 vs. 极端事件设计)。
sAMY框架也存在一些局限性,例如当前验证集中于北美地区,未包含降水生成,且基于站点数据可能无法反映城市冠层微气候。未来工作可扩展至全球更多气候区,整合降水模块,并探索将生成的天气数据直接用于建筑模拟案例研究,以量化其对能耗和过热风险预测的具体影响。此外,该框架产生的“状态概率”和“转移矩阵”等输出,为建筑模型预测控制提供了潜在的天气状态概率预报信息,值得进一步探索。总体而言,sAMY为创建兼具观测真实性与气候信号保真度的、可复现的“气候知情”天气文件提供了一条有前景的技术路径。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号