《Environmental Modelling & Software》:Emulating the Global Change Analysis Model with deep learning: An energy sector case study
编辑推荐:
本研究开发了一种基于深度学习的GCAM高效模拟器,通过训练现有大集合数据集,有效扩展了参数空间探索能力,显著降低计算成本。模拟器在22,528个输出点中表现出高预测精度,并揭示了多部门动态交互中的关键敏感性,为未来情景设计提供新方法。
安德鲁·霍姆斯(Andrew Holmes)|三谷秀美(Hidemi Mitani Shen)|马特·詹森(Matt Jensen)|莎拉·科夫兰(Sarah Coffland)|洛根·西泽莫尔(Logan Sizemore)|塞思·巴塞蒂(Seth Bassetti)|布伦娜·尼埃瓦(Brenna Nieva)|克劳迪娅·特巴尔迪(Claudia Tebaldi)|阿比盖尔·斯奈德(Abigail Snyder)|布莱恩·哈钦森(Brian Hutchinson)
华盛顿西部大学(Western Washington University),地址:美国华盛顿州贝灵厄姆市高街516号,邮编98225
摘要
全球变化分析模型(GCAM)用于模拟地球与人类系统的共同演化过程,但其复杂性导致大规模集合研究的计算成本非常高。我们开发了一种高效的深度学习仿真器,能够近似GCAM的输出结果。这使得我们能够在比完整模型运行更多的参数设置下估计模型响应,从而加快探索速度并改进情景发现能力。该深度学习仿真器基于一个涵盖水、土地和能源领域的大型集合数据进行训练。我们在不同规模的训练集上评估了其性能。结果表明,即使在训练样本数量远少于原始集合的情况下,该仿真器在22,528个输出结果上的预测准确性仍然很高。这种效率使得设计能够更有效地探索GCAM的输入-输出空间。据我们所知,这是首个用于情景发现的多部门动态模型仿真器,提供了一种简单且可适应的机器学习方法。
引言
人类因素是地球系统未来演化的重要组成部分,需要动态地表示其中各个部门之间的相互作用。像全球变化分析模型(GCAM)这样的模型对于描绘人类系统的未来发展至关重要,包括能源、水、土地、人口和GDP等方面,从而形成地球与人类系统共同演化的未来情景。这些多部门之间的相互作用使它们区别于仅关注单个部门或单独考虑地球系统的模型,但也增加了它们的复杂性和计算成本。模型内部动态的复杂性以及所代表各个部门之间的相互关联性,使得难以直观地建立输入与输出之间的联系。历史上,像GCAM这样的模型通常使用“故事线驱动”的或代表性的情景进行运行:这些情景包含涵盖广泛替代未来的离散假设和驱动因素。然而,这些情景并不能穷尽所有可能的输入组合,因此可能会遗漏一些重要的结果。
由于计算资源的增加,近年来多部门模型的探索性建模变得流行起来(Dolan等人,2022年;Dolan等人,2021年)。在这种方法中,设计并运行大规模的情景集合,以重新组合离散化情景的组成部分,填补离散化设计留下的空白。这种方法对于探索这些模型对假设的复杂敏感性非常有效。这些集合通常以组合的方式整合了多种数据来源、专家意见和离散假设(Woodard等人,2023年)。然而,集合成员的数量以及实验设计不可避免地受到计算资源的限制。
在多部门动态建模领域利用机器学习方法的工作仍处于起步阶段。Li等人(2025年)采用生成建模方法,利用第六次评估报告AR6情景数据库(Byers等人,2022年)中的数据快速生成新情景。他们考虑了变分自编码器和两种生成对抗网络方法,并发现变分自编码器在生成与训练数据相似的新情景方面最为有效。尽管这种方法在生成新情景样本方面有效,但它并不试图直接模拟任何给定的多部门模型。具体来说,Li等人(2025年)使用的训练数据集包含了来自多个基础能源-经济-环境模型的输出。后续的研究主要集中在多部门模型输出的仿真上,主要是针对特定输出,而不是开发改进不确定性研究的方法,但结果令人鼓舞(Takakura等人,2021年;Xiong等人,2023年)。相比之下,本研究专注于开发单个基础模型(GCAM)的深度学习仿真器,目标是覆盖广泛的输出范围(包括空间、时间和部门),旨在为探索GCAM的输入-输出空间及其敏感性提供补充工具。通过根据不同的采样策略构建训练数据,我们能够提高未来集合设计的效率。这种方法在地球系统建模社区中很受欢迎,其中使用模型产生的各种指标的仿真器来探索参数空间、表征其不确定性,有时甚至用于根据观测数据校准模型(Yarger等人,2024年;Peatier等人,2024年)。
因此,这里的仿真总体目标是更好地理解这个在理解地球与人类系统潜在耦合结果方面发挥关键作用的复杂模型,而不仅仅是比基础模型更快地产生新结果。通过在一个特定的、可用的集合上训练仿真器来实现这一目标:我们使用了Woodard等人(2023年)生成和分析的集合,该集合主要关注与能源部门相关的GCAM输入变化,以了解在能源供应基本不确定性下的未来能源生产、土地利用和水资源消耗的潜在结果。关于GCAM和Woodard等人研究的更多细节将在第2节中提供。除了这项特定实验的结果之外,我们发现仅训练仿真器本身就为理解GCAM的敏感性提供了新的见解,并指出了未来进行更全面和高效的大规模集合研究设计的机会。我们还预计,该仿真器在未来根据用户可能探索的不同科学问题设计有意义的GCAM集合时具有直接效用,通过识别输入空间中高敏感性的区域,从而指导选择值得进一步采样和用完整模型运行的GCAM输入配置。这项工作的主要贡献包括:
- 我们设计并训练了一个基于神经网络的高保真度GCAM仿真器,该仿真器基于一组GCAM集合运行结果。
- 我们通过合理插值GCAM变量的输入空间来设计并生成一个扩展的集合,有助于理解中间情景。
- 我们评估了仿真器的性能,不仅关注其输出值的再现能力,还关注其对输入的敏感性。
- 我们分析了不同输入空间采样策略对性能的影响,为未来更全面且高效的大规模集合探索研究提供了见解。
- 我们量化了生成高精度神经网络仿真器所需的训练数据量。
本文的其余部分安排如下:第2节提供了关于GCAM和Woodard等人研究的相关背景信息。第3节描述了我们的方法,包括神经网络仿真的详细信息。第4节展示了实验设计和实验结果。最后,第5节总结了我们的工作并提出了未来工作的方向。
部分摘录
背景
如引言所述,像GCAM这样的模型是模拟人类-地球系统共同演化的重要工具。GCAM是一个多部门动态模型,明确考虑了能源、土地利用、水和地球系统之间的同时区域相互作用。GCAM是由太平洋西北国家实验室开发和维护的开源模型(Bond-Lamberty等人,2019年;Calvin等人,2019年)。GCAM模拟了划分为32个不同社会经济区域的全球市场
仿真器输入
本实验采用了Woodard等人之前用作GCAM能源供应相关输入的12个情景因素(Woodard等人,2023年)。这些情景因素代表了在不同人口和GDP水平下能源需求、能源生产、储存和备用成本、电气化努力、生物能源使用等方面的假设
实验与结果
我们进行了一系列实验来回答以下科学问题:
- 哪种采样策略能够产生最准确的仿真器训练集?
- 基于一种采样策略训练的仿真器对另一种采样策略下的数据点的泛化能力如何?
- 训练一个准确的仿真器需要多少训练数据?
- 仿真器的输入-输出敏感性在多大程度上与GCAM的相匹配?
- 仿真器在哪些方面表现良好,在哪些方面会出现错误?
结论与未来工作
本文提出了一个使用深度学习的高保真度和计算效率高的GCAM仿真器。在开发仿真器的过程中,我们改进了现有探索(Woodard等人,2023年)中对能源供应技术组合的关键不确定驱动因素的输入采样策略,将12个输入变量中的9个从二进制变为连续型(见表1)。
我们发现,为了获得一个具有泛化能力的仿真器,需要……
CRediT作者贡献声明
安德鲁·霍姆斯(Andrew Holmes):撰写 – 审稿与编辑、初稿撰写、可视化、验证、软件开发、方法论研究、数据分析、正式分析、数据整理。三谷秀美(Hidemi Mitani Shen):初稿撰写、可视化、验证、软件开发、方法论研究、数据分析。马特·詹森(Matt Jensen):初稿撰写、可视化、验证、软件开发、方法论研究、数据分析、正式分析、数据整理。莎拉·科夫兰(Sarah Coffland):初稿撰写、验证、软件开发、方法论研究。洛根(Logan):
软件可用性
- 软件名称:GCAMnet
- 开发者:马特·詹森(Matt Jensen)、安德鲁·霍姆斯(Andrew Holmes)、三谷秀美(Hidemi Mitani Shen)、莎拉·科夫兰(Sarah Coffland)、洛根·西泽莫尔(Logan Sizemore)、塞思·巴塞蒂(Seth Bassetti)、布伦娜·尼埃瓦(Brenna Nieva)
- 联系方式:Brian.Hutchinson@wwu.edu
- 网站:https://github.com/hutchresearch/GCAMnet
- 语言:Python 3
- 许可证:MIT
- 依赖项:详见https://github.com/hutchresearch/GCAMnet/blob/main/requirements.txt
资金支持
本研究得到了美国能源部科学办公室的支持,作为多部门动态、地球与环境系统建模项目的一部分。太平洋西北国家实验室由Battelle Memorial Institute根据合同DE-AC05-76RL01830为能源部运营。本文表达的观点和意见仅代表作者本人。作者还感谢NVIDIA公司提供的GPU。
作者声明他们没有已知的可能会影响本文所述工作的竞争性财务利益或个人关系。