《BUILDING AND ENVIRONMENT》:Building a general and data-efficient convolutional neural network-based model for fast urban flow estimation
编辑推荐:
城市风流预测中,提出残差块卷积神经网络生成器(RBG)并引入质量守恒约束,验证其优于U-Net的预测性能,同时发现模型受限于局部几何样本和极端风速复制能力。欧洲30城高精度数据集通过k-means聚类构建,揭示数据需包含低矮建筑以提升效率,模型最小均相对误差下限为5.7%。
J. Calafell | J. Bustillo | J.M. Armengol | S. Gómez | F. Ramirez-Javega | O. Lehmkuhl
巴塞罗那超级计算中心,Pla?a Eusebi Güell 1-3,巴塞罗那,08034,西班牙
摘要
实时且准确的数值预测城市风流对于开发提升市民生活质量和健康的工具至关重要。然而,传统的计算方法(如计算流体动力学CFD)仍然计算成本高昂,不适合快速预测。最近的研究探索了数据驱动的替代方案——特别是深度神经网络——以克服这些限制。然而,大多数现有模型都是针对特定几何配置定制的,或者即使能够泛化到未见过的几何形状,也需要大量的训练数据集。在这项工作中,我们提出了一种基于残差块的卷积神经网络生成器架构(RBG),其在从几何形状重建二维(2D)城市风流方面的性能优于广泛使用的U-Net生成器。首先,通过k-means聚类算法从欧洲城市几何形状中构建了一个广泛的训练数据集,以确保特征多样性并促进泛化。然后,我们通过基于留一法的稳健统计研究评估了开发准确、通用且数据高效模型的可行性。几何参数化分析确定了训练数据集中所需的关键形态特征,以实现对数据的高效准确预测,结果表明训练几何形状应包括低于平均水平的建筑物高度,而不是高于平均水平的建筑物高度。此外,我们估计模型的最小可实现平均相对误差的下限约为5.7%。这一下限揭示了结构上的限制:局部样本中缺乏更广泛的几何背景,以及模型在再现极端流值方面的困难。这些限制似乎是当前最先进的数据驱动2D城市风流预测策略的固有缺陷。
引言
根据联合国的数据[1],预计到2050年,全球68%的人口将居住在大城市地区,这对致力于维持高生活水平的城市规划者来说是一个重大挑战。风流对空气质量及行人舒适度有显著影响,这两者是决定城市生活质量的关键因素。在这种情况下,计算流体动力学(CFD)为分析城市风流和支持长期规划与环境预测提供了强大的工具。然而,其高昂的计算成本和复杂的工作流程使得实时预测变得不切实际,限制了诸如污染物扩散即时预报或快速城市/建筑设计等应用[2]。
机器学习(ML)的最新进展,加上模拟数据的日益丰富,促进了数据驱动方法的发展,这些方法可以近似CFD解决方案,从而以更低的计算成本实现快速预测。特别是深度神经网络(DNN)展示了从高维非线性系统中提取模式的能力[3]。其中,卷积神经网络(CNN)在捕捉输入和输出场之间的空间模式和非线性关系方面非常有效,使它们适用于湍流等多尺度现象[4]、[5]、[6]、[7]。生成模型尤其具有吸引力,因为它们可以直接从几何形状中近似CFD解决方案,通过学习形状与流场之间的映射[8]。尽管构建能够在广泛流动条件下泛化的模型仍然具有挑战性[9],但这些方法在设计和优化任务中提供了显著的计算节省。
另一个重要发展是物理信息神经网络(PINN)[10]、[11]的出现,这些网络将控制物理定律直接纳入训练过程。通过将纳维-斯托克斯方程等方程嵌入损失函数中,这些模型可以在减少数据需求的情况下学习基本物理规律。这些例子展示了DNN在流体动力学中的潜力;更多讨论可以在Brunton等人[12]、Sofos等人[13]的综述以及Taira等人的最新批判性综述[14]中找到。
ML方法也被用于实现城市环境中的快速风流预测。早期的模型依赖于无法捕捉高维复杂性的简单神经网络架构[15]、[16],但人工智能(AI)硬件和软件的进步使得更强大的模型成为可能[17]、[18]、[19]、[20]。特别是生成式几何到流动模型可以直接从二维(2D)城市几何形状预测风流场。Mokhtar等人首次应用了在合成几何形状上训练的PatchGAN架构[21],后来将该方法扩展到真实的城市CFD数据[22]。他们强调了由于公共大规模CFD数据稀缺而需要更大、更多样化的数据集。Hoines等人通过结合Signed Distance Function(SDF)将PatchGAN和CycleGAN架构与位置信息相结合,提高了预测准确性[23]。最近的研究提出了其他方法,包括随机森林[24]、用于早期设计的Pareto优化CNN[25],以及具有三维(3D)编码的多层感知器(MLP)-Mixer[26]。还探索了使用傅里叶神经算子(FNO)进行微气候预测[27]、[28]、[29]。虽然传统的DNN能够近似有限维空间之间的映射并在特定条件下表现良好,但它们在跨不同参数或边界条件泛化方面的能力有限。FNO通过学习傅里叶域中功能空间之间的映射来解决这一问题,更有效地捕捉全局空间相关性。然而,它们的预测误差随着雷诺数的增加而增加[27]。
大多数生成方法依赖于基于CNN的U-Net架构作为生成器骨干。Lu等人在2025年提出了一个最新示例[30],该模型在包含12个具有不同形态的城市社区的数据集上进行了训练。然而,该研究并未评估泛化性能。此外,这些工作中没有一个在训练过程中纳入了物理约束。Caron等人的最新综述[31]强调了在构建环境中进行可扩展风流预测时需要强制物理一致性和提高模型泛化能力的必要性。
为应对这些挑战,本研究提出了一种新的架构,该架构在训练过程中纳入了物理约束,特别关注泛化能力和数据效率。这项研究是在一个公私合作的H2020项目框架下进行的,该项目旨在开发城市地区的微气象和污染映射即时预报服务。一个关键要求是能够预测训练数据中未包含的城市布局中的气流,从而在将系统部署到欧洲城市时避免进行新的CFD模拟。由于没有关于实现满意模型泛化所需数据量的先验信息,因此构建了一个包含30个欧洲城市区域的数据集,每个区域覆盖一平方公里,代表了不同的几何形态和流动条件。使用Wall-Modeled Large-Eddy Simulations(WMLES)生成了高保真度训练数据,以确保预测准确性。
本文的其余部分组织如下:第3节描述了数据集的生成、模型架构和训练程序。第4节评估了模型性能,分析了泛化和数据效率,并讨论了数据集特征和方法论限制。最后,第5节总结了主要发现并指出了未来研究的方向。
章节摘录
贡献
本研究的主要贡献包括:
•训练数据集。 从开源资源构建了一个新的真实欧洲城市几何数据集,以捕捉欧洲城市的形态多样性。
•模型架构。 提出了一种基于残差块的生成器,并将其与标准的U-Net架构进行了基准测试,用于数据驱动的2D城市风流预测。
•基于物理的约束。 将从不可压缩连续性方程推导出的质量守恒约束纳入模型中
方法论
本节介绍了方法的总体策略和目标,随后详细描述了其关键组成部分。
结果与讨论
本节讨论了模型的性能、其局限性以及在使用有限数据的情况下运行数据高效模型的潜力。该节的组织结构如下:首先,通过将所提出框架的性能与文献中常用的几种标准架构进行比较,确定最佳模型架构。接下来,通过评估几何特性来探讨开发数据高效模型的潜力
结论与未来工作
本研究提出了一种基于残差块卷积神经网络的新数据驱动框架,用于从几何输入预测2D城市风流。由于残差连接增加了模型的深度,所提出的架构在性能上优于基于U-Net的生成器,同时缓解了梯度消失问题。通过首次在2D城市风流预测中引入的基于方程的约束,进一步强化了质量守恒。尽管如此,仍发现
CRediT作者贡献声明
J. Calafell: 写作——原始草稿、软件、资源、方法论、资金获取、形式分析、数据管理、概念化。J. Bustillo: 写作——审稿与编辑、研究、资金获取、概念化。J.M. Armengol: 写作——审稿与编辑、研究。S. Gómez: 软件、数据管理。F. Ramirez-Javega: 监督、项目管理、资金获取、概念化。O. Lehmkuhl: 监督、项目管理
资金来源
本项工作由欧盟“地平线欧洲”(Horizon Europe)研究和创新计划下的EuroHPC联合项目资助,授权协议编号为FF4EuroHPC-1012-IBAM。
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。
致谢
作者衷心感谢Red Espa?ola de Supercomputación(RES)通过项目ID IM-2020-1-0010和IM-2020-2-0012提供的计算资源,这些资源分别在巴塞罗那超级计算中心和马拉加大学的MareNostrum IV和Picasso超级计算机上运行。