OVEN：一个用于光伏电站识别的深度学习框架

《Energy and AI》：OVEN: A deep learning framework for photovoltaic site identification

【字体：大中小】 时间：2026年04月29日 来源：Energy and AI 9.6

编辑推荐：

　　Jo?o Oliveira | Miguel S.E. Martins | Ricardo Gomes | Susana Vieira | Jo?o M.C. Sousa | Paulo Ferr?o
IN+，创新、技术与政策研究中心，里斯本高等技术学院，Rovisco Pais大道1号，1049-001，葡萄牙

**摘要**
鉴于当前的全球能源需求，在发展中国家和发达国家中大幅扩大太阳能电池板的部署对于实现《巴黎协定》中规定的净零排放目标至关重要。为了最大化能源产出，识别出具有最佳光照条件的光伏（PV）安装地点至关重要。本文介绍了OVEN架构（dO eVErything oNce），该架构能够同时识别潜在的光伏安装地点并提取屋顶拓扑的参数化表示。与之前将问题分解为多个阶段的方法不同，我们基于YOLO的方法只需一次处理即可估计屋顶特征。该模型提高了可访问性和可扩展性，同时显著降低了运营成本，执行时间减少了28倍，内存占用量也减少了三倍。该模型对每栋建筑的mAP50值为0.9586，每个方向的准确率在0.68到0.74之间。根据LiDAR的真实数据，预测的倾斜度和面积差异导致的年发电量差异在-0.5%到+2.5%之间。

**1. 引言**
近年来，全球应对气候变化的努力有所加强，这是由于需要减少温室气体排放并限制全球温度上升。国际政策框架，尤其是《巴黎协定》，为碳中和设定了雄心勃勃的目标，并强调在电力系统脱碳过程中使用可再生能源[1]。实现《巴黎协定》的目标需要加快可再生能源的部署和提高能源效率。根据国际能源署和国际可再生能源署的数据，将全球变暖限制在1.5°C以内意味着到2030年需要将全球可再生能源容量增加两倍，达到约11,000吉瓦[2]，尤其是在能源需求集中的城市地区。
在可再生能源技术中，由于成本大幅降低、技术进步和支持政策[3][4]，光伏（PV）系统经历了快速增长。屋顶光伏系统越来越多地被私人家庭和公共机构采用，促进了本地电力生产，减少了对电网的依赖，并降低了碳排放[5][6]。能源社区通过在社区层面聚合发电和消费来提高自给率[7][8][9]。尽管有这些优势，但准确量化屋顶光伏部署的技术和环境效益仍然是一个重大挑战。光伏系统的性能对当地条件非常敏感，系统特征描述的不准确性可能导致电力产量的估计出现显著误差[10][11][12]。先进的光伏建模和仿真工具通常用于评估生产潜力、经济可行性和环境影响[13][14]。这些工具通常提供高度详细的输出，但依赖于精确可靠的输入数据。光伏建模的一个关键输入是建筑环境的特征描述，特别是屋顶的几何形状。屋顶面积、朝向（方位角）和倾斜度直接影响太阳辐射，从而决定了光伏系统的性能。在密集的城市环境中，屋顶往往由具有不同方向和坡度的多个平面组成，这使得屋顶特征描述变得复杂[15]。因此，迫切需要可扩展且准确的方法来识别适合光伏安装的可用屋顶区域，并明确其几何属性。
基于地籍数据或高分辨率LiDAR的传统方法通常成本高昂、空间覆盖范围有限，或者在许多地区无法使用[16][17]。这激发了人们对利用卫星图像和数据驱动方法自动化识别屋顶特征的兴趣[18][19][20]，从而实现更可靠的光伏潜力评估并支持明智的决策[21]。这些数据驱动的方法依赖于经典的分类方法[14][18][22][23]，或多阶段深度神经网络方法来预测拓扑特征[24]。后者使训练有素的模型能够捕捉到光照、阴影等特征，从而可靠地恢复高细节层次（LOD），这是以前的分类模型无法捕捉到的（见图1）。
尽管多阶段神经网络和传统的基于LiDAR的方法能够提取复杂的拓扑细节，但它们存在显著的运营瓶颈。具体来说，这些方法存在以下问题：（1）效率——多阶段检测器需要多次处理图像来提取特征，使得整个过程计算复杂且耗时[25]；（2）泛化能力——由于下游模型仅处理建筑物的部分视图，模型的泛化能力受到限制[26]；（3）端到端优化——在优化多阶段检测器时，对中间表示（例如感兴趣区域）的改进实际上可能会恶化最终结果，因为下游模型已经针对先前较不准确的中间表示进行了优化[25][27]。

**2. OVEN框架**
OVEN框架如图2所示，提供了一个统一的光伏站点识别和特征描述流程。通过自动化从原始卫星数据中提取建筑特征，该框架能够在克服多阶段系统典型计算瓶颈的同时，实现高保真的能源生成模拟。该框架基于三个核心支柱：
（i）特征工程——建立了原始卫星图像与下游能源模拟工具所需的详细物理指标之间的桥梁。我们将复杂的3D屋顶几何形状参数化为可学习的特征空间。
（ii）模型架构——描述了基于YOLO V11框架的单阶段深度学习架构，并定制了一个适应可学习特征空间的头部。与将建筑检测与几何提取分开的传统方法不同，OVEN使用统一的预测头部，使模型能够在单次前向传递中同时定位潜在的安装地点并回归其拓扑参数。
（iii）损失函数和训练——最后一部分详细介绍了稳定多目标学习任务所需的专门训练程序。这包括实现一个自定义的OVEN任务分配器，该分配器使用拓扑相似性得分将预测与真实标签对齐，并结合了Focal Loss损失函数。一旦通过遗传算法优化了训练程序，OVEN模型就可以在各种地理环境中部署，以高精度预测屋顶的能源潜力。

**2.1. 特征工程**
现代和传统的机器学习方法都需要大量的数据[28]。模型创建或训练本质上是从非线性相关性中识别可用于分类和回归任务的过程。为了确定哪些特征对光伏安装至关重要，我们重新审视了关键的理论概念。光伏面板产生的电能E可以通过以下公式计算：
E = S × A × η × PR，
其中性能比PR是一个无量纲因子，用于考虑实际损失，这些损失阻止了光伏系统将所有理论上可用的太阳能转换为可用电能；S代表太阳辐射强度，A是面板面积，η是面板效率[29]。对于电能生产而言，η和PR要么是固有属性，要么受环境因素影响。因此，拓扑属性仅与总面板面积以及影响太阳辐射的变量有关，而太阳辐射又受到光伏面板相对于地面的倾斜度和相对于北极的方位角的影响。
假设一张卫星图像由I∈RN×M表示。每张图像包含Z个潜在的安装地点。每个安装地点可以通过前面提到的三个因素来描述：（1）总面积；（2）方位角；（3）倾斜度。因此，数据集必须包含这些值才能对建立能源社区有所帮助。为了标准化不同的建筑几何形状，OVEN框架将任何由K个任意多边形组成的屋顶拓扑映射到基于五个主要方向（北、东、南、西和水平，NESWH）的规范表示中，如图3所示。

**2.2. 数据集获取**
数据集是通过将葡萄牙国家地理信息系统的卫星图像聚合成500张图像生成的，每张图像包含里斯本大都会区随机选择的建筑物，总覆盖面积为3370.77平方公里（图像在数据集中有重叠）。每个建筑物都使用轴对齐的边界框进行隔离，并根据图3使用每平方米10个点的点云来识别和分组安装地点的拓扑结构。每个像素的空间分辨率为0.15米（[30]提供的最大分辨率）。

**2.3. 数据标准化**
鉴于文献表明，当输入和输出标准化时，模型训练效果更好，例如收敛更快、稳定性更高[31]，我们按照以下方式对预测进行标准化：
（1）倾斜角度——限制在[0°, 90°]范围内，并将其标准化到[0, 1]的范围内；
（2）方位角——每个方向覆盖90°，表示与其相应类别的偏差（例如，朝南的多边形可以向顺时针或逆时针方向偏离[?45°, 45°]），并将其标准化到[0, 1]的范围内；
（3）面积——通过除以ah/2cos(45°)进行标准化，其中ah是从标准YOLO预测中估计的二维边界框面积。如果建筑物的面积超过了这个标准化因子，标签将被截断，以确保训练数据和测试数据都落在[0,1]的范围内。下载：下载高分辨率图片（712KB）下载：下载全尺寸图片

图4. 训练数据统计：数据集中NESWH的等效表面积（第一行）；倾斜度分布（由于这些数据在数据集中非常普遍，因此去掉了零倾斜度）；方向分布（底行）。我们数据集的这些简化表面的分布显示在图4中。所有考虑的区域的分布都呈偏态，平均值接近0.2个标准化单位。对于与倾斜度相关的测量，倾斜的屋顶相对于地面的平均倾斜度为0.3×90°=27°，无论方向如何，这与预期一致。方位角数据没有偏向任何特定方向，确保了表示的平衡。为了确保适当的训练，数据集被分为训练集和验证集，训练集有400张图片，验证集和测试集合并有100张图片。验证集与训练集不重叠，即它们是里斯本大都会区的不同区域，防止空间自相关影响性能指标。

2.2. OVEN模型架构
最近在模型架构方面的进展扩展了深度学习技术可以实际解决的回归和分类问题的范围。受到[32]工作的启发，并在其方法的基础上，我们提出了一种YOLO网络变体，它不仅可以识别潜在的安装地点，还可以从二维卫星图像中提取三维特征，这与[33]中描述的方法一致。OVEN所需的计算资源最少，同时能够预测具有灵活几何形状的屋顶属性。虽然[24]将地点识别和拓扑分析分为两个独立的阶段，允许通过既定程序分别进行优化，但我们的模型不仅限于地点识别，还执行回归任务。这种扩展需要对成本函数和数据格式进行调整。例如，表示角度对大多数回归算法来说是一个重大挑战，因为这些空间的拓扑是非平面的，通常表示为SO(N)，其中N代表旋转群的维度[34]。我们引入了一个带有18个额外参数的定制头部，如图5所示，它输出：五个逻辑指标（概率），用于判断是否存在NESWH方向；五个区域；四个倾斜度，以及四个方位角。这个定制头部在https://github.com/Joaopmoliveira/OVEN上公开提供，连同训练和数据增强管道，使模型能够学习与屋顶拓扑相关的图像模式。V11版本特别适合这项任务，因为它能够可靠地预测小边界框，这是早期YOLO版本所缺乏的能力。因此，对于每个正确识别的建筑轮廓，模型都会预测其相应的拓扑描述。

下载：下载高分辨率图片（511KB）下载：下载全尺寸图片

图5. OVEN模型，其中每个建筑轮廓（绿色）都有一个根据NESWH特征空间关联的描述。OVEN头部连接到一个预训练的YOLO V11主干网络上。

2.3. OVEN损失函数和训练
训练YOLO V11模型需要两个关键组成部分：（1）损失项——适当的损失项显著影响训练模型的质量，因为更简单的参数空间往往会产生更好的结果；（2）任务分配器——在每次训练迭代中，模型计算每个训练样本与分配的边界框之间的误差。定义如何将边界框分配给预测是至关重要的。该过程涉及使用预测的对象性分数、类别概率和交并比（IoU）来匹配每个观察到的最佳候选预测[35]。虽然之前的YOLO V11用例将预测与图像中包含的信息相关联，例如语义分割，但OVEN必须检索图像中无法直接观察到的3D信息，因此合适的任务分配器对于将预测与标签匹配至关重要，这些标签在IoU和拓扑上都是一致的。由于我们的任务涉及根据基本方向（NESWH）和建筑位置对定向屋顶拓扑进行分类，我们扩展了标准的任务分配器[35]，通过一个对齐度量将真实标签与预测匹配，该度量同时考虑了分类置信度、边界框重叠以及预测屋顶特征和真实屋顶特征之间的余弦相似度。OVEN任务分配器在算法1中有详细说明，其中预测的锚点为P={(si,bi,fi)}i=1N，建筑得分si∈[0,1]，2D边界框bi和3D屋顶特征fi，真实对象为G={(gj,hj)}j=1M，2D边界框gj和3D屋顶特征hj。该算法输出一个张量A，将每个标签与最可能的预测匹配。第3节展示了修改任务分配器如何显著提高准确度指标。我们将这个修改后的任务分配器称为OVEN任务分配器。

模型解决了两个分类和回归任务：（O1）——识别隔离每个建筑的二维边界框（分类任务涉及区分背景和屋顶）；（O2）模型估计元组Gn,Gs,Gw,Ge,Gh，这提供了屋顶拓扑的参数化描述（分类组件涉及正确分配每个安装位置的方向）。我们使用多目标范式将这些目标转化为损失函数L。本质上，我们保留了先前研究中的损失项Lb（下标b代表边界框），并引入了Lr项（下标r代表屋顶）来惩罚每个正确识别屋顶的模型在屋顶拓扑方面的错误。注意，Lb由三个项组成：（1）boxloss——量化预测边界框坐标的误差；（2）clf——量化区分背景和屋顶的误差；（3）dlf——通过关注预测框的质量来提高边界框的预测准确性。这三个项共同确保了稳定的回归任务。总损失由（4）给出，其中B表示批量大小，Z表示每张图片中的建筑数量，ai,j,θi,j,αi,j,di,j和a?i,j,θ?i,j,di,j分别代表面积、倾斜度、方位角的真实值和估计值，以及所述屋顶方向的二进制存在性。理论上，估计的面积可以用来指示是否存在某个基本方向，即di,j可以被ai,j>g替换，其中g是一个阈值，超过这个阈值我们认为给定的基本方向存在于我们的预测中。实际上，我们观察到当ai,j同时用于回归和分类目标时，模型训练变得更加复杂且不稳定。我们引入了参数di,j，从而将这两个问题（回归和分类）解耦，类似于所有YOLO变体引入的对象性分数，它与识别对象的类别不同。标量ωi,j表示预测边界框i,j与真实边界框之间的匹配分数。标量λa,λθ,λα,λd是权重不同项对整体成本函数贡献的缩放因子。具体来说，λa控制面积估计误差的贡献；λθ控制倾斜角度估计误差的贡献；λα控制方位角估计误差的贡献；λd控制方向分类误差的贡献。这些缩放因子至关重要，因为它们平衡了每个项对模型性能的影响。较大的值可能会妨碍训练过程相对于第一个目标O1的收敛，而较小的值可能导致第二个目标O2的成本函数约束不足。cai,j,a?i,j是惩罚模型错误屋顶分类的成本函数，定义为（5）cdi,j,d?i,j=?ωi,jdi,jlog(d?i,j)+(1?di,j)log(1?d?i,j)对于二元交叉熵（BCE）?ωi,jdi,j(1?d?i,j)γlog(d?i,j)+(1?di,j)d?i,jγlog(1?d?i,j)对于焦点损失，其中γ是聚焦参数，f(ai,j)写为（6）f(ai)=0对于ai≤t1对于ai>t其中t=0.05是一个阈值，低于这个阈值的多边形被认为太小而无法贡献有用的面积。我们利用ultralytics的默认配置来补偿数据集的规模。在每个训练周期生成的每个训练样本中，马赛克增强将训练集中随机选择的图像组合起来[37]。除此之外，每个组合还通过HSV抖动、平移（±10%）和缩放（±20%）进行变形。马赛克增强在200个训练周期中的190个周期内处于激活状态，因此模型暴露于大约76,000个马赛克组合。在最后10个周期中禁用马赛克增强，以稳定收敛，恢复到单图像样本。与标准对象检测不同，我们的方法需要一个标签映射函数来适应翻转或90°旋转，从而保持NESWH拓扑特征的空间对齐。

3. 结果
模型性能通过两种互补的分析进行评估：定量分析旨在验证模型在训练期间的性能是否可以泛化到未见数据，具体来说，我们评估模型在不影响分类损失项Lb的情况下提取拓扑信息的能力；鉴于模型在人机交互场景中的预期用途，定性分析也是必不可少的。目标是确保政策制定者可以根据估计的屋顶拓扑做出快速可靠的决策。

图6. 模型训练与任务分配器（红色）和OVEN任务分配器（蓝色）的比较。

3.1. 损失函数、任务分配器和超参数优化
在2.3节中，我们介绍了多个候选损失函数和几个相互关联的超参数。为了确定候选者和超参数的最佳组合，我们首先展示了任务分配器对于目标（O2）的重要性。我们使用Adam优化器训练模型两次，共200个周期，配置如下：初始学习率为0.01，最终学习率分数为0.01，动量为0.937，L2正则化权重衰减为0.0005，3.0个热身周期，初始热身动量为0.8，热身期间的偏置学习率为0.1。对于两次训练会话，我们使用cdi,j,d?i,j中的焦点损失和固定的超参数。两次会话之间的关键区别在于任务分配器：在第一次会话中，我们使用经典的V11任务分配器，而在第二次会话中，我们使用我们的OVEN任务分配器。图6所示的结果表明，OVEN任务分配器显著提高了屋顶分类的模型准确性。尽管OVEN任务分配器导致边界框准确性略有下降（左侧），从mAP50-95的0.7546降至0.7353，但它显著提高了屋顶准确性（右侧），从0.4748升至0.6915。这种权衡可以通过OVEN任务分配器的设计来解释，该分配器利用了模型的先验偏差来选择既符合建筑轮廓又符合拓扑特征的候选框。因此，我们在所有后续实验中使用我们的OVEN任务分配器。

为了评估惩罚屋顶拓扑错误分类的损失函数，我们比较了两个候选者：BCE和焦点损失，如方程（6）中介绍的。使用之前描述的相同默认设置和OVEN任务分配器，我们训练模型两次并比较结果准确性。图7中的结果表明，焦点损失和BCE在屋顶拓扑方面实现了类似的准确性，BCE的收敛速度比焦点损失快（右侧）。然而，BCE是以显著恶化目标（O1）为代价实现这一点的（右侧）。因此，焦点损失是首选的惩罚函数。这种偏好是由于焦点损失的设计，它最小化了容易分类任务的影响，同时增加了难以分类例子的权重。

图7. 模型训练与BCE（红色）和焦点损失（蓝色）的比较。
使用OVEN任务分配器和焦点损失作为惩罚函数，我们解决了最后一个未解决的问题：确定可靠优化程序的最佳参数集。为了探索超参数空间，我们采用了遗传算法[36]。该算法变异每个超参数，并根据适应度函数选择最佳个体。每个个体代表一组超参数，对应于训练了150个周期的模型。每个个体的适应度由平均精度mAP50-95和平均屋顶分类准确性的总和确定。为了管理搜索空间，我们将每个超参数限制在表2中指定的范围内。这些搜索的结果在图8中展示，显示了每个评估个体的适应度函数值。通过这一过程确定的最佳参数在表2中呈现。表1. 通过遗传算法进行的超参数搜索。超参数范围最优值 λa [5,34] 13.9181 λθ [0.1,4.0] 0.9370 λα [0.4,4.0] 0.8017 λd [0.4,4.0] 0.7477 下载：下载高分辨率图片（212KB）下载：下载全尺寸图片图8. 通过遗传算法获得的种群分布，其中每个点对应一组超参数。3.2. 训练评估使用第3.1节中探索的最佳超参数集、损失函数和任务分配器，我们进行了200个周期的完整训练过程。训练结果如图9所示。在训练过程中，边界框检测任务O1的损失函数行为与之前在对象检测任务中的研究一致。具体来说，框损失、分类损失和分布焦点损失的训练损失符合预期模式，表明我们添加的自定义项没有对主要检测任务的性能产生负面影响。此外，我们的次要任务O2（涉及估计屋顶拓扑结构）在训练和验证数据上都获得了相似的损失值。这种一致性表明模型可以有效地外推并泛化到未见数据。我们的模型在边界框检测方面的精确度为0.913，召回率为0.944，mAP50为0.959，mAP50-95为0.735，这些结果与最近最先进的模型在类似任务上的表现相当[38]。然而，如表3所示， cardinal 准确率得分在0.68到0.74之间，明显低于边界框检测。这种差距源于Oven任务分配器（算法1），它必须平衡两个相互竞争的目标：(i) 准确描绘建筑物轮廓；(ii) 正确预测屋顶方向。当这两个目标在锚点分配时发生冲突，我们故意偏向于轮廓的准确性，因为实验发现，在数据有限的情况下，IoU提供了比拓扑相似性更稳定的训练信号。我们预期随着数据集的增长，这种权衡会减少，使模型能够同时优化这两个目标。下载：下载高分辨率图片（512KB）下载：下载全尺寸图片图9. 模型性能：框损失、cfl损失、dfl损失（第一行），面积损失、倾斜损失、方向损失（第二行），与边界框预测相关的准确性指标（第三行），以及与屋顶准确性分类相关的准确性指标（第四行）。表2. 通过遗传算法进行的超参数搜索。超参数范围最优值 λa [5,34] 13.9181 λθ [0.1,4.0] 0.9370 λα [0.4,4.0] 0.8017 λd [0.4,4.0] 0.7477 空单元格表3. 模型性能指标。精确度召回率 mAP50 mAP50-95 acc（水平）acc（北）acc（西）acc（南）acc（东）0.913 32 0.944 0 40.958 55 0.735 26 0.737 56 0.68 19 70.68 17 90.68 03 80.67 59 5 3.3. 错误分析和视觉评估为了评估所提出方法的鲁棒性，我们进行了详细的偏差分析，重点关注在不同规模和几何复杂度的建筑物上预测误差的变化。鉴于像YOLO这样的模型在处理非常小的边界框时往往容易出错[25]，我们根据建筑物边界框面积评估了每个方向上的潜在模型偏差，如图10所示。我们使用高斯过程（GP）回归来模拟这两个变量之间的非线性关系，并为每对变量优化长度尺度。结果表明，无论方向如何，边界框面积与屋顶面积、方向或倾斜度之间的误差都没有一致的相关性。这种独立性是一个关键发现，意味着模型在估计拓扑变量（面积、倾斜度、方向）方面的性能不会因建筑物轮廓小而下降。因此，估计的拓扑变量在广泛的建筑物尺寸范围内都是可靠的，验证了该模型在密集城市环境中的适用性，因为在这些环境中小建筑物很常见。下载：下载高分辨率图片（665KB）下载：下载全尺寸图片图10. 建筑物轮廓2D面积（横坐标）与：(1) 屋顶面积误差（顶部行）对于水平、北、西、南、东方向；(2) 倾斜误差（中间行）；(3) 方向误差（底部行）对于北、西、南、东方向之间的相关性。第二个重要的考虑因素是评估模型误差作为屋顶几何复杂度的函数，这通过组成给定屋顶的多边形数量来量化。这项分析验证了估计误差对于简单建筑物（例如，每个方向只有一个平面的建筑物）是否保持一致，以及对高度复杂建筑物（即需要多个融合平面的建筑物）的增加。图11中的比较显示，多边形数量与所有三个拓扑变量之间的估计误差无关。这一结果表明，OVEN可以可靠地执行拓扑变量的回归，无论屋顶结构的复杂性如何。这种鲁棒性对于实际应用至关重要，因为它表明模型成功地学习了潜在的结构关系，而不会因复杂的几何形状而受到过度惩罚。下载：下载高分辨率图片（547KB）下载：下载全尺寸图片图11. 建筑物多边形数量（横坐标）与：(1) 屋顶面积（顶部行）对于水平、北、西、南、东；(2) 倾斜误差（中间行）；(3) 方向误差（底部行）对于北、西、南、东方向之间的相关性。由于提取的拓扑信息支持公共机构的决策制定，因此包含可视化组件对于验证和提供卫星图像的增强视图至关重要。图12显示了地面真实数据与预测之间的比较。模型成功检测到了大多数屋顶，并准确分类了它们的拓扑结构。视觉比较证实了模型在密集城市环境中的鲁棒性，这一点从第一行中高建筑密度可以看出（其中包含真实的屋顶参数化），这并没有导致性能下降。下载：下载高分辨率图片（1MB）下载：下载全尺寸图片图12. 测试数据中的屋顶拓扑（顶部行）与训练模型预测的拓扑（底部行）之间的比较。建筑物通过包含五个潜在多边形的正方形来表示，它们的方位角通过向量来表示。3.4. 讨论 OVEN的参数化输出特性便于与能源社区模拟[8]集成，因为所有参数都很容易获得，这与需要中间步骤将点云表示转换为具有面积、倾斜度和方位角的可用平面集的深度估计框架[32]不同。使用EnergyPlus 9.2中实现的PVWatts模型（里斯本气候条件），敏感性分析显示，±15°的方位角偏差（如图11所示的预期误差）对年光伏电力生产的影响很小。年变化通常在大约?0.5%到+2.5%之间，其中北向配置的敏感性最高，特别是在285°到30°之间，而面向南方的面板显示出非常低的敏感性，因此具有很高的鲁棒性。对于给定的方位角，更高的倾斜角度会导致更大的变化，而对于固定倾斜角度，北向面板的敏感性明显更大。在每小时尺度上，±15°的偏差在一天中的某些时间会导致平均产量的30-40%变化，特别是在早晨和傍晚，这是由于依赖于太阳高度和太阳位置。这些短期变化在一年内得到补偿，解释了南向系统年能源产量的有限影响。为了量化OVEN框架的可扩展性优势，我们将其计算和内存需求与传统的基于3D LiDAR的方法进行了比较。对于一个代表性的1024 × 1024像素卫星图像，分辨率为0.15米/像素，假设24位RGB编码，内存占用大约为3.15 Mb。相比之下，相同面积的高分辨率点云（10点/平方米）使用64位精度进行位置和颜色处理（每个点六个值）需要大约9.86 Mb。通过增加物理区域的大小，请注意，两个数据集的内存占用比率保持不变。此外，虽然通过Poisson表面重建算法提取拓扑估计在CPU上需要2到6秒[39]，但OVEN在没有GPU加速的情况下可以在50-70毫秒内完成相同的推理任务。通过实现28倍的处理速度提升和3倍的数据量减少，OVEN展示了大规模城市能源评估所需的高吞吐量。图13展示了OVEN在大型地理区域中的实际应用。为了保持一致的空间分辨率，卫星图像（图13(b)）被划分为大小均匀的瓦片。然后对每个瓦片的模型预测进行处理，并汇总到一个包含整个感兴趣区域的GeoJSON文件中（图13(a)）。下载：下载高分辨率图片（1MB）下载：下载全尺寸图片图13. OVEN用于3D建筑物拓扑提取的部署。4. 结论和未来工作本文介绍了OVEN框架，这是一种单阶段深度学习架构，它将建筑物定位和拓扑推理集成到一个统一的前向传递过程中。通过绕过与多阶段和依赖LiDAR的方法相关的计算瓶颈，OVEN提供了一种资源高效的替代方案，可以直接从2D卫星图像中提取3D屋顶特征，特别是面积、倾斜度和方向。实验结果表明，该模型在各种建筑物规模和几何复杂性下都能保持一致的性能，确保拓扑估计误差不会显著影响年能源产量的可靠性。虽然当前的实验验证仅限于里斯本大都会区，但所使用的方法本质上不是特定于某个地区的，因为NESWH参数化是一种适用于许多地理位置的几何抽象。地理依赖性在于训练数据，因此将OVEN扩展到新地区只需要获取带有LiDAR地面真实数据的代表性卫星图像。OVEN的操作实用性在于它能够作为政策制定者和城市规划者的可扩展决策支持工具。通过利用广泛可用的卫星数据而不是昂贵且地理上有限的LiDAR调查，该框架促进了大规模城市光伏潜力的评估。这种可访问性使公共机构能够识别最佳太阳能部署地点，并根据年光伏电力生产设计能源社区。此外，该框架的快速推理能力使得能够高效处理大型城市数据集。尽管OVEN在复杂的城市环境中表现出很高的鲁棒性，但我们指出，模型当前的cardinal 准确率得分表明在处理更严格的检测标准方面还有改进的空间。未来的研究将集中在将OVEN部署到不同的地理环境中，以评估其跨区域的鲁棒性。此外，后续工作将涉及与替代光伏站点识别工具的全面比较分析，以进一步验证该框架在大规模城市能源建模中的操作效率。CRediT作者贡献声明 Jo?o Oliveira：写作——原始草稿，可视化，软件，项目管理，方法论，调查，形式分析，数据管理，概念化。Miguel S.E. Martins：写作——审阅与编辑，写作——原始草稿，方法论，调查，概念化。Ricardo Gomes：写作——审阅与编辑，监督，资源，项目管理，方法论，资金获取，概念化。Susana Vieira：写作——审阅与编辑，验证，监督，概念化。Jo?o M.C. Sousa：写作——审阅与编辑，监督，概念化。Paulo Ferr?o：写作——审阅与编辑，资源，资金获取，概念化。未引用的参考文献表1

热点排行