利用机器学习模型提升市政道路状况预测的准确性

《Journal of Road Engineering》：Enhancing municipal pavement condition predictions using machine learning models

【字体：大中小】 时间：2026年04月29日 来源：Journal of Road Engineering 8.6

编辑推荐：

　　穆罕默德·阿姆贾德·阿夫里迪 | 西格杜尔·埃尔林松瑞典斯凯莱夫特奥市街道与道路部门，斯凯莱夫特奥93185 **摘要** 路面状况预测对于有效的街道维护至关重要。可靠的预测模型使市政当局能够提前预见路面状况的恶化并制定维护计划。本文研究了使用机器学习（ML）模型

　　穆罕默德·阿姆贾德·阿夫里迪 | 西格杜尔·埃尔林松
瑞典斯凯莱夫特奥市街道与道路部门，斯凯莱夫特奥93185

**摘要**
路面状况预测对于有效的街道维护至关重要。可靠的预测模型使市政当局能够提前预见路面状况的恶化并制定维护计划。本文研究了使用机器学习（ML）模型来提高市政街道预测准确性的方法。研究人员开发了72个模型，通过线性回归（LR）、随机森林（RF）和神经网络（NN）算法来预测2022年的路面状况指数（PCI）。研究数据来自2014年、2018年和2022年在瑞典斯凯莱夫特奥市进行的挡风玻璃调查。这些模型分别在2018年的数据集以及2014年和2018年数据集的组合上进行了训练和测试，涵盖了住宅街道和非住宅街道（主干道、集散道路和工业道路）的不同变量组合。此外，还针对不同维护处理的非住宅街道开发了额外的模型以分析其预测能力。结果表明，随机森林模型始终优于其他模型，其中RF（A+D+S）模型在住宅街道上的预测准确性最高，而在结合2014年和2018年数据集时也有轻微提升。RF（A+D+S+T）模型在非住宅街道上的表现最佳，并且在具有表面平整和铣刨重铺处理的路段中最为稳健。在所有变量中，加权损坏程度（WDV）、2018年状况评级（Status2018）、纵向/横向裂缝（LAR）、路面年龄（A）、轻交通量（LT）和表面不平整度（SU）是对预测结果影响最大的因素。这些发现为市政当局提供了基于数据的维护指导，有助于确定维护优先级和优化资源分配。

**1. 引言**
路面性能预测模型在路面管理系统（PMS）中发挥着重要作用，通过预测路面随时间的变化来优化维护预算的分配（Dushmantha等人，2025；Marcelino等人，2021）。这类模型已被广泛用于网络级和项目级的路面管理，以制定维护和修复计划（Alnaqbi等人，2024；Shahin，2005）。换句话说，预测模型通过识别需要关注的路面部分来辅助决策制定。此外，这些模型还帮助路面管理者根据预测结果选择最佳的处理方法和时机（Shahid等人，2025）。在此背景下，路面状况指数（PCI）常被用作路面管理的性能指标（Fang等人，2025；Hu等人，2022；Piryonesi，2019；Shahin，2005）。PCI通常包括复合表面损坏程度、路面年龄和路面材料等因素（Shahin，2005）。然而，PMS和PCI的复杂性因不同地区的资源状况而异（Kheirati和Golroo，2022；Wolters和Zimmerman，2010）。为了解决资源有限的问题，人们通过收集相关的路面数据来简化PCI的评估流程，从而降低PMS的实施成本（Kheirati和Golroo，2022）。

机器学习（ML）模型的应用通过分析路面数据及其他相关信息（如交通流量、气候条件和历史维护记录）进一步提升了预测精度（Gao等人，2022；Kang等人，2024）。ML算法已被用于预测路面性能（Bashar和Torres-Machi，2021；Ghodratabadi等人，2025；Gong等人，2018；Haddad等人，2022；Jing等人，2025；Jooste等人，2023；Karballaeezadeh等人，2020；Kheirati和Golroo，2022；Sholevar等人，2022；Zhao和Wang，2023）。ML路面性能模型有望提高传统回归模型的预测准确性（Martínez-Barrera等人，2015）。多项研究表明，ML模型通常优于传统方法（Mao等人，2025；Marcelino等人，2021）。最近的研究发现，人工神经网络（ANN）是应用最广泛的ML算法，其次是线性回归和非线性回归，以及混合模型和随机森林（RF）（Kang等人，2024）。ANN利用多层互连节点捕捉数据中的复杂模式和关系，使其在分类和回归任务中表现出色（Hamedi等人，2025；Mitchell，1997；Rebala等人，2019；Team，2023）。神经网络（NN）算法已被用于预测PCI，并取得了相对较好的结果（Radwan等人，2025b；Suman和Sinha，2012；Yang等人，2003）。然而，NN模型在训练阶段需要较大的数据集以避免测试阶段的过拟合问题（Marcelino等人，2021；Srivastava等人，2014；You等人，2020）。此外，ANN模型的“黑箱”特性也受到了一些研究者的关注（Alatoom和Al-Suleiman（Obaidat），2022）。

线性回归（LR）模型使用单个回归量或自变量来预测因变量，称为简单LR模型（Montgomery等人，2012）。多项研究表明，LR模型在预测路面状况方面的效果较差（Afridi等人，2024；Gong等人，2018）。随机森林（RF）模型基于多棵决策树，源自装袋集成学习技术（Breiman，2001；James等人，2013）。它通过多数投票进行分类任务或平均预测结果来减少过拟合问题（Breiman，2001；James等人，2013）。在多项关于路面状况预测的研究中，RF模型始终优于其他ML模型（Afridi等人，2025；Chen等人，2025；Goenaga等人，2022；Karballaeezadeh等人，2020；Khoshgoftaar等人，2007；Mansour等人，2023；Olowosulu等人，2021；Pérez Jara等人，2024）。例如，RF模型在预测准确性上优于支持向量机（SVM）、朴素贝叶斯（NB）和k近邻（KNN）等算法（Khoshgoftaar等人，2007）。在一项研究中，RF模型显示了预测结果与实际路面状况之间的强相关性，优于高斯过程回归（GPR）和M5P模型（Karballaeezadeh等人，2020）。RF在预测路面状况分类方面的准确性也高于NB算法（Olowosulu等人，2022）。最新研究表明，RF是最稳健的模型，其预测准确性高于支持向量回归（SVR）、KNN、LR和NN（Chen等人，2025），同时也优于CatBoost（Mansour等人，2023）。一项比较RF、SVR、梯度提升回归（GBR）、ANN和循环神经网络（RNN）的研究发现，RF在预测城市路面状况方面的准确性和稳健性方面与GBR相当（Pérez Jara等人，2024）。此外，RF的预测准确性可与极端梯度提升（XGBoost）相媲美，表明它是路面状况预测的稳健替代方案（Ahmed等人，2022；Shaheen等人，2025）。在最近的多项研究中，RF模型在预测PCI方面的准确性也优于NN和LR（Afridi等人，2025；Aranha等人，2023）。

在开发和应用ML模型进行路面性能预测的过程中，高质量的数据至关重要（Gao等人，2021；Hosseini和Smadi，2021；Liu等人，2024）。定期数据收集是确保预测准确性和长期有效性的关键。路面状况数据的收集可以通过手动方法或基于传感器的调查进行（Bennett等人，2007；Sholevar等人，2022）。手动方法包括视觉检查或挡风玻璃检查，而基于传感器的方法则需要专门的数据收集设备，可以是自动化的或半自动化的（Bennett等人，2007；Coenen和Golroo，2017；Sholevar等人，2022）。手动方法成本较低，但具有主观性和时间消耗性（Lyu等人，2025；Staniek，2021）。自动化路面损坏数据收集通常被认为是PMS的一部分（Underwood等人，2011）。然而，自动化方法在准确性、适应性和计算需求方面仍存在问题（Lyu等人，2025；Zhang等人，2024）。自动化路面损坏数据收集在全球高速公路上被广泛使用，但在城市地区，频繁的停车和交通模式可能导致其效果受限。此外，公用设施排水系统的存在也可能影响数据质量。因此，在密集的城市街道网络中，自动化方法可能无法始终提供可靠的结果。

在瑞典，不同市政当局根据可用资源、网络规模和维护优先级选择不同的路面状况数据收集方法（Afridi等人，2023）。但由于资源有限和网络规模较小，大多数市政当局仍依赖传统的挡风玻璃调查方法（Afridi等人，2023）。尽管这种方法具有主观性，但它能够以较低的成本和操作限制高效地收集路面状况数据。此外，瑞典市政当局通常使用本地开发的评估方法（W?gberg，2003），这是国际公认标准（ASTM，2020）的修改版本。同样，包括法国、爱尔兰、意大利和瑞士（Ragnoli等人，2018）、葡萄牙（Picado-Santos等人，2004）、丹麦（Wilén，2016）以及美国（Miller和Bellinger，2014）在内的多个欧洲国家也制定了路面损坏识别评估指南。

许多研究集中在路面性能预测上，但大多数研究关注的是国有道路或高速公路，而非市政街道网络。市政街道与高速公路在多个方面有所不同：街道通常是单车道，交通流量较低且模式变化较大。此外，街道上有更多的排水口和公用设施入口，局部损坏情况更频繁发生。这些因素对路面状况的影响不同于高速公路的均匀条件。针对市政街道（尤其是寒冷地区）的研究相对较少。寒冷气候条件会显著影响路面状况的恶化速度和模式（Doré和Zubeck，2009）。因此，在这些地区准确预测路面状况需要本地化的数据和模型来支持市政维护规划。

本文旨在通过改进路面状况预测来提升市政街道网络的维护水平。它评估并比较了三种ML算法（NN、RF和LR）在预测2022年住宅和非住宅街道柔性路面的PCI评级方面的性能。这些模型使用从瑞典斯凯莱夫特奥市获得的视觉评估路面状况数据开发而成。性能评估基于两个数据集：一个基于2018年的路面普查数据，另一个结合了2014年和2018年的数据。研究还评估了不同输入变量集对模型准确性的影响，包括与路面表面状况和交通相关的变量。此外，还研究了模型在不同维护处理类型下的预测能力。另一个目标是确定在城市市政环境中对PCI预测贡献最大的变量。

**2. 数据描述**
**2.1. 路面数据采集**
本研究使用的路面状况数据来自瑞典北部的斯凯莱夫特奥市，包括2014年、2018年和2022年进行的街道网络评估。数据通过挡风玻璃方法收集，即拍摄街道表面的GPS坐标照片。随后由市政专家进行后处理以评估路面状况。这种方法确保了与当地实践的一致性，因为市政当局长期以来一直依赖同一位专家进行评估。然而，这种方法在识别和评估损坏情况时仍可能存在一定主观性。新兴的计算机视觉技术，特别是基于机器学习和深度学习算法的技术，为自动化损坏识别和评估提供了巨大潜力，从而提高了未来建模的一致性和数据质量（Radwan等人，2025a）。数据包括街道路面功能、路面几何形状、路面年龄、路面损坏程度、PCI和交通流量等信息。路面数据库还记录了最近的维护活动，包括维护年份、维护方法和维护材料（Afridi，2024）。该市政当局不收集其街道网络的气候数据。此外，瑞典气象和水文研究所的最新数据显示，该市各区域的气候条件在过去几十年里相对稳定。由于这个原因，气候数据被排除在研究之外。斯凯莱夫泰市（Skellefte? Municipality）拥有大约400公里的街道铺装，这些铺装根据其功能被分为四类：住宅区街道、主干道、集散道路和工业区街道。在总街道网络中，336公里（78%）是住宅区街道，62公里（14%）是主干道，19公里（4%）是集散道路，12公里（3%）是工业区街道（Afridi，2024年）。主干道在街道网络中提供了最高的通行能力，通常交通流量也更大。住宅区街道通常位于居民区，设计时考虑了有限的车辆通行需求。而工业区街道则是专门为处理工业区的重交通流量而建造的。集散道路将住宅区街道和工业区街道与主干道连接起来，提供稍低的通行能力。

分析的街道网络被分为住宅区和非住宅区两类，其中非住宅区街道包括主干道、集散道路和工业区街道。

2.2. 铺装状况评估方法
斯凯莱夫泰市使用PCI评分（范围从0到100）来评估铺装状况，100表示状况极佳，0表示最差（Afridi等人，2024年）。专家们根据本地制定的指南（W?gberg，2003年）评估铺装表面状况，并考虑了六种类型的损坏：表面不平整（SU）、鳄鱼裂纹（ACR）、纵向和横向裂纹（CR）、车辙（RUT）、松散（LAR）以及其他缺陷（SD）（Afridi等人，2024年）。街道铺装状况的评估由专家按照表1中显示的指南进行（Afridi等人，2025年）。如表1所述，严重程度级别代表损坏类型的强度，而密度级别表示受影响的铺装表面比例。密度级别对应于处理这些损坏的难度级别，难度级别越高，维护工作越具有挑战性。这种复杂性是通过从铺装段的PCI评分中扣分来量化的（Afridi等人，2025年）。该市使用以下公式计算街道段的铺装状况（Estholm，2019年；Shahin，2005年）：
(1)
其中WDV是加权扣分值的缩写，WDV = 0.63636(x-10) - 0.001715(x-120)，x是该铺装段所有损坏的总扣分值。

表1. 铺装损坏评估指南
损坏类型严重程度级别密度级别（扣分）受影响的铺装百分比困难级别I 困难级别II 困难级别III
表面不平整（SU）低 <20 20 35 50 65 70
鳄鱼裂纹（ACR）低 <20 30 45 60 75 85
纵向/横向裂纹（CR）低 <20 51 30 50 75 85
车辙（RUT）低 <20 15 40 70 70 85
松散（LAR），包括沥青硬化低 <20 51 30 50 75 85
其他表面缺陷（SD）低 <20 51 10 20 40 60 85

该市根据PMS中的PCI评分将街道铺装状况分为四类（Afridi等人，2024年）：
- 绿色等级（81–100）：良好状况
- 黄色等级（61–80）：一般状况
- 红色等级（41–60）：较差状况
- 黑色等级（0–40）：非常差的状况

这些分类有助于街道网络管理者安排适当的维护活动，确保及时和有效的干预。图1展示了一段用于评估的住宅区街道，而表2提供了该街道铺装的详细信息，包括几何形状、损坏类型、严重程度和密度。该铺装段属于红色等级，表明其状况较差，需要立即进行维护处理。

下载：下载高分辨率图片（524KB）
下载：下载全尺寸图片
图1. 用于视觉铺装状况评估的住宅区街道段（图片由斯凯莱夫泰市提供）
表2. 住宅区街道铺装的属性和状况评估数据

街道类型街道名称街道段ID 长度（米）宽度（米）面积（平方米）
---------------------------------------- ----------------------------- ----------------------------- -------------------
住宅区街道 Pr?stgatan 2261 96 6 576
损坏类型严重程度扣分值（点）受影响的铺装百分比
------------------------ ----------------------------- -----------------------------
鳄鱼裂纹（ACR） -- -- 15 -- 75
车辙（RUT） -- -- 75 -- 70
其他缺陷（SD） -- -- 90 -- 90
WDV = 0.63636?(-10) - 0.001715?(-10)?(-120)

备注：根据PMS，该铺装段属于红色等级。

2.3. 数据清洗
斯凯莱夫泰市管理着大约400公里的街道铺装网络。然而，由于在数据清洗过程中排除了某些数据以提高分析的准确性，因此本研究使用的数据集是有限的。具体来说：
- 仅接受过轻微维护处理的街道（如裂缝密封或修补）被移除，因为这些处理不会显著改善铺装状况至“极佳”水平。
- 长期未接受任何处理的绿色等级街道也被排除。这些街道可能已经接受过处理，但在数据库中未更新。
- 未经处理但状况改善的街道（即PCI评分提高的街道）被认为是状况评估过程中存在错误，因此也被排除。

2.3.1. 用于模型的数据分类
数据集中保留了已知铺装年龄和三次状况评估（即PCI评分）的街道段，提供了足够的历史背景，以便准确预测铺装状况随时间的变化。这些街道段根据其功能分类为住宅区街道和非住宅区街道，每个类别分别用于开发和应用模型。表3显示了模型中使用的数据集。由于斯凯莱夫泰市住宅区街道的交通量相对稳定，因此只有非住宅区街道的数据包含了交通量信息。

表3. 用于模型开发的街道数据集（按功能类型分类）
街道组街道段数量收集的铺装状况数据年份
------------------------ ----------------------------- -------------------------------
非住宅区街道 229 2014, 2018, 2022
住宅区街道 38 2014, 2018, 2022

此外，为了开发基于维护处理的模型，非住宅区街道数据根据该市常见的铺装维护类型被分为四类（表4）。这些维护类型包括表面平整（MT1）、重新铺装（MT2）、铣刨和重新铺装（MT3）以及重大修复（MT4），用于开发额外的模型。目的是评估当数据按维护类型分段时模型的准确性是否有所提高。

表4. 按常见维护类型分类的非住宅区街道段数据
维护类型描述
----------------------------- -------------------
表面平整（MT1）在现有铺装表面铺设20–30毫米厚的沥青层，以提高行驶质量 70
重新铺装（MT2）在现有铺装表面额外铺设40毫米厚的表面层，以提高行驶质量 9
铣刨和重新铺装（MT3）去除现有沥青层并替换为新表面层 111
重大修复（MT4）去除几层现有铺装并铺设多层新沥青，并采取额外措施加强铺装 39

2.3.2. 模型数据集概述
用于模型的数据集被应用于预测2022年住宅区和非住宅区街道的PCI评分的各种方法。开发了以下模型：
- 根据2018年的数据集预测2022年住宅区和非住宅区街道的PCI评分。
- 使用2014年和2018年的数据集预测2022年住宅区和非住宅区街道的PCI评分。
- 考虑维护处理情况，根据2018年的数据集预测2022年非住宅区街道段的PCI评分。
- 考虑维护处理情况，使用2014年和2018年的数据集组合预测2022年非住宅区街道段的PCI评分。

2.3.3. 模型变量概述
模型中使用的变量包括六种损坏类型（SU、ACR、CR、RUT、LAR、SD）、加权损坏值（WDV）和之前的PCI评分（S）以及铺装表面年龄（A），适用于住宅区和非住宅区街道。交通量（T）仅包括非住宅区街道，代表轻交通（LT）和重交通（HT）。这些变量以多种方式组合，以分析两组街道的模型性能，如表5所示。

表5. 模型变量和输入变量集的描述
| 输入变量集 | 说明 |
|-----------------|--------|
| A | 表示评估时（即2022年）的铺装表面年龄，自上次维护处理以来 |
| A i | 仅表示铺装年龄 |
| A 和 D | |
| A、D 和 T | |
| A、D 和 S | 表示住宅区街道的完整变量集 |
| A、D、S 和 T | 表示非住宅区街道的完整变量集 |
| D | 表示2014年和2018年评估的所有损坏类型（SU、ACR、CR、RUT、LAR、SD）和WDV |
| T | 表示平均工作日交通量，包括轻交通和重交通 |

3. 模型描述
3.1. 模型开发
在本研究中，使用了多种机器学习算法来预测2022年街道铺装段的PCI评分。这些算法包括LR、NN和RF，使用了不同的数据集和输入变量集，适用于住宅区和非住宅区街道（如2.3.1数据清洗和2.3.1模型数据分类部分所述）。

在训练模型之前，进行了数据预处理。数据集被中心化和缩放，以确保变量之间的可比性，并防止具有较大规模的变量占据主导地位。RF和NN模型的训练和调整过程如下所述（Afridi等人，2025年）。

对于RF模型，指定了两个调整参数：
1) ntree：森林中的树的数量，范围在250到1000之间。
2) mtry：每次分割时随机抽取的特征候选数量，范围从2到10。

对于NN模型，定义了两个超参数：
1) size：隐藏层中的单元数量，范围从1到输入特征数量的一半。
2) decay：用于防止过拟合的正则化参数，范围在0.1到0.5之间。

3.2. 模型评估
建模过程使用R编程语言和caret2（分类和回归训练）包（Kuhn，2008）进行。为了确保可重复性，随机数生成器使用种子值123进行初始化。采用了k折交叉验证方法（ML中广泛使用的方法）来评估模型的预测准确性。在这种技术中，数据集被随机分为k个大小相等的子样本或折叠（James等人，2013；Jung，2018；Simon，2007）。每次迭代中，一个折叠用作验证集，其余的k-1个折叠用于训练。每次重复时随机分配折叠，以减少偏差和方差。这个过程重复k次，每个折叠都作为验证集一次，确保每个数据点都用于训练和验证（James等人，2013）。

在本研究中，使用了两种交叉验证（CV）方法：10折CV和5折CV。10折CV应用于住宅区和非住宅区街道的数据集（Afridi等人，2025）。同时，由于这些类别的数据集规模较小，5折CV应用于每个维护处理组（MT1–MT4）的模型。在10折CV方法中，数据被随机分为10个大小相等的子样本。每次迭代中，一个子样本用作验证集，其余九个子样本用于训练模型。这个过程重复10次，为每个性能指标生成100个估计值。同样，在5折CV方法中，数据被分为5个大小相等的子样本，该过程重复5次，为每个性能指标生成25个估计值。在每种情况下，模型的性能都是基于所有折叠的平均值进行评估的。

为了考虑模型评估的不确定性，每种CV方法都重复了多次。这种重复允许分析性能指标在迭代中的变化性。它反映了模型训练的固有随机性，并提供了关于模型预测的稳健性和稳定性的见解。对于RF，随机性来自于在每个决策树分割时随机选择特征。对于NN，通过设置固定的随机种子来稳定权重的随机初始化。尽管LR是确定性算法，但它也被包含在所有模型的相同随机CV过程中，以确保一致性和可比性。

评估过程包括计算所有迭代中每个性能指标的中值。这种方法提供了模型性能的稳健估计。它还确保了10折或5折CV方法的可靠性和代表性。用于评估模型拟合度和预测能力的性能指标包括平均绝对误差（MAE）、均方根误差（RMSE）和决定系数（R2）（如以下所示）。

较低的MAE和RMSE值表示模型准确性更高。相比之下，接近1或-1的R2值表示强大的预测性能。均方根误差（RMSE）对较大的预测误差的惩罚更为严厉，而平均绝对误差（MAE）则对所有误差的惩罚程度相同。在通过交叉验证（CV）评估模型后，使用整个数据集生成了预测的和观察到的PCI评分以及R2和Spearman等级相关系数，并进行了绘制以供进一步分析。对于包含N对观测值的数据集，使用以下公式来确定R2：(5)其中Δrank表示对应值等级之间的差异。此外，为了提高模型的可解释性，使用了caret包中的函数来评估变量重要性（VARIMP）。对于逻辑回归（LR）模型，重要性是根据每个预测因子的t统计量的绝对值来确定的。而对于随机森林（RF）模型，则通过测量在置换变量时预测误差的增加（准确率的平均降低）来评估其重要性。在神经网络（NN）模型中，通过分析输入层和隐藏层之间的连接权重来估计变量重要性。

4. 结果
本节展示了开发用于预测2022年住宅和非住宅街道PCI评分的模型结果，这些模型涵盖了四年的时间范围，随后还介绍了基于维护的非住宅街道模型。模型使用了2018年的数据集以及2014年和2018年的合并数据集，并采用了不同的输入变量组合。模型通过CV进行评估，住宅和非住宅街道模型使用了10折CV，而基于维护的模型使用了5折CV。为了便于比较不同模型和数据集，展示了训练阶段的性能指标（包括MAE、RMSE和R2）以及测试阶段的R2和Spearman等级相关系数。

4.1. 住宅街道
4.1.1. 使用2018年数据集的预测模型
基于2018年数据集的九个模型在预测2022年住宅街道PCI评分方面的表现总结在表6中。
表6. 使用10折CV（2018年数据集）预测2022年住宅街道PCI评分的模型性能指标的中位数比较
模型名称变量训练阶段测试阶段 MAE RMSE R2
LR simple A 17.02 21.05 0.01 0.01 0.13
LRA+D 10.78 13.94 0.57 0.55 0.73
A+D+S 10.70 14.22 0.57 0.55 0.73
RFA 17.26 21.42 0.03 0.14 0.34
A+D 10.67 14.11 0.56 0.69 0.84
A+D+S 10.27 13.50 0.58 0.74 0.86
NNA 16.84 21.05 0.02 0.02 0.14
A+D 10.61 14.21 0.54 0.56 0.74
A+D+S 10.83 13.85 0.56 0.56 0.72
从表6可以看出，增加额外变量可以提高所有模型的性能。在这种情况下，使用完整变量集（A+D+S）的RF模型在训练阶段表现出最佳的整体性能，它获得了最高的R2（0.58）和最低的误差（MAE = 10.27，RMSE = 13.50）。其次是LR（A+D）和LR（A+D+S）模型。当增加变量时，RF（A+D+S）模型在MAE和RMSE上也有所改善，表现优于LR和NN模型。令人惊讶的是，将LR模型从A+D扩展到完整变量集A+D+S会导致RMSE的增加。同样，将NN模型扩展到包含所有变量也会导致MAE的轻微增加。
在测试阶段，增加变量同样能提升性能，使用完整变量集（A+D+S）的RF模型显示出最高的准确率。RF（A+D+S）模型的R2为0.74，表明预测评分和观察评分之间存在强线性和单调关系。其次是使用A+D变量的RF模型，其R2为0.69。将LR模型从A+D扩展到A+D+S并未改善R2，而NN模型则略有提升。这一点在散点图（图2）中得到了进一步说明，该图可视化了不同模型的预测和观察评分。图2中的每个散点代表一条街道段的预测和观察评分对。该图用于评估测试阶段中不同输入变量组合下模型的准确性。图中显示了1:1完美预测线以及拟合趋势线，R2值展示了模型性能。对于表现最佳的RF（A+D+S）模型，分析揭示了预测2022年住宅街道评分的五个最重要输入特征：Status2018（100%）、WDV（94%）、LAR（62%）和A（18%），如图3所示。

4.2. 非住宅街道
4.2.1. 使用2018年数据集的预测模型
使用2018年数据集的15个模型在预测2022年非住宅街道PCI评分方面的表现总结在表8中。在训练阶段，增加变量普遍提高了模型性能。在这方面，使用完整变量集（A+D+S）的RF模型表现最佳，其R2最高（0.58），误差最低（MAE = 10.27，RMSE = 13.50）。其次是LR（A+D）和LR（A+D+S）模型。当增加变量时，RF（A+D+S）模型在MAE和RMSE上也有所改善，表现优于LR和NN模型。值得注意的是，将LR模型从A+D扩展到完整变量集A+D+S会导致RMSE的增加。同样，将NN模型扩展到包含所有变量也会导致MAE的轻微增加。
在测试阶段，增加变量同样能提升性能，使用完整变量集（A+D+S）的RF模型显示出最高的准确率。RF（A+D+S）模型的R2为0.74，表明预测评分和观察评分之间存在强线性和单调关系。其次是使用A+D变量的RF模型，其R2为0.69。将LR模型从A+D扩展到A+D+S并未改善R2，而NN模型略有提升。这一点在散点图（图2）中得到了进一步说明，该图可视化了不同模型的预测和观察评分。图2中的每个散点代表一条街道段的预测和观察评分对。该图用于评估测试阶段中不同输入变量组合下模型的准确性。图中显示了1:1完美预测线以及拟合趋势线，R2值展示了模型性能。对于表现最佳的RF（A+D+S）模型，分析揭示了预测2022年住宅街道评分的五个最重要输入特征。

4.2.2. 使用2014年和2018年合并数据集的预测模型
表7展示了使用10折CV和2014年与2018年合并的条件评估数据预测2022年非住宅街道PCI评分的另外九个模型的比较。与表6（仅使用2018年数据集）的结果类似，增加额外变量一致地提高了模型的准确性。
表7. 使用2014年和2018年合并数据集的10折CV预测2022年非住宅街道PCI评分的模型性能指标的中位数比较
模型名称变量训练阶段测试阶段 MAE RMSE R2
LR simple A 17.02 21.05 0.01 0.01 0.13
LRA+D 11.02 14.16 0.55 0.57 0.75
A+D+S 10.94 14.24 0.55 0.57 0.75
RFA 17.29 21.42 0.03 0.14 0.34
A+D 11.01 14.07 0.56 0.74 0.87
A+D+S 10.54 13.72 0.58 0.78 0.89
NNA 17.13 21.10 0.02 0.02 0.14
A+D 10.68 14.20 0.56 0.58 0.75
A+D+T 10.98 14.29 0.54 0.59 0.75
在训练阶段，使用完整变量集（A+D+S）的RF模型再次表现出最佳性能，其误差最低（MAE = 10.54，RMSE = 13.72），R2最高（0.58）。紧随其后的是NN（A+D）和LR（A+D）及（A+D+S）模型，它们的MAE和RMSE略高，R2值略低。
在测试阶段，使用完整变量集（A+D+S）的RF模型再次胜过所有模型，其R2为0.78。其次是RF（A+D），其R2为0.74。NN和LR模型的表现相似，增加变量后都有所提升。所有模型在测试阶段的预测准确率趋势在图4中展示。图中显示了预测评分与观察评分的散点图，以及拟合趋势线和1:1完美预测线。在模型中，RF（A+D+S）与趋势线的吻合度最高，突显了其在预测住宅街道条件方面的优越性。此外，RF（A+D+S）模型还获得了最高的（未提供具体数值），反映了预测评分和观察评分之间的高度对应关系，无论是线性还是单调趋势。在表现最佳的RF（A+D+S）模型中，预测2022年住宅街道评分的五个最重要特征是Status2018（100%）、WDV（92%）、LAR（67%）和A（22%），如图5所示。

总体而言，RF（A+D+S）模型被证明是最准确和可靠的模型。它使用2018年数据集以及2014年和2018年的合并数据集都能有效预测住宅街道条件。

4.3. 基于维护的非住宅街道模型
4.3.1. 使用2018年数据集的预测模型
使用2018年数据集的15个模型在预测2022年非住宅街道PCI评分方面的表现总结在表8中。在训练阶段，增加变量普遍提高了模型性能。在这方面，RF模型始终优于LR和NN模型，且随着变量数量的增加，性能进一步提升。使用完整变量集（A+D+S+T）的RF模型获得了最低的误差（MAE = 7.66，RMSE = 10.76）和最高的R2（0.60），表明其对数据的拟合度最佳。其次是RF（A+D+T）和RF（A+D），其R2分别为0.57和0.49。对于NN模型，组合（A+D）在MAE（9.62）和RMSE（12.44）方面取得了最佳结果，R2为0.49。增加更多变量略微提高了NN模型的性能，但MAE和RMSE略有提升，R2略有下降。同样，基于（A+D+T）的LR模型在MAE（9.88）和R2（0.48）方面表现最佳，而在RMSE方面，使用（A+D+S+T）变量集的模型表现最佳，R2为11.85。

4.3.2. 使用2014年和2018年合并数据集的预测模型
表9总结了使用2014年和2018年合并数据集的另外15个非住宅街道模型的表现。在训练阶段，RF模型始终优于LR和NN模型，且随着变量数量的增加，性能提升。与基于2018年数据集的模型（表8）类似，使用完整变量集（A+D+S+T）的RF模型显示出最低的误差（MAE = 7.64，RMSE = 10.87）。其次是RF（A+D+T），其R2为0.57。这表明即使变量集减少，仍能提供较强的预测性能。LR（A）模型的预测性能最低，但如预期，随着变量的增加，其预测准确性有所提高。例如，LR（A+D）和LR（A+D+T）的R2分别为0.50和0.48。NN模型在添加变量后有所提升，但使用完整变量集（A+D+S+T）时表现不如RF和LR。
图6进一步说明了这一点，该图展示了每个模型非住宅街道预测和观察评分的散点图。图中包括1:1完美预测线和拟合趋势线，R2值突出了模型性能。RF（A+D+S+T）和RF（A+D+T）模型与拟合趋势线的吻合度最高，显示出在测试阶段最高的准确性。相比之下，LR模型的散点分布较广，表明其预测准确性较低，而NN模型的拟合度适中。

对于表现最佳的RF（A+D+S+T）模型，输入变量中最重要的五个特征是Status2018（100%）、WDV（92%）、LAR（67%）和A（22%），如图5所示。此外，RF（A+D+S+T）模型取得了最高的0.88值，表明预测和观测到的PCI评级在线性和单调关系上都有很强的一致性，这突显了其在预测路面状况方面的可靠性。预测和观测到的PCI评级之间的相关性在图8中得到了说明，展示了每个模型在测试阶段对不同变量集的非住宅街道的预测准确性。该图还包括了1:1的完美预测线和拟合的趋势线，并展示了R2值以展示整体模型性能。RF（A+D+S+T）和（A+D+T）模型的散点图趋势线与观测到的PCI评级非常吻合，这从视觉上证实了它们的高预测准确性。相比之下，LR和NN模型的相关性较低。它们在趋势线周围的散布较广，反映了预测准确性的降低。在测试阶段，表现最佳的RF（A+D+S+T）模型的前五个预测变量在图9中被突出显示。其中，WDV的影响最大（100%），其次是Status2018（98%）、LAR（57%）和LT（44%）用于预测2022年的PCI评级。

此外，RF（A+D+S+T）模型在预测和观测到的PCI评级之间的相关性最高，达到了0.88，表明在线性和单调关系上都有很强的对应关系，这凸显了其在预测路面状况方面的可靠性。图8展示了预测和观测到的PCI评级之间的相关性，突显了每个模型在不同变量集下对非住宅街道的预测准确性。该图还包括了1:1的完美预测线和拟合的趋势线，并展示了R2值以展示整体模型性能。RF（A+D+S+T）和（A+D+T）模型的散点图趋势线与观测到的PCI评级非常吻合，从视觉上证实了它们的高预测准确性。相比之下，LR和NN模型的相关性较低，它们在趋势线周围的散布较广，反映了预测准确性的降低。在测试阶段，表现最佳的RF（A+D+S+T）模型的前五个预测变量在图9中被突出显示。其中，WDV的影响最大（100%），其次是Status2018（98%）、LAR（57%）和LT（44%）用于预测2022年的PCI评级。

总之，RF（A+D+S+T）模型作为最准确和可靠的模型脱颖而出。它能够有效预测非住宅街道的PCI评级，无论是使用2018年的数据集还是结合2014年和2018年的数据集。

4.3 非住宅街道——基于维护处理数据的模型
4.3.1 使用2018年数据集的预测模型
为了评估LR、NN和RF模型对非住宅街道的预测能力，仅使用完整的变量集（A+D+S+T），基于2018年数据集开发了12个基于维护的模型。这些模型分别针对每种维护处理类型MT1、MT2、MT3和MT4进行了开发（表3）。它们在预测2022年PCI评级方面的性能总结在表10中。图10展示了模型预测和观测到的PCI评级的视觉比较，包括1:1的完美预测线和拟合的趋势线，并展示了R2值以展示模型性能。

表10. 使用2018年数据集，基于处理类型和输入变量（A+D+S+T），对非住宅街道的PCI评级进行预测的15个模型的性能指标的中位数值比较（分数相对于最具影响力的变量WDV=100进行缩放）。

总体而言，RF（A+D+S+T）模型是最准确和可靠的模型。它能够有效预测非住宅街道的PCI评级，无论是使用2018年数据集还是结合2014年和2018年的数据集。

4.3.2 使用2014年和2018年数据集的组合模型的预测
表11展示了另外12个基于维护的模型在使用完整变量集（A+D+S+T）预测2022年PCI评级方面的性能。这些模型基于2014年和2018年数据集的组合，涵盖了各种维护处理类型MT1、MT2、MT3和MT4（表3）。模型的预测和观测到的PCI评级在图11中进行了绘制，包括1:1的完美预测线、拟合的趋势线以及相应的R2值，以展示模型性能。

图11. 使用2014年和2018年数据集的组合，基于处理类型和输入变量（A+D+S+T），对非住宅街道的PCI评级进行预测的15个模型的性能指标的中位数值比较。

对于MT1，RF模型的性能优于LR和NN模型，实现了最低的MAE（9.39）和RMSE（12.55），以及最高的测试R2（0.80）。LR模型的表现也不错，保持了0.64的训练R2和0.79的高相关性。然而，NN模型表现较差，显示出最高的错误和最低的测试R2（0.56）。

在MT2中，LR和NN模型在训练阶段的R2均为1.00，这可能表明由于数据集非常小而导致了过拟合。相比之下，RF模型提供了更平衡的性能，具有较低的MAE（2.67）和RMSE（3.55）以及合理的测试R2（0.86）。然而，较小的样本量限制了结果的可靠性和适用范围，强调了未来研究需要更多数据。

对于MT3，RF模型再次优于LR和NN模型，在测试阶段实现了最高的测试R2（0.78）和强相关性（0.87）。LR模型在训练和测试阶段的R2值分别为0.37和0.45。NN模型的表现不稳定，MAE较低（9.52），但测试阶段的R2相对较弱（0.75）。

最后，对于MT4，NN模型在训练阶段表现出最佳性能，实现了最高的R2（0.75）和最低的MAE（5.82），但在测试阶段的R2值中排名最后（0.72）。RF模型紧随其后，R2为0.74。LR模型在测试阶段的性能较好，但错误（MAE和RMSE）较高。相关性值表明所有模型在这一类别中预测和实际路面状况之间有中等程度的一致性。

总体而言，基于2018年数据集，RF（A+D+S+T）模型在MT1、MT2、MT3和MT4中是最稳定的基于维护的模型。它在训练阶段的错误较少，测试阶段的R2和性能指标较高。

4.3.2 使用2014年和2018年数据集的组合模型的预测
表11展示了使用完整变量集（A+D+S+T）预测2022年PCI评级的另外12个基于维护的模型的性能。这些模型基于2014年和2018年数据集的组合，涵盖了各种维护处理类型MT1、MT2、MT3和MT4（表3）。模型的预测和观测到的PCI评级在图11中进行了绘制，包括1:1的完美预测线、拟合的趋势线以及相应的R2值，以展示模型性能。

图11. 使用2014年和2018年数据集的组合，基于处理类型和输入变量（A+D+S+T），对非住宅街道的PCI评级进行预测的15个模型的性能指标的中位数值比较。

对于MT1，RF模型的性能优于LR和NN模型，实现了最低的MAE（9.36）和RMSE（13.22），以及测试R2（0.79）。此外，RF模型还实现了非常强的相关性（0.79）。

在MT2中，LR模型在训练阶段的R2很高（25.97），但测试阶段的R2为1.00，这可能表明由于数据集非常小而导致了过拟合，而RF模型提供了更平衡的性能，具有较低的MAE（2.67）和RMSE（3.55）以及合理的测试R2（0.71）。NN模型在训练和测试值方面的表现不如RF模型一致。然而，这些结果受到小样本量的限制，需要未来收集更多数据以提高模型的可靠性和泛化能力。

对于MT3，RF模型再次优于LR和NN模型，在测试阶段实现了最高的测试R2（0.87）和强相关性（0.87）。LR模型在训练和测试阶段的R2值分别为0.37和0.45。NN模型的表现不稳定，MAE较低（9.52），但测试阶段的R2相对较弱（0.75）。

最后，对于MT4，NN模型在训练阶段表现出最佳性能，实现了最高的R2（0.75）和最低的MAE（5.82），但在测试阶段的R2值中排名最后（0.72）。RF模型紧随其后，R2为0.74。LR模型在测试阶段的性能较好，但错误（MAE和RMSE）较高。相关性值表明所有模型在这一类别中预测和实际路面状况之间有中等程度的一致性。

总体而言，基于2018年数据集，RF（A+D+S+T）模型在MT1、MT2、MT3和MT4中是最稳定的基于维护的模型。它在训练阶段的错误较少，测试阶段的R2和性能指标较高。

5. 讨论
本节详细讨论了为预测2022年住宅和非住宅街道的PCI评级而开发的72个机器学习模型。

5.1 住宅街道模型
模型的性能受到用于PCI预测的输入变量的显著影响。仅使用变量（A）会导致所有模型的性能较差，错误率高且R2值非常低。在各种模型和输入变量集的情况下，添加变量（D）和（S）可以一致地提高模型性能。此外，包含完整变量集（A+D+S）的模型比仅使用变量（A）或（A+D）的模型提供了更准确的预测。在这方面，RF（A+D+S）模型在训练和测试阶段都表现突出。这一趋势也在LR和NN模型中观察到，尽管它们的性能略低于RF模型。尽管如此，无论使用哪种数据集，RF模型的性能始终略高于LR和NN模型。在RF模型中，包含变量（S）增强了模型的能力，但在LR和NN模型中观察到轻微的性能下降。

通过2018年数据集（表6和图2）与2014年和2018年数据集的组合（表7和图4）的结果比较显示，额外数据略微提高了模型性能。对于RF模型，添加数据后错误指标略有增加，尽管它略微提高了模型解释方差和保持预测一致性的能力。对于NN和LR模型，额外数据也导致相关性略有改善，尽管错误指标的变化很小。

在性能指标方面，RF模型在所有变量集和数据集中始终优于NN和LR模型。使用完整变量集（A+D+S）的RF模型实现了最低的MAE和RMSE以及最高的R2。虽然LR和NN模型随着变量的增加而有所改进，但在减少错误和解释能力方面仍不如RF模型。NN模型相对于RF模型的较低性能可能是由于数据集较小，因为NN模型通常需要更多的数据才能有效运行并避免过拟合。

使用R2在测试阶段进行的相关性分析显示，RF（A+D+S）在两个数据集中都取得了最高的值，表明其具有强大的预测能力和随着时间推移对PCI评级进行排序的一致性。NN模型在相关性和R2方面略有改进，但仍低于RF模型。这些较高的R2值表明，当包含历史数据时，RF模型能更有效地捕捉路面退化趋势。

总体而言，在预测2022年街道路面的PCI评级方面，RF（A+D+S）模型在所有数据集中都是长期预测方面相对最可靠的模型。变量重要性分析显示Status2018和WDV是最具影响力的预测变量，而LAR、A和SU也在所有输入特征中做出了显著贡献。这些变量的相对重要性在2018年数据集和2014年和2018年数据集的组合中保持一致，突显了它们在准确预测PCI评级中的关键作用。

5.2 非住宅街道模型
随着额外变量（D、T和S）的加入，非住宅街道模型的性能得到了提高。使用（A+D+S+T）的模型在训练和测试阶段的表现始终优于简单模型，其中RF（A+D+S+T）的表现最佳。NN模型在添加更多变量后也有所改进，特别是（A+D+T）和（A+D+S+T）。LR模型也有所提升，但受益于包含损坏和交通数据。总体而言，添加更多变量显著提高了非住宅街道的预测准确性。

在比较2018年数据集（表8和图6）和2014年和2018年数据集的组合（表9和图8）的模型性能时，包含2014年和2018年的数据通常会导致大多数模型的性能略有提高。在两个数据集上训练的模型在测试阶段表现更好，R2略有增加，尽管某些模型的R2有所下降。在两个数据集中，MAE和RMSE的变化很小，而RF模型的错误指标略有下降，但相关性有显著改善。神经网络（NN）模型的结果在相关性方面有所提高，而逻辑回归（LR）模型在使用组合数据集时的改进幅度较小。在性能指标方面，随机森林（RF）模型在所有变量集和数据集的训练中始终优于NN和LR模型，具有更低的平均绝对误差（MAE）和均方根误差（RMSE）值以及更高的R2值。具体来说，RF（A+D+S+T）模型表现最佳，在两个数据集中都获得了最高的R2值。尽管NN模型在增加变量后有所改进，但仍然不如RF模型。尽管LR模型在增加变量后也有改进，但在MAE、RMSE和R2方面仍然是最弱的。总体而言，像RF和NN这样的更复杂模型在捕捉非住宅街道条件的非线性关系方面表现更好。然而，NN相对于RF的较弱表现可能是由于数据集有限，因为NN通常需要更多的数据才能达到显著的性能。

相关性分析（以及R2值）表明，增加变量可以提高与观察到的PCI评级的相关性，尤其是对于RF和NN模型。RF（A+D+S+T）模型在测试中获得了最高的R2值，显示出更好的数据拟合度。虽然NN和LR模型也从增加变量中受益，但与RF相比，它们的改进效果不那么明显。尽管LR模型的R2值较低，但其性能更为稳定，但在捕捉潜在数据关系方面效果较差。NN模型的表现较为中等，在R2和其它指标上的改进幅度小于RF模型。

总体而言，RF（A+D+S+T）是预测2022年非住宅街道铺装PCI评级的最有效模型，在训练和测试中均实现了最低的MAE和RMSE以及最高的R2值。对RF（A+D+S+T）模型的变量重要性分析显示，在输入变量中，WDV和Status2018是最具影响力的预测因子，其次是LAR、LT和A。这些关键变量通过捕捉影响铺装劣化的关键因素，增强了模型在两个数据集中的预测准确性和可靠性。

基于维护处理数据的模型（MT1、MT2、MT3和MT4）使用2018年数据集（表10和图10）以及2014年和2018年的组合数据集（表11和图11）进行了评估。在仅使用完整输入变量集（A+D+S+T）预测2022年PCI评级时，不同维护处理类型的模型性能存在显著差异。对于MT1街道段，RF模型的表现优于LR和NN模型，但在结合2014年和2018年数据集后R2值略有下降。这表明RF模型能够很好地泛化旧数据。LR模型在结合数据集后的测试R2值略有提高，而NN模型在测试中有所改进，但在训练中表现不稳定。RF模型在训练和测试中均获得了最高的R2值，其较低的MAE和RMSE值证实了其在预测MT1街道段PCI评级方面的更好能力。小样本量限制了MT2街道段的发现结果，突显了未来需要收集更多数据以提高模型稳健性和泛化能力。特别是，所有模型在训练中的R2值均为1.00，表明可能存在过拟合现象。在测试中，RF模型的R2值下降，表明其泛化能力减弱。LR模型保持了完美的R2值，但MAE和RMSE较高，这引发了担忧。NN模型的表现最不稳定，R2值显著下降，表明其性能受到数据集规模的限制。

在MT3中，RF模型再次表现出比LR和NN模型更强的性能，在结合数据集的测试阶段保持了稳定的表现。另一方面，NN模型在结合数据集后表现显著下降，难以捕捉复杂的铺装模式。尽管存在这些差异，RF模型的性能指标保持稳定，显示出其在不同数据集中准确排名铺装条件的能力。对于MT4街道段，NN模型在测试中表现最佳，R2值有所提高。这表明NN模型在预测MT4街道段的PCI评级时可以从额外的历史数据中受益。RF模型也表现良好，尽管在结合数据集后R2值略有下降。然而，LR模型在训练中的表现较差，使用组合数据集时性能显著下降。有趣的是，RF和NN模型的某些性能指标在各个数据集中几乎相同，这进一步证实了NN模型在预测MT4铺装表面PCI评级方面的有效性。

在市政层面，由于资源和预算有限，应用预测模型进行铺装状况评估时必须平衡准确性和实用性。重点应放在找到在现有资源范围内提供可接受性能的最具成本效益的模型上。不同模型（LR、RF和NN）的结果是基于挡风玻璃调查数据开发的。这些模型为其他地区的潜在应用提供了有价值的见解，并且即使依赖人工数据收集（如挡风玻璃调查），也可以以成本效益的方式实现。然而，此类调查可能存在主观性，从而影响模型的可靠性和泛化能力。在不同评估实践的市政区，模型的表现可能会有所不同。变异性可能源于个别评估的差异、街道清查期间捕获的图像质量以及环境条件。

包括多个数据集（如2014年和2018年的组合数据）在模型性能上显示出边际改进，尤其是在相关性和解释方差方面。然而，市政层面面临的重大挑战是随时间保持数据的一致性和可用性。为了解决这些限制，市政当局可以采用标准化的评级程序，为铺装状况检查员提供培训，并确保调查协议的一致性。制定明确且可重复的评估指南可以减少人为偏见，提高输入数据的可靠性。从长远来看，市政当局可以考虑整合自动化或半自动化方法，特别是对于交通流量均匀的街道（例如主要街道和集散街道）。然而，由于资源有限，自动化方法可能不适用于交通流量低的住宅街道。此外，安装在垃圾收集车辆上的低成本智能手机检查工具可以提高数据准确性和客观性，尽管这些工具并不完美。这些技术可以补充挡风玻璃调查，使数据收集过程更加一致和可扩展。

变量在确定铺装状况预测中的重要性对于优化模型输入至关重要。RF模型在使用完整变量集时表现最佳，无论是住宅街道还是非住宅街道。使用完整变量集显著提高了预测准确性。然而，收集交通和损坏等变量数据可能需要额外的手动工作，从而增加成本。鉴于市政当局的资源限制，关注仍能提供足够预测性能的简化变量集可能更为实际。此外，RF模型在准确性和一致性之间提供了最佳平衡，使其成为预测不同维护处理铺装表面PCI评级的最实用选择。这种方法还有助于识别最有效的维护措施，加强市政层面的主动铺装管理。

总体而言，资源有限的市政当局可以通过识别不同街道类型和维护处理的最佳模型来采纳本研究的结果。此外，可以使用成本效益高的挡风玻璃调查来定义最低数据要求。通过关注关键模型和变量，市政当局可以在平衡准确性、成本和实用性的同时做出数据驱动的决策。这些策略有助于应用机器学习预测模型，弥合研究与市政街道铺装管理实践之间的差距。

本研究评估了三种机器学习算法（LR、RF和NN），使用不同的输入变量集预测住宅和非住宅街道的PCI评级。目标是使用来自瑞典Skellefte?市街道铺装网络的数据集（2018年和2014-2018年的组合数据集）来预测2022年的PCI评级。输入变量包括A（自上次维护以来的铺装年龄）、D（2014年和2018年的所有损坏情况，包括加权损坏WDV）、T（工作日的平均交通量，包括轻载和重载）以及S（2014年和2018年评估的先前PCI评级）。研究的主要发现总结如下：
- 对于住宅街道模型，包含（A+D）和（A+D+S）变量集的模型比仅使用变量（A）的模型表现显著更好。这种改进提高了预测准确性和与实际铺装状况的相关性。使用所有输入变量（A+D+S）的RF模型在训练和测试阶段始终为住宅街道提供了最准确的预测。在表现最佳的RF（A+D+S）模型中，Status2018、WDV和LAR是预测2022年PCI评级的最重要因素。使用2014年和2018年的组合数据集略微提高了测试性能，尽管训练性能略有下降。
- 对于非住宅街道模型，增加变量后性能有所提高。RF（A+D+S+T）模型在两个数据集中始终取得了最佳结果，表明其在预测2022年PCI评级方面的稳健性。对于表现最佳的RF（A+D+S+T）模型，WDV、Status2018和LAR是最重要的变量。对于2014年和2018年的组合数据集，LR和NN模型也有改进，但RF模型的预测准确性更高。RF（A+D+S+T）显示出略好的结果，在训练阶段性能误差略有下降。
- 此外，对于基于维护处理的非住宅模型，RF（A+D+S+T）成为在2018年和2014-2018年组合数据集中最稳健的模型，在训练和测试阶段都表现更好。
- 总体而言，这些发现强调了RF预测模型的有效性，通过将铺装干预措施从被动转向主动，从而实现了数据驱动的铺装维护，改善了市政层面的资源分配。

本研究未包括气候数据，因为研究区域的天气条件较为均匀。未来的研究可以纳入气候变异性，以提高模型在不同环境条件下的适用性。

作者贡献声明：
Muhammad Amjad Afridi：撰写——原始草稿、可视化、验证、软件、资源、方法论、调查、正式分析、数据管理、概念化。
Sigurdur Erlingsson：撰写——审阅与编辑、监督、资源、项目管理、方法论、资金获取、概念化。

热点排行