基于元启发式优化与XGBoost的加拿大阿尔伯塔省野火易发性精准制图:兼顾预测性能、稳健性与驱动因素可解释性的新框架

《International Journal of Applied Earth Observation and Geoinformation》:Metaheuristic optimizer combined with advanced machine learning algorithm for accurate wildfire susceptibility in Western Canada: A novel approach

【字体: 时间:2026年04月24日 来源:International Journal of Applied Earth Observation and Geoinformation 8.6

编辑推荐:

  为解决现有混合野火易发性研究多关注预测准确性,而较少探讨伪缺失样本(Pseudo-absence)不确定性与不同制图策略一致性的问题,本研究开发了一套覆盖加拿大阿尔伯塔全省的500米分辨率野火易发性制图框架。研究人员结合极限梯度提升(XGBoost)模型与四种群体智能元启发式优化器(GWO、PSO、WOA、ASO)及SHAP可解释人工智能,比较了随机、缓冲区和环境分层三种伪缺失样本策略,并集成其结果以降低制图的空间变异性。结果表明,GWO-XGBoost模型性能最优(平均AUC达0.958),SHAP分析揭示年均温度、风速和相对湿度是关键驱动因子,最终制图识别出阿尔伯塔省中北部存在持续的高风险带。该框架为火灾季前规划、目标燃料管理、早期预警和减灾资源空间优先排序提供了决策支持工具。

  
在全球气候变暖的背景下,野火活动日益频繁,对生态系统、社区和基础设施构成了巨大威胁。准确、可解释且空间稳健的野火易发性制图,对于灾害预防和资源管理至关重要。然而,尽管相关研究方法层出不穷,现有的混合模型研究往往过于追求预测的“正确性”,而忽视了两个关键的科学“不确定性”来源:一是用于模型训练的“伪缺失样本”(即假定未发生火灾的地点)该如何选择才更合理?不同的选择策略是否会得出迥异的火灾高风险区地图?二是不同建模策略得出的“热点”图在空间上是否一致、可靠?在加拿大野火重灾区阿尔伯塔省,2023年过火面积高达220万公顷,创下历史纪录,这使得开发一套既能精准预测、又能清晰解释、且对建模假设具备稳健性的省级尺度野火易发性框架,显得尤为迫切和具有现实意义。
为了回答这些问题,由Muhammad S. Khan领衔的研究团队在《International Journal of Applied Earth Observation and Geoinformation》上发表了一项创新性研究。他们提出了一个结合了先进机器学习与群体智能优化的综合框架,旨在为阿尔伯塔省绘制一张兼具高精度、强解释力和空间一致性的野火风险“图谱”。
本研究主要采用了以下关键技术方法:首先,收集了阿尔伯塔省2000-2023年间面积大于100公顷的1733个历史野火点数据,以及地形、气候、植被和人为活动等四大类共15个预测因子。其次,为评估建模的不确定性,创新性地采用了随机、缓冲区和环境分层三种策略来生成伪缺失样本(非野火点)。接着,利用空间分块法划分训练集与测试集以减少空间泄漏。然后,以极限梯度提升(XGBoost)为基线模型,引入灰狼优化(GWO)、原子搜索优化(ASO)、鲸鱼优化算法(WOA)和粒子群优化(PSO)四种元启发式算法对其进行超参数优化,构建了四个混合优化模型(XG-GWO, XG-ASO, XG-WOA, XG-PSO)。最后,通过严格的性能评估、空间变异性分析、基于中位数方法的集成制图,并利用SHAP可解释人工智能技术对模型决策进行解读,量化了各环境驱动因子的重要性。
研究结果
4.1. 多重共线性分析
所有15个预测因子的方差膨胀因子(VIF)均小于10,容忍度均大于0.1,表明预测因子间不存在严重的多重共线性问题,适合用于后续建模。
4.2. 模型性能比较
在所有三种伪缺失样本策略(随机、缓冲区、分层)下,经过元启发式算法优化的XGBoost模型性能均显著优于基线XGBoost模型。其中,GWO-XGBoost(XG-GWO)模型表现最为突出,其在测试集上的平均准确率、ROC曲线下面积(AUC)、平均精度(AP)和均方根误差(RMSE)分别为0.910、0.958、0.944和0.292。这表明GWO算法能够更稳定、有效地搜索XGBoost的超参数空间,从而获得更优的判别能力和在不同伪缺失样本设计下更一致的泛化性能。
4.3. 基于SHAP的模型解释
SHAP分析清晰地揭示了影响阿尔伯塔省野火易发性的关键驱动因子。年平均温度、年平均风速和年平均相对湿度是三个最重要的预测因子。具体而言,较高的温度和风速会显著增加野火发生概率,而较高的相对湿度则会降低该概率。这符合野火发生的物理机理:高温加速燃料干燥,大风助长火势蔓延,而高湿度则抑制燃烧。此外,与道路、居民点的距离以及地形湿度指数(TWI)等地形和人为因素也显示出重要影响。
4.4. 野火易发性制图与空间变异性评估
研究为每个优化模型生成了基于三种伪缺失样本策略的易发性概率图,并计算了这些图之间的空间相关性(皮尔逊相关系数)。结果显示,不同策略的制图结果存在一定空间变异。为获得更可靠、变异更小的最终易发性图,研究采用了集成中位数法,将同一模型下三种策略的预测概率进行像元级的中位数合成。最终的XG-GWO集成易发性图表明,阿尔伯塔省中北部存在一个持续的高风险(热点)带,这与该地区历史上的野火高发区和易燃的北方森林植被分布相吻合。
研究结论与意义
本研究成功开发并验证了一个适用于阿尔伯塔全省的、500米分辨率的野火易发性制图框架。该框架的创新性在于系统性地评估并集成了伪缺失样本不确定性,并强调了空间热点模式在不同建模策略下的稳健性。主要结论如下:
  1. 1.
    GWO-XGBoost是最优模型:在四种元启发式优化算法中,灰狼优化(GWO)与XGBoost的结合在预测精度、稳定性和对不同训练数据设计的适应性上表现最佳。
  2. 2.
    气候因素是主导驱动力:SHAP可解释性分析定量证实,温度、风速和湿度等气候变量是控制阿尔伯塔省野火空间分布格局的最关键因素,这为理解区域野火机制提供了科学依据。
  3. 3.
    制图需考虑策略不确定性:不同伪缺失样本生成策略会导致易发性图的空间差异,采用集成方法(如中位数法)可以有效平滑这种变异,生成更可靠的风险地图。
  4. 4.
    识别出明确的高风险区:最终制图精准识别了阿尔伯塔省中北部一个连贯的高野火易发性区域,为资源的高效空间配置提供了直接靶点。
这项研究的意义重大。在科学上,它推动了野火易发性建模方法学的发展,强调在追求预测性能的同时,必须关注模型假设的稳健性和结果的可解释性。在应用上,所产出的高分辨率、稳健的易发性地图及明确的驱动因子解析,可直接服务于阿尔伯塔省的火灾季前规划、针对性燃料管理、早期预警系统建设以及减灾资源(如消防力量、设备)的空间优先排序,有助于提升该省应对日益严峻的野火风险的能力,对加拿大乃至全球类似地区的野火风险管理具有重要的借鉴价值。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号