基于时间序列数据识别物候区( Phenological Region / Phenoregion )的空间显式区域划分( Regionalization )方法基准测评

《Geomatica》：Benchmarking methods for identifying phenological regions

【字体：大中小】 时间：2026年06月02日 来源：Geomatica CS1.2

编辑推荐：

　　摘要：从时间序列数据划分连续且内部物候特征一致的物候区( Phenological Region / Phenoregion )要求所用方法在空间连续性( Spatial Contiguity )、时序同质性( Temporal Homogeneity )与计

摘要：从时间序列数据划分连续且内部物候特征一致的物候区( Phenological Region / Phenoregion )要求所用方法在空间连续性( Spatial Contiguity )、时序同质性( Temporal Homogeneity )与计算可扩展性( Computational Scalability )之间取得平衡，然而现有文献对在真实空间条件下如何选择方法的指导仍然有限。研究人员系统评估了六种空间显式区域划分方法——基于初始种子位置自动区域划分( Automatic Regionalization with Initial Seed Location, Arisel )、动态约束凝聚聚类与分割区域划分( Regionalization with Dynamatically Constrained Agglomerative Clustering and Partitioning, Redcap )、基于树边移除的空间K群分析( Spatial "K"luster Analysis by Tree Edge Removal, Skater )、扩展简单线性迭代聚类( Extended Simple Linear Iterative Clustering, ESLIC )、空间K均值( Spatial K-Means, SKM )及空间约束谱聚类( Spatially Constrained Spectral Clustering, SCSC )——采用(i)受控合成景观与(ii)来自肯尼亚山国家公园和阿根廷查科地区的多传感器NDVI及EVI时间序列真实遥感数据集。方法从簇内同质性( Cluster Homogeneity )、空间连续性、与参考解的一致性及运行时间方面评价，以解析不同空间尺度下的性能权衡。结果表明Arisel、Redcap、Skater和ESLIC整体表现最优，但其相对优劣随景观背景及是否考虑运行时间而变化。在合成数据集与肯尼亚山案例中Arisel在质量导向评价中最佳，但其高计算成本限制其应用于大规模数据；Redcap与Skater是稳健的高性能替代方案；ESLIC在计算成本权重增大时提供划分质量与效率的最佳综合平衡。除识别高性能方法外，该框架还为方法选择提供了客观、透明且可复用的依据，支持物候分析及更广泛的需同时兼顾连续性、同质性与可扩展性的地理空间与遥感区域划分应用中的算法决策。

论文解读：《Benchmarking methods for identifying phenological regions》发表于《Geomatica》

一、研究背景与问题提出

陆地表面物候( Land Surface Phenology, LSP )利用卫星观测的植被指数（如归一化植被指数 Normalized Difference Vegetation Index, NDVI 和增强植被指数 Enhanced Vegetation Index, EVI ）捕捉植被季节动态，而物候区( Phenological Region / Phenoregion )是指具有相似植被物候特征的连片地理区域，其划分有助于降低数据维度、增强物候趋势可解释性，并支撑生态预警、资源管理与气候变化响应评估。区域划分( Regionalization )本质上是一个带空间连续性约束的无监督分类（即空间约束聚类 Spatially Constrained Clustering）问题，需在最大化区内相似度与区际差异度的同时确保区域空间连续（无飞地、无断开）。已有物候区划分多采用传统K均值( K-Means )等无显式空间约束的方法，不能保证连续性；虽有一些空间显式区域划分方法在其他地理问题中被比较，但缺乏针对以时序物候轨迹（形状、起止时间、幅度）为相似性依据这一特殊场景的系统基准测评，尤其对过渡带、飞地、非连续相同模式斑块等典型物候数据空间结构处理能力及方法可扩展性尚不明晰。为此，研究人员开展此项基准测评研究，系统比较六类区域划分方法在合成与真实遥感物候数据集上的表现，明确各方法性能权衡，为物候及更广地理空间区域划分提供选案依据。

二、主要关键技术方法

研究人员选取六种区域划分算法：Arisel（PyGeoda库azp_greedy实现）、Skater（PyGeoda库skater实现）、Redcap全序完全联动( Full-Order Complete Linkage )变体（PyGeoda库redcap实现）、ESLIC（R语言supercells包生成超像素再经PyGeoda中Skater聚合为连续区）、SKM（GeoDa软件将XY坐标作为附加特征加入K-Means）及SCSC（R语言speCluster包）。评价指标含：衡量簇同质性与分离度的Calinski–Harabasz Index（CHI）；衡量局部邻接同类比例的Join Count Ratio（JCR）；衡量区域物理连通性的Patch Cohesion Index（PCI）；与参考分区一致性的Adjusted Rand Index（ARI）和V-Measure（含像元级Region Inhomogeneity, RIH）；运行时间取对数参与TOPSIS多准则排序。数据含：(1) 30×30合成网格（900单元）模拟五种植被NDVI时序（含过渡带与噪声），定义6/8/10区参考解，并扩展至14400单元测可扩展性；(2) 肯尼亚山（~765 km2）MOD13A3v061 2001–2010年月均NDVI+EVI（24维特征），对照Niemel? & Pellikka与Zhou等专家植被带；(3) 阿根廷查科（~140000 km2）AVHRR GIMMS-3G+ 1985–2005年双周NDVI均值（24维特征），对照Oyarzabal等植被单元图。所有方法在同一Windows机器运行，TOPSIS赋等权于同质性、连续性、参考一致性三宏观指标，逐步增大运行时间权重进行敏感性分析。

三、研究结果

4.1. Experimental setup

设定所有方法在合成数据上划分6–10个簇，评估CHI、JCR、PCI及相对于6/8/10参考解的ARI与V-Measure；通过900至14400空间单元递增测试运行时间；采用分层TOPSIS综合排名并在合成数据取三种参考解均值，运行时间单独作为可用性判据逐步加大权重参与敏感性分析；真实数据集沿用相同框架。

4.2. Results on the synthetic dataset

Arisel、Redcap、Skater与ESLIC能较好保持背景区连续性、识别过渡带并将空间断开但物候相同的斑块划为独立区，SKM与SCSC则过度分割背景并产生飞地。CHI方面Arisel、Redcap、Skater在6–7簇最高，SKM在8–9簇略优，ESLIC随簇数增加改善，SCSC最低。JCR方面SCSC最高（过连续牺牲同质性），SKM最低，Arisel/Redcap/Skater/ESLIC居中且平衡。PCI显示SCSC与SKM因簇变大自然降但因碎裂少，其余方法在更细划分时伴随真实边界破碎。ARI与V-Measure表明Arisel近乎完美匹配参考，Redcap、Skater、ESLIC紧随，SKM与SCSC显著偏低。RIH空间映射证实前四者在大部分像元低不匹配，后两者广泛高不匹配。运行时间上ESLIC最快，Redcap略慢于Skater，Arisel随数据量剧增，SCSC在14400单元极慢。TOPSIS纯质量排名Arisel居首，Redcap与Skater次之，ESLIC第三；引入运行时间权重≥15%时Arisel降至第四，ESLIC在≥20%权重跃居首位，SKM与SCSC始终垫底。

4.3. Results on the real-world datasets

4.3.1. Mt Kenya

目视结果与量化表显示Arisel与Redcap具最高CHI、ARI（0.39）及V-Measure（0.55–0.54），ESLIC紧随（ARI 0.36，V-Measure 0.50），Skater较Arisel稍低但在连续性指标JCR(0.89)、PCI(93.13)偏高，SKM与SCSC参考一致性偏低。运行时间Arisel(8.1 s) >> SKM(2.1 s) > SCSC(3.41 s) >> Redcap(0.31 s) ≈ Skater(0.26 s) > ESLIC(0.07 s)。TOPSIS随运行时间权重增大ESLIC取代Arisel居首。

4.3.2. Argentine Chaco

ESLIC获最高ARI(0.53)与V-Measure(0.62)，Skater(ARI 0.46, V-Measure 0.54)与Redcap(0.43/0.53)次之，Arisel虽CHI较高但ARI(0.41)与V-Measure(0.50)低于ESLIC/Skater/Redcap，SKM CHI最高但ARI/V-Measure偏低。运行时间Arisel(52 s) >> SCSC(31.5 s) > SKM(4.9 s) >> Redcap(0.79 s) ≈ Skater(0.65 s) > ESLIC(0.38 s)。TOPSIS中ESLIC与Skater领先，Arisel随运行时间权重加大下降，SKM与SCSC仍居末。

四、讨论与结论翻译

讨论指出Arisel、Redcap、Skater和ESLIC均强于同质性与参考一致性，Arisel在合成与肯尼亚山最优，Skater在查科较优反映其对大尺度平缓梯度景观适应好，而在多维高噪（如肯山NDVI+EVI组合引局部相异）时MST单一切割易受扰动；ESLIC通过超像素预分割平滑局地噪声从而提升Skater后续稳定性并在查科居首；Redcap与Skater在合成数据得相同分区说明合成景观未能区分近缘树算法，真实数据弥补此局限。Arisel(AZP族)与SCSC(O(N3))扩展性差，不适合高分大区域物候制图。

结论翻译：本研究对六种区域划分方法在物候区识别中的表现进行了基准测评。借助合成与真实数据集，按聚类质量、空间连续性、与参考解一致性及计算效率进行评估，结果明确了空间一致性、生态有效性与计算可行性间的权衡。在小数据集上Arisel与Redcap为顶级方法，具高簇同质性与强参考一致性，但Arisel计算代价限制其大尺度应用；相比之下Redcap、Skater与ESLIC展现优越可扩展性及稳定高排名，其中ESLIC在计算成本权重加大时提供划分质量与效率的最佳总体平衡。本工作推进了更客观、可复用的空间区域划分评价框架。未来研究可将Redcap、Skater与ESLIC作为大尺度长时序物候区制图候选，深化混合空间聚类流程（如ESLIC），并基于重复区域划分追踪气候驱动物候边界迁移及自动多尺度嵌套层级区域划分。

热点排行