物种分布模型在预测入侵昆虫的扩散方面有多准确?选择哪种气候数据又是否重要?以Dryocosmus kuriphilus的入侵为例进行探讨

《Journal of Applied Entomology》:How Accurately Do Species Distribution Models Predict the Expansion of Invasive Insects, and Does Climate Data Choice Matter? Insights From the Invasion of Dryocosmus kuriphilus

【字体: 时间:2026年04月12日 来源:Journal of Applied Entomology 2

编辑推荐:

  摘要 物种分布模型(SDMs)被广泛用于预测入侵物种的扩散情况,但其随时间的准确性以及气候数据分辨率的影响仍不清楚。在本研究中,我们检验了SDMs预测入侵性瘿蜂Dryocosmus kuriphilus的分布和短期扩张能力,并比较了本地获取的年度分辨率气候数据与全球气候数据集的

  摘要

物种分布模型(SDMs)被广泛用于预测入侵物种的扩散情况,但其随时间的准确性以及气候数据分辨率的影响仍不清楚。在本研究中,我们检验了SDMs预测入侵性瘿蜂Dryocosmus kuriphilus的分布和短期扩张能力,并比较了本地获取的年度分辨率气候数据与全球气候数据集的性能。我们使用SDMs对D. kuriphilus的年度分布和扩张进行了建模。比较了三种气候数据集:区域插值数据、时间明确的CHELSA时间序列数据以及长期CHELSA平均值数据,以测试它们对模型准确性的影响。栖息地适宜性通过GLM、MaxEnt和随机森林模型进行评估,模型性能则通过Boyce指数进行评价。通过将早期年份的模型投影到后续年份,并通过多因素方差分析(ANOVA)来评估时间转移性。使用Boyce指数测量的模型准确性随时间有所提高,大多数数据集和算法的准确性都超过了0.7。不同气候数据集之间的差异较小,尽管区域数据略微提高了早期预测的准确性。MaxEnt始终表现出最高且最稳定的性能,而随机森林和GLM的准确性则变化较大。当SDMs被适应性使用时,它们是入侵物种管理中的宝贵工具。随着更多发生数据的收集,准确性会提高,但在预测未来扩张时准确性会下降,这突显了定期更新数据集的必要性。结合细粒度、时间明确的气候数据可以增强早期检测、监测和快速响应干预的能力。

1 引言

生物入侵是全球生物多样性丧失的主要驱动因素之一,对生态系统的结构和功能构成严重威胁(Linders等人,2019;Py?ek等人,2020)。入侵物种可能会超过本地生物的竞争能力,改变栖息地条件,破坏营养相互作用,最终导致物种丰富度和生态系统恢复力的下降。一旦建立,它们的影响往往会因快速扩散和难以控制而加剧,导致生态系统功能发生不可逆的变化,并给所嵌入的社会生态系统带来巨大的经济损失(Cuthbert等人,2021;Diagne等人,2021)。全球化和气候变化通过增加物种引入的频率和扩大入侵者的生态位来加速这些过程(Hulme,2017)。全球贸易和人类活动的增加促进了外来物种的传播,入侵率随着全球化浪潮而波动,而气候变化则破坏了本地生态系统,为非本地物种创造了有利条件(Walther等人,2009)。因此,尽管全球化和气候变化继续促进非本地物种的引入和建立,但早期检测、监测和准确预测生物入侵已成为害虫控制、生物多样性保护和生态系统管理的关键优先事项(Barker等人,2020)。为此,物种分布模型(SDMs)为应对生物入侵带来的复杂挑战提供了有用的工具(Battini等人,2019;Hill等人,2017;Mainali等人,2015)。通过使用统计方法将物种出现数据与环境变量相关联,SDMs可以估计入侵物种在当前和未来条件下的潜在地理分布,生成空间明确的预测,从而在入侵发生之前就能识别出被殖民的区域或面临殖民风险的区域(Sillero等人,2021;Srivastava等人,2019)。尽管SDMs有时因假设物种与其环境之间达到平衡而受到批评(这种状态在入侵早期很少成立),但其实际价值仍得到广泛认可(Barbet-Massin等人,2018;Gallien等人,2012;Nguyen和Leung,2022;Václavík和Meentemeyer,2012;Wen等人,2024)。这在支持早期检测、完善监测策略和优先考虑管理行动方面尤为重要。对于生物控制计划而言,SDMs特别有助于确定释放控制剂(如寄生蜂)的最有效区域(Fischbein等人,2019;Sofaer等人,2019;Sutton和Martin,2022)。然而,在处理快速扩散的害虫时,及时、空间精确的信息变得至关重要。在这种情况下,像CHELSA或WorldClim这样的全球气候数据集提供了广泛空间尺度上的标准化气候信息,使其在物种分布建模中得到广泛应用(Fick和Hijmans,2017;Karger等人,2017)。然而,这些数据集主要设计用于表示长期气候条件,其聚合产品(例如,通常用作SDM预测因子的月度变量)通常会在最近观测结果之后几年才发布。虽然这并不意味着气象记录存在空白,但它限制了建模练习中使用的预测因子的时效性。这一限制在快速扩散的入侵物种情况下尤为相关,因为它们的分布可能在短时间内发生变化,而管理决策往往需要反映当前条件的环境信息。在这种情况下,可以使用相对简单的插值技术快速处理和空间化本地获取的气象观测数据,提供及时、准确且空间明确的气候预测因子。因此,当需要接近实时的环境信息时,这些本地派生的数据集可以补充全球气候学数据,例如支持时间敏感的管理行动,如针对性释放生物控制剂,其中精确和当前的环境信息对于操作成功至关重要。Dryocosmus kuriphilus Yasumatsu,1951(膜翅目:Cynipidae),通常被称为亚洲栗树瘿蜂,是验证SDMs在生物入侵背景下的预测能力以及评估气候数据重要性的理想候选物种。这是因为它的入侵历史记录详尽,其扩散受到了密切监测,且其扩张主要发生在缺乏有效生物控制剂的情况下。这种入侵昆虫原产于中国,已迅速扩散到亚洲、欧洲和北美(Gil-Tapetado等人,2018,2020),成为对栗树(Castanea spp.)最具破坏性的害虫之一(EFSA植物健康小组,2010)。其成功入侵的一个关键因素是新殖民地区缺乏天然捕食者,使得种群能够不受控制地快速增长和扩散,带来生态和经济影响,包括树木活力下降、坚果产量减少以及对次级病原体的易感性增加(Battisti等人,2014;Sartor等人,2015)。对于D. kuriphilus,已有几种本地寄生蜂被报道能够攻击这种害虫,尽管它们的效果通常有限,入侵地区的寄生率通常较低(Gil-Tapetado,Cabrero-Sa?udo等人,2021;Panzavolta等人,2013;Quacchia等人,2013)。因此,生物控制策略集中在引入Torymus sinensis Kamijo上,这是一种在生物控制计划中广泛使用的寄生蜂,目前是控制D. kuriphilus种群最有效的手段(Avtzis等人,2019;Ferracini等人,2017;Quacchia等人,2008)。这一生物控制计划的成功取决于及时准确地识别受侵区域,以便释放T. sinensis来寄生瘿虫并减少害虫密度。在加利西亚(西班牙西北部),亚洲栗树瘿蜂于2014年首次被发现(Pérez Otero和Mansilla Vázquez,2014),其扩散通过年度野外调查得到了系统监测(Gil-Tapetado等人,2020;Pérez Otero等人,2017;加利西亚自治区政府,2020)。这为模型校准和验证提供了丰富且时间一致的数据集,特别是在2019年之前没有有效控制措施的情况下尤为重要。尽管T. sinensis的实验性释放始于2015年,但其在加利西亚的建立仍然非常有限。到2017年,从释放的220,000多只个体中仅回收到了12只,即使在2018年进行了大规模释放(超过700,000只个体)之后,释放后的监测仍显示回收率极低,野外调查中仅发现了一只标本(Nieves-Aldrey等人,2019)。与其他地区类似,T. sinensis的建立和种群增长通常需要几年的时间,寄生蜂种群的数量通常在5-7年后才会明显增加,而有效控制有时需要更长的时间(Ferracini等人,2018;Murakami和Gyoutoku,1995)。因此,加利西亚可能有意义的寄生水平可能要等到2020年之后才能出现。这种延迟的建立突显了SDMs在指导生物控制策略方面的重要性,特别是在不断变化的环境条件下确定合适的释放地点和最佳时机。在寄生蜂建立之前的几年,可以评估SDMs预测入侵物种D. kuriphilus扩张的能力。这些数据还允许评估年度分辨率的本地获取的气象数据是否能够比传统的宏观气候数据集提供更好的预测性能,后者通常有延迟发布,并反映长期平均值而非实时条件。因此,本研究的目标有两个:(i)使用D. kuriphilus作为模型生物,评估物种分布模型(SDMs)预测快速扩散昆虫物种当前分布和短期扩张的能力;(ii)检验通过相对简单的插值技术空间化的本地获取的气象数据是否能够胜过或提供与广泛使用的全球气候数据集相当的准确性,后者通常使用复杂的方法处理并有一定的延迟。这将有助于理论理解SDMs在昆虫入侵生态学方面的局限性,并为规划未来的生物害虫控制提供实际指导。

2 材料与方法

2.1 研究区域

研究在西班牙西北部的加利西亚进行,该地区面积约为29,575平方公里(图1a)。气候主要为温带海洋性气候,区域差异受大西洋邻近性和海拔的影响。特别是沿海地区全年温度温和,降水量丰富且分布均匀,而内陆地区则表现出更明显的大陆性影响,季节性温度变化较大。年平均降水量约为1200毫米,尽管在整个地区差异很大,某些地区可达2900毫米,而内陆山谷则降至更低值。降雨量全年分布较为均匀,冬季峰值明显,夏季最低,这是海洋性气候的特征,降水量丰富。

气候、地形和人类活动之间的相互作用塑造了该地区的土地利用和植被分布。因此,一种典型的树种——欧洲栗树(Castanea sativa Mill.)正式占据了超过490平方公里的面积。然而,它的存在范围远超这一估计,因为它与农村社会紧密相关,以散落的个体、小片林地和传统农林系统的形式出现在整个景观中,突显了其在生态、经济和社会方面的多重重要性。

2.2 D. kuriphilus的出现记录

2014年至2019年的D. kuriphilus入侵记录由加利西亚林业护林员和技术人员进行调查,并由加利西亚地区政府提供(图1b)(Gil-Tapetado等人,2020;加利西亚自治区政府,2020)。监测工作在春季和夏季通过沿样带的系统采样进行,无论是步行还是驾车,以识别瘿虫的存在。此外,栗树种植者也经常报告他们的果园中的瘿虫侵染情况,补充了官方记录。当在栗树林中发现侵染时,会记录下一棵代表整个树林的树木。对于孤立的树木,会记录受影响树木的精确位置。使用手持GPS接收器或智能手机获取受感染树木的地理坐标,平均位置误差为±3-5米。关于监测协议的详细描述,包括采样期和瘿虫检测程序,可以在原始资料中找到(Gil-Tapetado等人,2020;加利西亚自治区政府,2020)。由于监测的主要目的是划定入侵的地理范围并为管理策略提供信息,而不是系统地调查所有栗树林,因此数据集中可能存在潜在的空间偏差。为此,使用R 4.3.3中的‘ecoinfo’包(Carlisle和Albeke,2016)将记录之间的距离至少设置为1公里(R Core Team,2025)。这一步预处理有助于减少位置接近的记录过度代表,提高了后续空间分析的稳健性。经过过滤后,从最初的17,517条地理定位记录中保留了6,676棵受感染的栗树。随着时间的推移,记录的数量显著增加,2014年为37棵,2015年上升到92棵,2016年急剧增加到1,065棵,2017年达到1,965棵。入侵在2018年达到顶峰,当时记录了3479次出现,然后在2019年下降到38次。这种急剧下降很可能是由于该年份的数据可用性有限,因为来源数据集中的记录不完整。尽管监测活动仍在继续,但地区行政部门收集的完整观测数据并未公开(Gil-Tapetado等人,2020年;加利西亚自治区政府,2020年)。

2.3 气候数据

先前的研究已经确定气候因素是D. kuriphilus分布和扩散的关键驱动因素(Gil-Tapetado, Castedo-Dorado等人,2021年;Gil-Tapetado等人,2020年;Quinto等人,2021年),其中风在促进其跨区域移动方面起着特别重要的作用(Mapes等人,2020年)。为了考虑这些影响,我们使用了三种不同的方法计算了19个生物气候变量,结合了多个数据来源和时间聚合尺度。第一种方法提供了一种快速、直接且可靠的方法来获取年度气候数据。第二种方法需要最少的专家处理,同时提供了一个标准化的高分辨率数据集。第三种方法依赖于长期气候平均值,作为评估气候变率和趋势的基准。首先,我们从加利西亚气象观测和预测单位(MeteoGalicia)管理的140个气象站获取了2014-2018年期间的月度最高和最低温度、降水量以及风速记录。为了生成连续的空间覆盖,我们应用了通用克里金插值法,并使用站点海拔作为协变量来提高准确性(见表S1中的均方根误差(RMSE)值)。海拔数据被聚合到1公里的像素大小。随后,我们使用1公里空间分辨率的插值温度和降水量数据计算了19个生物气候变量。然而,我们没有遵循传统的日历年,而是采用了与D. kuriphilus生命周期相一致的时间框架。具体来说,我们汇总了从n-1年的6月到n年的5月的月度气候数据,以确保充分捕捉到害虫关键物候阶段之前的和期间的气候条件。风速数据是根据每年6月至8月的数据计算的,这对应于昆虫活跃飞行的时期(Gil-Tapetado等人,2020年),尽管在某些地区活动期可能会延长到9月(Lobo Santos等人,2024年)。其次,我们从CHELSA数据集(Karger等人,2017年)获取了2014-2018年期间的预处理月度气候时间序列,空间分辨率为1公里。使用与第一种方法相同的方法,我们每年计算了19个生物气候变量。具体来说,每年的生物气候变量都是根据n-1年的6月到n年的5月的气候数据得出的,以确保与D. kuriphilus的生命周期对齐。风速数据是使用每年6月至8月的数据计算的。为了评估MeteoGalicia和CHELSA得出的气候数据之间的差异程度,我们计算了研究期间每年相应变量之间的空间差异。这些比较使我们能够直观地评估两个数据集之间差异的大小和空间结构。不同年份的空间差异模式大体上是一致的;因此,2014年的一个代表性示例显示在图S1中。第三,我们直接从CHELSA v2.1数据集获取了19个生物气候变量,该数据集提供了1981-2010年期间的长期气候平均值,空间分辨率为1公里(Karger等人,2017年)。所有生物气候变量都是使用‘dismo’ R包(Hijmans等人,2024年)计算的。所有环境预测因子都通过基于Spearman的相关性(|r| ≥ 0.7)和方差膨胀因子(VIF ≥ 5)进行了多重共线性筛查。超过这些阈值的预测因子被移除,只保留了非共线变量子集用于模型校准。

2.4 物种分布建模

每年都对D. kuriphilus的栖息地适宜性进行了建模。对于每个建模年份,出现数据集包括了该年份记录的所有出现情况以及前几年检测到的情况,假设一旦建立,该物种在入侵地点仍然可以被检测到。对于上述每一组气候预测因子,我们使用了三种不同的建模技术:广义线性模型(GLM)、最大熵(MaxEnt)和随机森林(RF)。这些模型是在R语言的‘biomod2’包(版本4.2-6-2)(Thuiller等人,2023年)中实现的(R Core Team,2025年)。GLM是一种常用的参数化方法,为评估环境预测因子的影响提供了可解释的框架。MaxEnt是一种确定性的、仅基于出现情况的建模方法(即,结果在不同运行中保持一致),特别适合处理小样本量,并且具有强大的预测性能,同时保持计算效率(Phillips等人,2006年;Sillero等人,2021年;Valavi等人,2022年)。最后,随机森林(RF)作为一种机器学习技术,能够建模复杂和非线性关系,并具有高预测性能(Valavi等人,2022年)。由于每年只有出现数据可用,我们生成了10组随机分布的伪缺失数据,每组包含10,000个点,这些点与已知出现位置的最小距离为5公里,这与D. kuriphilus的初始径向扩散率一致(Gil-Tapetado等人,2020年)。这种方法遵循了常用的伪缺失数据生成策略,避免将伪缺失数据放置得太靠近出现位置(Barbet-Massin等人,2012年;VanDerWal等人,2009年)。这些伪缺失数据用于GLM和RF模型。对于使用背景数据而不是伪缺失数据的MaxEnt,相同的点在‘biomod2’框架内被视为背景位置。为了减轻不平衡数据带来的偏差,我们应用了0.5的普遍性来平衡多数类(Barbet-Massin等人,2012年)。为了评估模型性能,我们对每组伪缺失数据进行了10折交叉验证,每种建模技术共进行了100次模型运行。模型性能使用Boyce指数(Hirzel等人,2006年)进行评估,这是一个专门为仅基于出现情况的模型设计的指标,用于量化预测与观察到的出现情况的偏差程度(Boyce等人,2002年)。由于Boyce指数与研究区域的空间范围和物种的空间分布有关,因此它比AUC或TSS等判别指标更受青睐(Bracho-Estévanez等人,2024年;Sillero等人,2021年;Leroy等人,2018年;Lobo等人,2008年)。Boyce指数的范围是从-1到1,其中正值表示预测的适宜性与观察到的出现位置吻合良好,表明模型性能良好。接近零的值意味着预测与随机分布没有显著差异,而负值表示相反的预测,意味着模型将较低的适宜性分配给出现频率较高的区域。这个指标也被用来构建每种算法的中值集合,只保留Boyce指数得分大于0.7的模型运行。

2.5 建模后处理

每年的中值集合以及后续年份的物种出现数据被用来使用‘ecospat’ R包(Broennimann等人,2025年)计算与D. kuriphilus扩张相关的Boyce指数。在这种情况下,Boyce指数允许我们评估给定年份的模型在随后年份预测物种扩张的能力。此外,为了统计评估气候数据来源和算法选择对模型性能的影响,我们使用线性模型进行了事后分析。具体来说,我们使用线性模型进行了多因素方差分析(ANOVA),测试不同气候数据集和建模算法是否显著影响了Boyce指数(因变量),我们将其作为模型准确性的评估指标。构建了两个独立的模型。第一个模型检查了气候数据集和算法对用于训练每个模型的出现数据获得的Boyce指数值的影响,评估它们对当前栖息地适宜性预测的影响。第二个模型专门关注为物种扩张计算的Boyce指数值,评估模型对未来出现的预测能力。

3 结果

3.1 SDM的预测准确性和时间稳定性

模型性能通过Boyce指数进行衡量,随着时间的推移,在所有气候数据集和建模算法上都有所提高,表明使用更近期数据时模型准确性增加(见图2和图3;变量重要性见图S2)。除了2014年外,所有模型的Boyce指数值都超过了0.7的阈值(红线),表明拟合良好。尽管MeteoGalicia在第一个年份似乎产生了最稳健的结果,但不同气候数据集之间没有观察到显著差异。2014年CHELSA面板中算法之间的明显差异主要是由于第一次入侵年份的模型不稳定性造成的。在建模技术方面,GLM在2014年的表现最差,Boyce指数值低于MeteoGalicia和CHELSA(1981-2010年)的阈值。特别是对于2014年的CHELSA数据集,GLM产生的Boyce指数值为1,但在空间预测上失败,表明结果存在异常。然而,GLM在随后的年份性能有所提高,达到了高且稳定的Boyce指数值。MaxEnt在所有年份的表现始终高于阈值,尽管在2018年略有下降。最后,RF在早期年份表现出较高的变异性,在2014年的CHELSA中低于阈值,但从2016年开始达到了最高的Boyce指数值。未达到0.7阈值的模型被排除在进一步分析之外。

3.2 建模算法和气候数据在SDM预测性能中的作用

基于多因素方差分析(ANOVA)的结果,使用CHELSA代替MeteoGalicia会导致当前模型性能略有下降,而CHELSA(1981-2010)则略有提高。然而,这些效应在统计上并不显著(表1)。同样,建模算法的选择对性能也没有显著影响。因此,气候数据集和算法选择都没有显著影响模型准确性。表1总结了多因素方差分析的结果,用于评估气候数据库和算法对当前模型性能的影响,该性能通过Boyce指数进行衡量。变量
系数
标准误差(SE)
p值
R2
调整后的R2

截距
MeteoGalicia—GLM
0.973
0.018
0.180
0.089

气候数据集
CHELSA
?0.020
0.020
0.314

CHELSA(1981–2010)
0.001
0.019
0.974

算法
MaxEnt
?0.037
0.020
0.072

RF
0.008
0.020
0.696

注:报告了估计的系数、标准误差(SE)和p值。对于D. kuriphilus的扩散情况,气候数据集的选择和建模算法的选取对模型准确性没有统计学上的显著影响。然而,MaxEnt在所有评估的模型中通常显示出比GLM和RF更高的Boyce指数值(表2)。

表2. 多因素方差分析(ANOVA)总结,用于评估气候数据库和算法对Dryocosmus kuriphilus扩散模型性能的影响,通过Boyce指数进行衡量。

变量
系数
标准误差(SE)
p值
R2
调整后的R2

截距
MeteoGalicia—GLM
?0.102
0.098
0.302
0.149
0.118

气候数据集
CHELSA
0.103
0.102
0.313

CHELSA(1981–2010)
0.103
0.098
0.293

算法
MaxEnt
0.210
0.103

RF
?0.187
0.106
0.080

注:报告了估计的系数、标准误差(SE)和p值。

4. 讨论
本研究提供了关于空间分布模型(SDMs)预测入侵昆虫短期扩散能力的实证评估,并评估了气候数据的选择是否对这些预测有显著影响。以D. kuriphilus作为模型生物,我们的发现表明,SDMs能够可靠地捕捉到快速扩散的害虫的实际分布,尤其是在有足够的发生数据时;然而,当预测时间超出校准期时,其预测准确性会显著下降。在全球和本地来源的气候数据集之间进行选择并未显著影响模型性能,这表明至少在相对均匀的环境中,宏观气候数据集可以提供与高分辨率本地数据相当的预测结果。这些结果突显了SDMs在入侵生态学中的优势和局限性:虽然它们仍然是早期检测和管理优先级确定的宝贵工具,但其时间稳定性有限,这强调了需要迭代更新和整合近实时环境信息以用于害虫控制计划。

4.1 SDMs的预测准确性和时间稳定性
与先前的研究(Barbet-Massin等人2018年;Nguyen和Leung 2022年;Wen等人2024年)一致,我们的模型达到了中等到良好的预测准确性,大多数数据集和算法的Boyce指数值通常高于0.7。这表明SDMs即使在入侵昆虫的早期扩散阶段也能有效捕捉其实际分布。然而,当预测时间超出校准期时,模型准确性急剧下降,这突显了SDMs在动态入侵背景下的时间转移能力有限(Nguyen和Leung 2022年)。这种时间衰减可能是由生态学和方法学因素共同造成的。首先,D. kuriphilus具有较高的扩散能力和利用新气候生态位的能力(Battisti等人2014年;Gil-Tapetado, Castedo-Dorado等人2021年;Gil-Tapetado等人2018年、2020年),这可能导致在校准初期建立的模型低估了其后续对新环境的扩散范围。其次,相关SDMs所假设的物种-环境平衡(Barbet-Massin等人2018年;Gallien等人2012年;Václavík和Meentemeyer 2012年)在快速入侵期间被打破,导致模型可能过度拟合初始条件,并随时间降低预测可靠性。这一模式与先前的研究结果一致,即在校准入侵早期阶段的SDMs往往准确性较低,通常会低估物种的潜在分布范围(Václavík和Meentemeyer 2012年)。从这个意义上说,模型性能在整个研究期间逐渐提高,表明随着物种在加利西亚地区的分布接近环境平衡,SDMs在捕捉其实际生态位方面变得更加稳健。在入侵的最初几年,D. kuriphilus在没有有效天敌的情况下在该地区迅速扩散(Gil-Tapetado, Cabrero-Sa?udo等人2021年;Gil-Tapetado等人2020年),得益于缺乏生物抵抗。这种几乎不受限制的扩散持续到2019年,尽管之前已经进行了实验性释放,但T. sinensis的生物控制尚未生效。到那时,D. kuriphilus已经几乎占据了整个研究区域,形成了广泛的分布。因此,模型准确性的提高可能反映了物种在可用栖息地内的逐渐稳定,以及其实际生态位与其潜在生态位之间的更紧密匹配,这些条件使得相关SDMs的表现更加可靠。这与入侵植物和昆虫研究的结果一致,这些研究表明,当模型使用更广泛的、建立后的发生数据进行校准时,准确性更高(Barbet-Massin等人2018年;Nguyen和Leung 2022年)。

4.2 建模算法和气候数据在SDM预测性能中的作用
在各种建模算法中,MaxEnt始终提供了最稳定和准确的预测,无论是当前分布还是短期扩散,这证实了早期发现,即MaxEnt在样本量小或仅存在数据的情况下表现良好(Battini等人2019年;Sutton和Martin 2022年;Valavi等人2022年)。相比之下,RF在早期年份表现出更大的变异性和时间一致性较低,可能是由于其对抽样偏差和数据不平衡的敏感性(Liu等人2009年)。GLM虽然最初表现不佳,但随着数据的增加而逐渐改善,这支持了简单统计模型在数据充足时可以近似机器学习方法的观点。与假设和先前的发现相反,即气候数据源的选择可能显著影响SDM的结果(Peterson和Nakazawa 2008年;Wen等人2024年),我们的分析并未发现全球(CHELSA)和本地来源(MeteoGalicia)数据集之间存在统计学上的显著差异。尽管气候层之间的比较显示了两个数据集之间的明显空间差异(图S1),但这些差异并未转化为模型预测的显著差异。虽然本地插值数据在入侵初期略微改善了预测,特别是在2014年,但随着物种的扩散和分布的稳定,这些优势减弱了。这一结果表明,至少在考虑的空间和时间尺度上,SDM对D. kuriphilus的预测相对不受气候数据集差异的影响。更广泛地说,我们的发现表明,当底层环境梯度被一致捕捉时,气候数据源之间的适度差异不一定会影响短期入侵预测的可靠性。然而,从管理的角度来看,不应忽视高分辨率、本地来源的气候数据的实际价值。尽管像CHELSA这样的全球数据集提供了标准化和广泛可比的气候层,但它们反映的是长期平均值,可能无法捕捉短期波动或非典型季节——这些因素可能强烈影响昆虫的物候和建立成功率。相比之下,本地数据集提供了近实时的气候信息,这对于设计和实施生物控制策略特别有价值。在D. kuriphilus及其寄生蜂T. sinensis的情况下,结合时间精确的气候数据可以改善释放计划的时间和空间定位,确保干预措施与寄生蜂建立和扩散的有利环境条件相一致。

5. 结论
本研究证明,SDMs能够有效描述入侵物种的实际分布和空间扩散,但其预测准确性在时间上会下降。随着入侵物种在区域内向环境平衡发展,模型性能通常会提高,反映了入侵阶段与模型可靠性之间的动态关系。尽管来自全球(CHELSA)和本地插值(MeteoGalicia)数据集的气候层之间存在明显空间差异,但这些差异并未转化为模型预测的显著差异,表明SDM输出对这里考虑的空间和时间尺度上的气候数据源选择相对稳健。然而,包含时间明确和精细尺度的气候信息对于提高SDMs在实时监测和快速响应管理中的实际价值仍然很重要。从应用的角度来看,这些发现强调了需要适应入侵进展的建模框架。对于像D. kuriphilus这样快速扩散的害虫,定期更新模型(理想情况下每年一次)对于保持预测相关性和指导监测、控制和生物控制策略的近乎实时操作至关重要。为了进一步提高模型对持续入侵的响应能力,随着T. sinensis的建立并开始调节D. kuriphilus种群,应将生物相互作用明确纳入未来的模型中,以考虑由寄生蜂动态驱动的潜在范围收缩或空间避难所。

作者贡献
José Carlos Pérez-Girón:概念化、方法论、数据管理、正式分析、初稿撰写、审稿和编辑。
Fernando Castedo-Dorado:概念化、数据管理、撰写、审稿和编辑、正式分析。
María Josefa Lombardero:概念化、数据管理、撰写、审稿和编辑、正式分析。
Pedro álvarez-álvarez:概念化、数据管理、撰写、审稿和编辑、正式分析。

致谢
开放获取费用的资金支持:韦尔瓦大学(Universidad de Huelva)/ CBUA。

作者声明没有利益冲突。

数据可用性声明
本研究中分析的Dryocosmus kuriphilus的发生数据可在https://doi.org/10.1111/jen.12836免费获取。2014–2018年的气象站数据(温度、降水量和风速)来自MeteoGalicia,可通过MeteoGalicia数据门户(https://www.meteogalicia.gal)公开获取,受其数据使用条件的限制。本研究中使用的CHELSA气候数据集(2014–2018年的月度气候数据和1981–2010年的长期生物气候变量)可在https://chelsa-climate.org免费获取。所有用于数据预处理、物种分布建模和后处理分析的脚本均存档在Zenodo中,可在https://doi.org/10.5281/zenodo.18955969获取。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号