结合景观基因组学和生态位模型预测,为加州一种重要的橡树物种的保护策略提供依据
《Molecular Ecology》:Applying Both Landscape Genomic and Ecological Niche Model Predictions to Inform Conservation Strategies of a California Foundational Oak Species
【字体:
大
中
小
】
时间:2026年04月02日
来源:Molecular Ecology 3.9
编辑推荐:
**摘要**
环境因素塑造了生物的分布及其潜在的遗传变异模式。当气候变化迅速时,适应当前环境的生物可能会变得不适应未来的气候。由于固着的生活方式和较长的世代时间,长寿的树种特别容易发生气候适应不良。了解这些基础树种将如何应对未来的气候变化,包括其适应能力和分布变化,对于有效管理
**摘要**
环境因素塑造了生物的分布及其潜在的遗传变异模式。当气候变化迅速时,适应当前环境的生物可能会变得不适应未来的气候。由于固着的生活方式和较长的世代时间,长寿的树种特别容易发生气候适应不良。了解这些基础树种将如何应对未来的气候变化,包括其适应能力和分布变化,对于有效管理和保护树种群及其所构成的生态系统至关重要。在这里,我们使用了163株蓝橡树(Quercus douglasii)的全基因组序列,根据景观基因组模型来确定其预测的适应度(即生物在未来的气候条件下生存和繁殖的能力),并将这些基因组预测结果与生态位模型预测进行比较,并提出了种子来源和恢复地点策略,以提高由大自然保护协会管理的保护区内树群的适应度。生态和基因组模型都预测,蓝橡树群落在内华达山脉流域将更容易受到未来气候的影响,而在加利福尼亚州中部沿海地区则具有较高的气候适应度。为了测试管理措施是否可以提高蓝橡树群的适应度,我们研究了种子来源和恢复地点选择对未来树群的影响。无论恢复地点的类型如何,我们的预期都得到了验证:使用预先适应未来气候条件的种子来源可以最大程度地降低未来适应不良的风险。然而,那些具有高栖息地适宜性和高气候适应度的树群总是表现最好。我们得出结论,利用从适应气候变化的树群转移种子进行的战略性保护和管理策略,可以改善那些容易受到未来气候影响的蓝橡树群的未来健康状况。
**1 引言**
温度升高和降水模式改变,加上土地利用变化和栖息地破坏,对全球各地的物种构成了极端压力(Pimm等人,2014年;Pecl等人,2017年)。这些人为压力正在推动物种分布范围的重新调整,以适应气候变化(Parmesan和Yohe,2003年;Parmesan,2006年;Chen等人,2011年;Rubenstein等人,2023年;Lawlor等人,2024年)。然而,像树木这样的某些生物是固着的,它们完全依赖扩散来扩展其分布范围(Petit和Hampe,2006年),而这一过程预计将跟不上快速变化的气候(Malcolm等人,2002年;Corlett和Westcott,2013年)。如果物种无法及时调整其分布范围,它们的生存可能取决于就地适应;然而,大多数树种的较长世代时间使得它们无法在短时间内积累足够的突变变化来适应新的气候条件(Aitken和Whitlock,2013年;Dauphin等人,2021年)。因此,树木对气候变化的响应,无论是通过适应还是分布变化,都是制定树种群及其所构成生态系统管理策略的主要挑战。由于温度和降水变化在景观中的分布不均,保护策略的应用将取决于空间位置和现有的适应情况。确定哪些分布范围内的种群在未来气候情景下面临更大的风险,可以为资源管理者提供有关预期种群和生态系统变化的信息,从而采取相应的保护行动(Hannah等人,2002年;Araújo等人,2004年;Zhu等人,2014年)。评估树木对气候变化响应的一种方法是通过生态位模型(ENMs,也称为物种分布模型SDMs)来模拟未来的物种分布(Guisan和Zimmermann,2000年;Guisan和Thuiller,2005年;Waldvogel等人,2020年;Zurell等人,2020年)。ENMs基于出现观察与当前气候数据之间的关联生成适宜性地图(Elith和Leathwick,2009年)。这些模型已被用于估计各种分类单元在未来气候条件下的栖息地适宜性(Guisan等人,2013年;Stewart等人,2019年;Bean等人,2024年),可以预测未来气候情景下分布的预期增减,便于资源管理者理解。然而,ENMs没有考虑到由局部适应和树木物种向新环境扩散能力所创造的物种分布范围内的遗传分化,而这些因素是决定气候敏感性的关键因素(Aitken等人,2008年;Pacifici等人,2015年;Lachmuth等人,2024年)。由于未能纳入这些重要的进化特征,ENMs可能会给出误导性的预测,显示未来适合的栖息地,即使当前存在于那里的种群可能没有所需的遗传变异来适应未来的气候条件。此外,ENMs预测的分布变化假设树木有能力扩散到新的适宜地点,但缓慢的扩散速度使得这种迁移极不可能发生,因此它们在当前位置的存活是最有可能的情景。因此,ENMs对未来物种分布的预测准确性仍然存疑(Davis等人,1998年;Guisan和Thuiller,2005年;Araújo和Rahbek,2006年)。另一种评估树木对气候变化响应的方法是应用景观基因组模型(LGMs)来预测现有树群在未来气候下适应不良的风险程度。LGM工具可以根据基因型与当前气候数据之间的关联生成当前气候相关遗传变异的地图。这些模型提供了局部适应的证据以及未来气候适应所需的遗传变异(Sork等人,2013年)。现有气候相关遗传变异与未来环境条件所需变异的匹配程度被称为“适应度”,定义为生物在特定环境中的生存和繁殖能力(Allard,1988年),在这里是指未来的气候(图1)。这种基因型-环境一致性可以通过适应度指数来量化(Buck等人,2026年),计算公式为?1×基因组偏移量,其中接近0的值表示较高的适应度,更负的值表示较低的适应度。适应度指数与常用的指标基因组偏移量(Fitzpatrick和Keller,2015年;Rellstab等人,2021年)直接相关,后者对应于基因型-环境不匹配,但我们认为负数刻度和“适应度”这一术语能更好地描述所讨论的主题。适应度较低的树群预计在未来气候下更容易发生适应不良,而适应度较高的值(接近0)表示局部适应较小,被认为更预先适应了未来气候。同样,通过模拟种子转移后计算适应度可以用来评估树群在未来其他地点的适应不良风险,例如用于种子来源的选择(Gougherty等人,2021年;Mead等人,2024年;Buck等人,2026年)。这仍然是一种适应度的衡量方法(即给定树群的气候相关遗传变异与未来环境所需遗传变异的匹配程度),但它是相对于其他地点的未来环境而言的(图S1)。适应度值是相对的,因此只能显示树群在适应不良方面的风险程度,而不能反映确切的适应后果。然而,基因组预测可以通过温室或共同花园数据进行验证,如果预测的适应度值与给定环境中的适应性之间存在强正相关,则表明适应度预测的性能较高(Capblancq等人,2020年;Capblancq等人,2020年;Fitzpatrick等人,2021年;Rellstab等人,2021年;Láruson等人,2022年;Lind等人,2024年)。这些方法已被用于树木保护研究,以评估种群适应不良的风险(Martins等人,2018年;Varas-Myrik等人,2022年;Yuan等人,2023年),并评估潜在的种子来源和恢复种植地点,以减少这种适应不良(例如,Mead等人,2024年;Buck等人,2026年)。
**图1**:简化图示了适应度的计算方法。黄色到紫色的渐变代表基因型(以树木为代表)所处的环境梯度。在T1中,基因型在其环境中局部适应(基因型的颜色与其背景颜色相匹配)。在T2中,环境发生了变化,代表了气候变化的影响。然后计算现有基因型与未来环境之间的匹配程度,即当前(T1)气候相关变异与未来气候(T2)相关变异之间的相似性。这种匹配通过适应度指数来衡量,其中较高的值表示较高的基因型-环境一致性,用较浅的红色表示。与ENMs类似,LGMs使用与当前环境变量的关联来识别风险较高的树群,但预测基于具有相似环境相关遗传变异的个体,而不是出现数据。目前尚不清楚LGM和ENM的预测是否识别出相同的易感区域,据我们所知,只有一项研究直接比较了这两种方法,发现两者之间的相关性较低(Tournebize等人,2022年)。在这里,我们测试了利用LGMs能否检测到ENMs未能发现的易感种群的预期。我们结合两种模型的信息,为如何保护面临气候变化的树种群提供建议。鉴于树种短期扩散的限制,探索种子转移是否是提高种群对未来环境适应度的有效方法是有价值的(Aitken和Whitlock,2013年)。对于给定的保护区或恢复地点,第一步是通过栖息地适宜性或气候适应度来评估其对气候变化的敏感程度。在这里,我们测试了使用适应度较低的树群进行恢复将比使用栖息地适宜性较低的树群带来更大的未来适应度增加的预期。一旦选择了恢复地点,资源管理者的下一步就是选择用于恢复工作的种子来源。这些种子可以随机从该地区选择,或者假设当地种子最适合该地点而进行局部聚集(McKay等人,2005年)。第三种选择是根据景观基因组模型识别出在未来气候下生长良好的种子来源。包含对未来气候具有高适应度的树群的地点可能包含对整个物种分布范围有益的气候相关遗传变异,应作为潜在的种子来源进行探索。或者,可以通过模拟种子转移后的适应度来识别出预先适应了给定恢复地点未来气候的树群,这可以通过潜在种子来源的当前气候相关遗传变异与未来恢复地点所需变异之间的差异来计算(Gougherty等人,2021年;Mead等人,2024年;Lind等人,2024年;Buck等人,2026年)。在这里,我们测试了后一种策略——使用预测为预先适应了恢复地点未来气候的种子来源——是否会导致比传统种子来源策略具有更高适应度值的树群。确定最具有恢复力的种子来源可以为种群提供最好的生存机会,并高效利用有限资源,而不是种植将在未来气候变化中失败的适应不良种子。本文的总体目标是利用ENMs和LGMs来识别加利福尼亚特有基础树种蓝橡树(Quercus douglasii)对未来气候的敏感区域,并测试以下预期:(a) 使用LGMs将能够检测到ENMs未能发现的易感种群;(b) 使用LGM适应度值选择恢复地点将比使用ENM栖息地适宜性值降低未来气候适应不良的风险;(c) 选择预先适应了恢复地点未来气候的种子来源将比传统种子来源方法获得更高的适应度值。蓝橡树在结构和功能上支持数千种其他物种(Pavlick等人,1991年;Block和Morrison,1998年),并改善了其所构成的橡树林生态系统的土壤质量(Dahlgren等人,2003年)。其减少的招募(Swiecki和Bernhardt,1998年;Tyler等人,2006年;Zavaleta等人,2007年)、最近由干旱引起的死亡事件(Brown等人,2018年;Das等人,2020年;McLaughlin等人,2020年;Huesca等人,2021年),以及由于气候变化和土地利用变化导致的栖息地和生长率预测减少(Holzman等人,1993年;Kueppers等人,2005年;Brown等人,2018年)突显了保护蓝橡树的重要性。本研究利用了大自然保护协会(TNC)管理的超过16万公顷(约占加利福尼亚州保护土地的1%)的草地和橡树林土地(图S2),代表了学术界和应用保护科学家之间的合作,以解决研究应用于管理的差距(Gibson等人,2016年)。我们的目标不仅是探索全州范围内的气候适应不良风险,还将管理建议直接应用于TNC的保护区网络中。本研究展示了一种可实施的管理策略,用于蓝橡树(Quercus douglasii),并提供了一个有力的案例研究,表明基于长期遗传变异(LGM)的树木种群管理可以提高当地林分的适应能力,并减轻气候变化的影响。
2 材料与方法
2.1 研究物种
蓝橡树(Quercus douglasii Hook & Arn)是一种落叶性橡树,原产于加利福尼亚州,广泛分布于沿海山脉和东部内华达山脉的山麓地区(Pavlick等人,1991年)。蓝橡树的基面积(树干横截面积)在加利福尼亚州的橡树中排名第三,仅次于峡谷活橡树(Quercus chrysolepis)和加州黑橡树(Quercus kelloggii)(Karlik和Chojnacky,2014年)。从系统发育学上看,蓝橡树属于白橡树组(Quercus),其最近的亲缘种是灌木状的白橡树Quercus john-tuckerii(Kim等人,2018年;Hipp等人,2020年)。蓝橡树种群通常生长在橡树林生境中较为干燥的区域(Pavlick等人,1991年),支持丰富的生物多样性(Reiner和Craig,2011年;Stahle等人,2013年),并提供多种生态系统服务,包括碳封存和维持土壤质量(Dahlgren等人,2003年)。与另一种广泛分布的加利福尼亚特有树种——谷橡树(Quercus lobata)相比,蓝橡树能够忍受更低的白天气水势,并且在夜间具有更强的水分恢复能力(Knops和Koenig,2000年)。该物种被认为具有抗旱性,但在不同生态型中其对干旱的敏感性存在差异(Griffin,1973年;Poudel等人,2025年),一些种群在严重干旱后会出现大量死亡(Das等人,2020年;McLaughlin等人,2020年;Dwomoh等人,2021年)。在其分布范围内,蓝橡树的更新率较低(Swiecki和Bernhardt,1998年;Tyler等人,2006年;Zavaleta等人,2007年),主要原因包括入侵性一年生草类(Gordon等人,1989年;Gordon和Rice,2000年)以及动物啃食(Borchert等人,1989年;Swiecki和Bernhardt,1998年;Palmerlee等人,2025年)。
2.2 样本采集与分布范围外推
2023年6月,在由TNC、加州大学保护区系统和加州州立公园管理的十个地点采集了172株蓝橡树的叶片样本(表1),其中三个TNC重点区域(Dye Creek、Las Piletas Ranch和Randall Preserves)的采样更为密集(图2)。这种基于个体的采样设计能够捕捉蓝橡树分布范围内的环境和遗传变异(图S3),同时也能够更详细地分析重点区域内的梯度变化。在每个重点区域内,采用了随机分层采样方法,将区域划分为2×2公里的网格,并在每个网格中随机选择一个点,确保每个点都在已知的蓝橡树分布范围内,点与点之间的距离大于200米,并且距离道路不超过500米。样本点通过卫星数据定位并标记在最近的树上。每棵树采集多片叶子,立即放入冰袋中冷冻,以备后续分析。蓝橡树当前的分布范围是根据CALVEG(美国农业部林业局,2018年)和VegCAMP(加州鱼类和野生动物部,2024年)的数据整理得出的。所有地理文件在ArcGIS Pro(ESRI,2025年)中进行了映射和合并。
表1. 全州蓝橡树采样点的分布情况,包括三个TNC重点区域。
| 地点 | 土地类型 | 保护区面积(公顷) | 保护区内的蓝橡树比例 | 坐标 | 采集的树木数量 |
|---------------|-------------|------------|-------------|-------------------|
| Dye Creek Preserve | TNC管理 | 20,011 | 35 | 40.113, ?122.001 | 48 |
| McLaughlin Reserve (ML) | UC保护区 | 2853 | 15 | 38.850, ?122.386 | 4 |
| Folsom Lake State Park | 州立公园 | 9885 | 23 | 38.721, ?121.170 | 4 |
| Waltz-Turner Ranch | TNC地役权 | 4206 | 11 | 37.410, ?120.222 | 4 |
| Mount Hamilton Conservation Easement | TNC地役权 | 11,386 | 25 | 37.250, ?121.621 | 4 |
| Ruth McKenzie Table Mountain Preserve | TNC地役权 | 1544 | 76 | 37.005, ?129.599 | 4 |
| Hastings Reserve | UC保护区 | 960 | 8 | 36.382, ?121.559 | 4 |
| Las Piletas Ranch Preserve | TNC收费保护区 | 6811 | 39 | 35.291, ?120.098 | 48 |
| Frank and Joan Randall Preserve | TNC收费保护区 | 34,639 | 23 | 35.220, ?128.496 | 48 |
| Sedgwick Reserve | UC保护区 | 386 | ~1 | 34.695, ?120.042 | 4 |
图2. 蓝橡树的采样地图(蓝色表示完整分布范围),样本地点用圆圈标出,TNC重点区域用方框标出。红色点表示被采样的树木。叠加的图像是重点区域及其保护区边界的放大图,背景使用了气候水分亏缺变量,颜色越深表示亏缺越大。采样点缩写见表1。
2.3 DNA提取与测序
从每个样本中提取约50毫克叶片组织,先用液氮快速冷冻,然后使用改良版的Qiagen DNeasy Plant Mini Kit协议进行DNA提取(参考Mead等人,2024年和Li等人,2007年的方法)。提取前先进行预处理步骤,使用含有100 μL Tris、100 μL乙二胺四乙酸(EDTA)、200 μL 5 M NaCl、600 μL分子级水和0.01 g聚维酮(PVP)的预处理缓冲液。提取的DNA随后被送往UC Davis DNA Technologies和Expression Analysis Core实验室,使用定制的seqWell试剂盒进行文库制备,并在NovaSeq 6000 150 bp双端测序仪上进行全基因组测序(WGS)。
2.4 过滤与变异调用
为了生成全基因组数据集,使用Trim Galore(https://github.com/FelixKrueger/TrimGalore)从原始读段中去除适配器序列,保留长度大于20 bp的读段。接着使用BWA-MEM(Li,2013年)将读段与最接近的公开可用的染色体级参考基因组Q. lobata(ValleyOak3.2,Sork等人,2022年)对齐,同时启用‘markShorterSplits’和‘readGroupHeaderLine’选项。使用GATK中的MarkDuplicates工具标记并删除重复读段(Van der Auwera和O'Connor,2020年)。使用GATK中的‘HaplotypeCaller’工具调用变异,将‘emit-ref-confidence’选项设置为‘GVCF’。然后通过GATK GenomicsDBImport将GVCF导入GenomicsDB,并使用‘GenotypeGVCFs’进行基因分型。使用GATK中的‘VariantFiltration’工具对变异进行严格过滤,分别过滤单核苷酸多态性(SNPs)和插入/缺失(indels)。对于SNPs,删除质量深度(QD)< 2、质量(QUAL)< 30、映射质量(MQ)< 40、phred缩放链偏倚(FS)> 60、对称比值比链偏倚(SOR)> 3、映射质量总分(MQRankSum)< ?12.5以及读段位置总分(ReadPosRankSum)< ?8的变异(Mead等人,2024年;Buck等人,2025年,2026年)。对于indels,删除QD < 2、FS > 200、QUAL < 30和ReadPosRankSum < ?20的变异(Mead等人,2024年;Buck等人,2025年,2026年)。使用vcftools(Danecek等人,2011年)根据参考基因组去除基因组的重复区域。由于覆盖度低,移除了4个个体;另外移除了5个在初步遗传结构和杂合性分析中表现异常的个体(包括所有来自MH的个体),最终得到163个来自9个地点的WGS样本。从这些高质量变异中,选择了在所有样本中都有高覆盖度的双等位基因SNPs进行进一步分析。使用vcftools,仅保留双等位基因SNPs,将深度小于5的个体基因型设置为缺失值,删除所有样本中平均深度小于5、次要等位基因频率小于0.01且至少有10%缺失率的SNPs。使用PLINK(版本1.90b6.26,Chang等人,2015年)将过滤后的VCF文件转换为BED格式,并使用窗口大小为50个变异、窗口移动值为10和R2阈值为0.1的参数去除连锁不平衡的变异。对这个过滤并去除了连锁不平衡的163个个体的数据集(包含268,557个SNPs)进行了遗传结构分析。对于不需要缺失数据的分析,通过为缺失个体分配最常见的SNP来插补SNPs(过滤数据集中的总缺失率< 7%)。
2.5 环境数据
根据Rose等人(2023年)的研究,提取了十个对蓝橡树分布重要的基线和未来水文气候、地形和土壤变量(表S1)。水文气候变量来自 Basin Characterization Model版本8(BCM;Flint等人,2021年;Stern等人,2024年),包括实际蒸散量(AET)、气候水分亏缺(CWD)、月最低温度(TMN)、夏季降水量(PPT_jja)和冬季降水量(PPT_djf)。土壤变量包括有效水分容量(AWC)、土壤深度(Depth)、土壤pH值(PH)和粘土百分比(PCT_clay),数据来源于网格化的国家土壤调查地理数据库(gNATSGO,土壤调查团队,2020年)。此外,我们使用了15种反映地貌多样性的地形类型(Terrain),这些类型是为气候适应性资源管理开发的(Theobald等人,2015年)。土壤和地形变量被重新采样,以匹配气候数据的270米空间分辨率,连续土壤变量采用双线性重采样,分类地形数据采用最近邻重采样。选择了1981–2010年的30年平均值作为代表树木生长时的历史条件(注意大多数采样树木的年龄可能超过40年)。未来水文气候变量来自两个气候模型(CNRM-CM5:温暖湿润型,HadGEM2-ES:炎热干燥型),这两个模型是加州第四次气候变化评估推荐的(Pierce等人,2018年),以及两个代表性浓度路径(RCPs;4.5:减排,8.5:增排),并选择了两个未来时间段(2040–2069年和2070–2099年)的30年平均值。假设土壤和地形条件随时间保持不变,用于预测基线和未来的气候条件。
2.6 生态位模型
本研究中使用的生态位模型(ENMs)来自Rose等人(2023年),是基于十个气候、土壤和地形变量构建的(见环境数据部分)。这些模型是通过结合六种算法的预测结果生成的:广义线性模型、广义加性模型、随机森林、支持向量机、人工神经网络和提升回归树。每种算法使用了1980年至2020年间来自植被调查(Hannah等人,2008年)和Calflora.org的4516个存在位置和10,752个缺失位置的数据。首先应用最大化敏感性和特异性的阈值来生成共识集成预测,然后对保留的连续栖息地适宜性值进行平均。所有模型均使用flexsdm R包(Velazco等人,2022年)生成。ENMs被裁剪到已知的蓝橡树当前分布范围内(见样本采集与分布范围外推部分)。需要注意的是,由于我们关注的是保护现有种群以及在快速气候变化这一短时间内自然长距离扩散的局限性,因此没有包括蓝橡树当前分布范围之外的扩展情况。此外,LGMs在估计适应能力时仅限于当前包含具有遗传变异的种群的区域(见基因型-环境关联和气候适应性部分),因此,将适应能力值与当前范围内的未来栖息地适宜性值进行比较是合适的。
2.7 遗传结构与变异
为了了解种群间遗传变异的空间模式,研究了蓝橡树在其分布范围及三个重点区域内的遗传结构。首先使用R包vegan(Oksanen等人,2024年)进行了主成分分析(PCA),以评估遗传变异的分布。接下来,使用ADMIXTURE(Alexander等人,2009年)这一最大似然方法估计了分布范围内的离散遗传簇(K)并计算了祖先系数。测试了K值1–10,选择最低的交叉验证值作为最佳K值。祖先系数(Q值)使用pophelper(Francis,2017年)进行可视化。最后,为了验证遗传梯度是否由地理距离引起,使用vegan中的Mantel测试(Mantel,1967年)评估了地理距离对遗传距离的影响,其中遗传距离使用geosphere包中的‘distHaversine’函数计算,地理距离使用Haversine距离计算。为了验证遗传梯度是否由生态距离引起,同时考虑地理因素,使用vegan中的部分Mantel测试评估了环境隔离的影响,其中遗传距离和地理距离的计算方法与上述相同,环境距离使用每个个体位置的缩放平均环境变量的欧几里得距离计算。
2.8 基因型-环境关联与气候适应性
为了研究气候和遗传变异之间的关系,并识别与环境梯度相关的候选适应性SNPs,使用了相同的十个环境变量集进行了潜在因子混合模型(LFMM)和冗余分析(RDA)。由于Folsom Lake State Park的两个样本缺少栅格数据,因此被排除在外。作为单变量回归方法,LFMM能够识别位点和生物气候变量之间的线性关联,同时考虑了种群结构等潜在因素(Caye等人,2019年)。首先,通过R包vegan中的rda()和screeplot()函数对遗传数据进行PCA分析,然后使用折棍模型确定潜在因子数量(K)。接着通过PCA对十个环境变量进行总结,并通过折棍模型确定保留的PC轴数量。随后使用R包lfmm中的lfmm_ridge()函数运行LFMM两次(每次针对一个显著的PC轴),其中K=1(Caye等人,2019年)。得到的p值通过qvalue()函数转换为q值(Storey等人,2023年),以考虑多重检验,将假发现率<10%(q值<0.1)的位点识别为候选适应性异常值(Fran?ois等人,2016年;Gain和Fran?ois,2021年;Gugger等人,2021年;Gain等人,2023年;Sandercock等人,2024年)。作为多变量基因型-环境关联方法,RDA同时考虑了所有环境变量的影响,因此其真阳性率高于其他单变量和多变量方法(Forester等人,2018年)。使用R包vegan进行了部分冗余分析(pRDAs),分别和联合评估气候/土壤(使用十个环境变量)、地理(使用纬度、经度、纬度×经度)和种群结构(PC1)对遗传变异的贡献,并通过R中的‘anova’函数总结了每个因素的影响(表S2;Capblancq和Forester,2021年)。然后使用基于地理变量和种群结构的条件进行部分受限RDA,保留了通过排列检验显著的两个受限RDA轴。计算了马氏距离,经过膨胀因子校正后,使用自由度为K=2的卡方分布转换为p值(Fran?ois等人,2016年;Luu等人,2017年;Capblancq等人,2018年)。通过p值小于保守的Bonferroni校正显著性阈值α=0.01/n(其中n是测试的位点数量)来识别异常值,并将前10%的异常值(129个)作为候选适应性SNP(Fran?ois等人,2016年;Gain和Fran?ois,2021年;Gugger等人,2021年;Gain等人,2023年;Sandercock等人,2024年)。RDA检测到的异常值(140个SNP)和LFMM检测到的异常值(129个SNP)合并后得到263个独特的SNP(有6个SNP重叠),并用于适应性分析。需要注意的是,这些位点不应被解释为单独的因果适应性变异;相反,与环境变量相关的总体多变量变异被认为是由于自然选择而具有适应性的。然后利用注释的参考基因组(Q. lobata)检查每个潜在适应性SNP相关的潜在功能,并定位每个SNP周围1 kbp内的已知基因。为了评估蓝橡树分布范围内的当前适应性遗传变异,并预测未来环境变量与当前气候相关遗传变异之间的不匹配,使用环境变量对候选适应性位点进行了梯度森林(GF)分析。梯度森林是一种机器学习随机森林技术,它将多变量等位基因频率建模为环境变量的集成非线性回归函数(Ellis等人,2012年;Fitzpatrick和Keller,2015年)。我们选择使用GF而不是RONA(非适应性风险,根据Rellstab等人,2016年),因为GF能够处理多基因位点和多变量环境数据,从而获得更好的模型性能(Rellstab等人,2016年;Lind和Lotterhos,2024年)。这些分析基于采样个体的基因型,但气候关联和预测结果受限于气候数据的分辨率。因此,适应性是针对整个网格单元进行预测的,我们将这些网格单元中的树木称为“林分”,因为它们由多个个体组成。‘gradientForest’函数的参数设置为树木数量为500,相关阈值0.5,最大层级设置为log2(0.368×个体数量/2)(Ellis等人,2012年)。然后使用gradientForest R包中的‘predict’函数预测整个范围内的适应性基因组更替,并使用Fitzpatrick和Keller(2015年)的‘pcaToRaster’函数进行映射。使用Fitzpatrick和Keller的代码计算当前气候相关遗传变异与每个RCP和时间段之间的基因组偏移,该代码采用了当前和未来GF预测的标准差。然后将基因组偏移值乘以-1以产生气候适应性值,并在ArcGIS Pro(ESRI)中绘制结果。
2.9 比较ENM和LGM预测的趋势
为了检验景观基因组预测与生态位模型预测的结果,分别对整个蓝橡树分布范围和每个重点保护区运行了嵌套线性模型,以在局部管理层面研究两者之间的关系。通过R包lme4(Bates等人,2015年)的混合效应线性模型将气候适应性值与栖息地适宜性值进行关联,通过将年份嵌套在RCP内来考虑气候情景的层次结构,将纬度(Lat)和经度(Lon)作为固定效应来控制空间自相关性,并通过将网格单元ID作为随机截距来考虑气候情景中网格单元的重复测量(适应性~适宜性 + 模型/(RCP/年份) + 纬度 + 经度 + (1|gridcellID))。使用R包ggeffects(Lüdecke,2018年)绘制线性模型。为了获取每个情景的气候适应性和栖息地适宜性值,使用terra包(Hijmans等人,2022年)将栅格转换为点。
2.10 恢复地点和种子来源分析
为了验证使用LGM适应性值来识别恢复地点是否会降低未来气候适应不良的风险,我们根据每个重点保护区内ENM和LGM数据选择了四类假设的恢复种植地点:
- 预测为最不适宜的网格单元,即ENM中未来栖息地适宜性值最低的四分位数;
- 预测为最适宜的网格单元,即ENM中未来栖息地适宜性值最高的四分位数;
- 预测为预适应程度最低的网格单元,即LGM中适应性值最低的四分位数;
- 预测为预适应程度最高的网格单元,即LGM中适应性值最高的四分位数。这些种植地点类别代表了潜在的保护目标(高易感性或低易感性),以及土地管理者可以据此做出决策的实际信息(ENM输出或LGM输出)。这些分析是在保护区层面进行的,以反映管理者通常工作的规模,并说明这些LGM工具如何在基于行动的管理中得到应用。并非所有保护区内的网格单元都属于某个种植地点类别,有些属于多个类别(例如,最适宜和最预适应)。为了验证选择预适应未来气候的种子来源是否会比传统种子来源策略获得更高的适应性值,我们对每个种植地点类别在计算机上测试了五种种子来源策略:
- 无行动:这一类别表示没有采取任何恢复措施,即不转移种子。该类别的适应性值是每个网格单元的平均适应性值,用于与其他种子来源类别进行比较,以评估它们是否能改善假设的恢复地点。
- 随机:这一类别使用重点保护区内100个随机网格单元作为种子来源,重复十次并取平均值。我们预计这种方法只会略微提高种植地点的未来适应性,因为它可能会引入对地点有益的适应性多样性。
- 附近:从距离假设恢复种植地点500米范围内的网格单元获取种子。我们预计这种方法不会显著提高适应性,因为种子来源的气候相关遗传变异与种植地点非常相似。
- 本地适应:从保护区内适应性值最高的网格单元获取种子。我们预计这种方法只会比随机和无行动策略略微提高未来适应性,因为高适应性是相对于位置的,当林分在计算机上移动到其他位置时,它们可能不具备新位置所需的气候适应性多样性。
- 恢复地点适应:从保护区内适应性值最高的网格单元获取种子。我们预计这种方法会由于其隐含的设计——针对最预适应未来气候的来源——而显著提高假设恢复地点的适应性。这种建模练习测试了使用景观基因组工具可以改善假设恢复地点的程度,与不采取任何措施以及其他典型的种子来源方法相比。我们预计恢复地点适应方法作为概念验证会表现最好;然而,如果它没有比非基因组信息种子来源方法提高更多的气候适应性,那么土地管理者就不需要专注于为其保护区获取基因组数据。并非所有保护区内的网格单元都属于某个种子来源类别,有些属于多个类别(例如,随机和恢复地点适应)。虽然这些方法可以轻松扩展到整个物种的分布范围,但种子来源的实际应用是在局部层面进行的,因此在这里以这种方式进行说明。此外,随着种植地点和种子来源的网格单元数量的增加,计算气候适应性变得极其复杂。例如,要找到一个能提高整个分布范围气候适应性的种子来源,需要测试每个网格单元与其他所有网格单元的适应性,这不仅消耗大量计算资源,而且产生的结果在考虑到局部适应性和管理规模的情况下不一定有用。更实际的做法是考虑一个种子来源或种植地点,以确定最佳的种子来源或种植位置。为了计算每个恢复地点类别在种子来源后的预测适应性(图S1),我们计算了每个供体单元(将作为假设种子来源的栅格单元)与每个受体单元(将作为假设恢复种植位置的栅格单元)之间的适应性,针对每种气候情景。然后对每个假设种植地点类别内所有受体单元的所有气候情景和三个重点保护区的适应性值进行了平均,以得出每种种子来源策略和种植地点组合的平均适应性值(“无行动”策略除外,因为该模型中不转移种子)。需要注意的是,我们检查了重点保护区内潜在的种子来源和恢复地点,但模型中包含的种子来源区域和恢复地点的大小和来源可以放大或缩小,并可以在保护区内外进行调整,以满足保护者的需求。在R中使用‘lmer’函数进行了混合线性模型,比较了种子来源策略、恢复地点、重点保护区、气候模型、RCP和年份对平均气候适应性的影响。恢复地点、种子来源策略和重点保护区作为固定效应,恢复地点和种子来源策略之间进行了交互作用。气候模型、RCP和年份也作为固定效应,年份嵌套在RCP内,反映了气候情景的层次结构。通过将纬度(Lat)和经度(Lon)作为固定效应来控制空间自相关性,并通过将网格单元ID作为随机截距来考虑气候情景中网格单元的重复测量(适应性 ~ 恢复地点 * 种子来源 + 保护区 + 模型/RCP/年份 + 纬度 + 经度 + (1|gridcellID))。通过随机抽样每个恢复地点类型和种子来源策略的数据集生成置信区间,创建了10,000次重复的自助法均值。为了计算每个恢复种植点相对于基线(“不采取任何行动”情景)的百分比变化,将每种种子来源策略的自举均值和置信区间从基线适应度均值和置信区间中减去,然后分别除以基线均值和置信区间(公式1)。
(1)
3 结果
3.1 遗传结构与变异
为了描述蓝橡树在整个物种范围内的遗传结构,我们对包含所有收集样本的完整数据集进行了主成分分析(PCA)。观察PC轴1和PC轴2,它们分别代表了6.28%和5.91%的变异,最南端的四个地点(Hastings、Sedgwick、Las Piletas和Randall)与其余四个最北端的保护区的大多数样本分离。样本倾向于按采集地点分组,尽管在同一地点内的变异很大——有时甚至超过地点之间的变异(图3A)。观察PC轴2和PC轴3,后者代表了5.65%的总变异,Randall的大多数样本可以与其余样本区分开来,并且再次观察到显著的地点内变异(图3B)。不出所料,基于CV误差的ADMIXTURE给出了最佳聚类结果K=1(表S3),这表明在长尾花粉传播下基因流较高,从而减少了物种层面的遗传结构(Sork和Smouse 2006)。强制设置更高的K值显示焦点地点变得更加明显,表明地点之间存在一些次要结构(图3C)。然而,这种潜在的亚结构是由于采样间隙还是真实障碍尚无定论。这些低遗传结构的模式在具有较大种群规模和基因流的物种中是预期的,与其他橡树的研究结果相似(例如,Craft和Ashley 2007;Ashley等人2018;Gugger等人2021;Mead等人2024;Buck等人2025, 2026)。我们观察到隔离度的趋势可以忽略不计,R2值为0.001,p值为0.001(图S5A),表明遗传结构不能很好地用地理距离来解释。同样,我们也观察到环境隔离度的趋势可以忽略不计,R2值为0.001,p值为0.037(图S5B),表明遗传结构不能很好地用环境距离来解释。图3在图形查看器中打开
基于图2中显示的163个蓝橡树成体的全基因组序列进行的遗传变异和结构分析。(A)PCA的轴1和轴2按采样地点着色,最北端的地点为粉色,最南端的地点为紫色,没有明显的遗传变异模式,除了样本倾向于按采集地点分组。(B)PCA的轴2和轴3显示遗传变异同样没有明显的地理梯度。(C)ADMIXTURE图(Alexander等人2009)将相同的163个成体按从北到南的顺序分组,测试1-10个遗传簇(K),其中K=1的CV误差最低,因此最有可能;K=2的CV误差第二低。在K=2和K=3中可以观察到一些中性的遗传梯度,但在IBD或IBE分析中并不强烈。每个垂直条代表一个个体样本,每种颜色代表该个体所属的遗传组,多色条代表基于y轴上显示的Q值的混合个体。
3.2 与气候相关的位点和多样性模式
单变量潜在因子混合模型(LFMM)分析在两次LFMM运行中检测到140个异常SNP,所有这些SNP都被保留用于基因本体论和适应度分析。包括环境、地理和种群结构的多元全冗余分析(RDA)解释了所有位点10%的变异(表S2)。在地理和种群结构条件下的受限部分RDA发现环境变量解释了64%的变异(表S2),识别出1286个显著的候选适应SNP,其中10%被保留用于基因本体论和适应度分析。在其他树木研究中,适应SNP也解释了类似的高比例变异(DeSilva和Dodd 2020;Mead等人2024;Buck等人2026)。在探索与每个潜在适应位点相关的潜在功能时,115个SNP位于编码区域1 kbp范围内,其中92个具有已知功能,12个与应激反应有关,包括负责耐热性、光合作用抑制和生长调节的基因(表S4)。为了绘制与气候相关的遗传变异的地理模式,我们使用梯度森林(GF)来插值RDA和LFMM确定的蓝橡树分布范围内的气候相关等位基因频率变化(图S6)。尽管遗传结构较低,但观察到了局部适应的模式(图S6),蓝橡树分布范围的最北端具有非常独特的气候相关组成,而南部沿海山脉与内华达山脉盆地不同。在焦点地点内,气候相关组成是异质的,气候相关多样性在海拔梯度上存在一些变化。在检查焦点地点之间的气候相关组成差异时,Dye Creek保护区的气候相关组成与Las Piletas Ranch和Randall保护区非常不同,而Las Piletas Ranch和Randall保护区具有相似的组成。通过梯度森林模型探讨了不同环境变量在解释气候相关遗传变异中的重要性,夏季降水量最为重要,其次是最低温度、冬季降水量、土壤深度、土壤pH值、气候水分亏缺、实际蒸散量、粘土百分比和地形类型,最后是可用水量(图S7)。
3.3 气候适应性
为了识别对未来气候变化适应度高和低的区域,我们为两种气候模型、两种RCP情景和两个时间段计算了气候适应性指标。模型预测蓝橡树分布范围的最北端区域的气候适应性最低(这些区域在未来气候中面临更大的适应不良风险),其次是内华达山脉盆地的气候适应性值也较低(图4A和S8)。沿海山脉的林分预计具有比蓝橡树分布范围其他部分更高的气候适应性值。平均而言,CNRM-CM5模型(温暖/湿润)预测的蓝橡树种群的气候适应性值显著高于HadGEM2-ES模型(炎热/干燥)(图S8-S11),但随着排放量的增加(RCP 4.5对比RCP 8.5)以及时间从2040-2069年到2070-2099年的推移,适应性都有显著下降。图4在图形查看器中打开
比较未来气候下的气候适应性和栖息地适宜性预测。(A)蓝橡树分布范围在最近气候和未来气候模型HadGEM2-ES情景RCP-8.5之间的适应性预测,2070年至2099年的30年平均值。绿色表示更高的气候适应性。数值在0到-1之间标准化,以便于视觉缩放。叠加的框包含三个TNC焦点地点的放大偏移图。(B)蓝橡树分布范围在未来气候模型HadGEM2-ES情景RCP-8.5下的栖息地适宜性预测,2070年至2099年的30年平均值。叠加的框包含三个TNC焦点地点的放大适宜性图。绿色表示更适宜的栖息地,而红色表示不适宜的栖息地。
3.4 未来气候下ENM和LGM预测趋势的比较
来自景观基因组模型预测的气候适应性值(图4A)与Rose等人(2023)的生态位模型预测的栖息地适宜性(图4B)在范围范围内有很强的相关性,气候适应性随着栖息地适宜性的增加而增加(图5和S9;适应性~适宜性 + 模型/(RCP/年份) + 纬度 + 经度 + (1 | gridcellID),R2值为0.42,p值< 1 × 10^-16)。在保护区尺度上,这种相关性在三个保护区中的两个(Las Piletas Ranch和Randall)成立,但在Dye Creek中方向相反(图S10-S12),显示出气候适应性和栖息地适宜性之间的轻微但显著负相关。这些结果部分支持我们的预期,即使用LGMs将能够检测到ENMs未能发现的易感林分,因为在较小尺度上,LGMs在ENMs预测具有均匀适宜性值的区域检测到了适应性变化。图5在图形查看器中打开
线性模型(适应性~适宜性 + 模型/(RCP/年份) + 纬度 + 经度 + (1 | gridcellID))显示气候适应性与栖息地适宜性相关。适应性是通过景观基因组模型(y轴)计算的,栖息地适宜性是通过生态位模型(x轴)计算的,用于气候模型HadGEM-ES,RCP 8.5,2070-2099年的30年平均值。该模型以适应性作为响应变量,适宜性作为固定效应,年份嵌套在RCP内,气候模型嵌套在内。通过包括纬度(Lat)和经度(Lon)作为固定效应来控制空间自相关性,并通过包括gridcell ID作为随机截距来解释模型中的重复测量。每个点代表蓝橡树分布范围内的一个网格单元。回归具有显著性,R2值为0.42,p值< 1 × 10^-16。
3.5 种子来源和恢复地点选择策略
为了识别能够提高对未来气候适应性的种子来源方法,我们计算了五种种子来源策略(不采取任何行动、随机、附近、本地适应、恢复地点适应)和四种恢复地点选项(低适宜性、高适宜性、低适应性、高适应性)在三个焦点保护区(Dye Creek、Las Piletas Ranch和Randall)之间的适应性值,涵盖了所有未来气候情景(HadGEM-ES2或CNRM-CM5,RCP 4.5或8.5,2040-2069或2070-2099的30年平均值)。在检查所有三个保护区时,恢复地点适应的种子来源方法是唯一一种导致适应性值高于不采取任何行动的策略(图6,表S5)。其他种子来源策略的有效性在不同恢复地点有所不同,但都导致了适应性值的下降。不出所料,基于高适应性值选择恢复地点导致了最高的种群气候适应性(图S13),而选择适应性值低的恢复地点导致了最低的未来气候适应性,这可能是由于基于适应性的地点选择的隐含设计。下一个最佳的恢复地点选择是通过生态位模型识别的高适宜性地点,这是有道理的,因为适应性值通常与栖息地适宜性值相关。有趣的是,选择高适宜性恢复地点在使用恢复地点适应的种子来源时导致了最大的适应性值增加(20%)。虽然我们的模拟显示这些地点可以通过基于基因组的恢复得到最大程度的改善,但它们仍然不足以超过选择高适应性恢复地点。接下来最大的适应性值增加是在高适应性地点(14%),其次是低适宜性地点(9.5%),最后是低适应性地点(4.2%)。这种比较表明,恢复高适应性的林分可以带来最高的适应性水平,但我们仍然看到在低适应性地点也有改善,这表明种子转移可能是有益的。图6在图形查看器中打开
4 讨论
4.1 蓝橡树对气候变化适应不良的风险
在我们的景观基因组模型中,内陆的蓝橡树种群比沿海地区的种群面临更大的适应不良风险,内华达山脉盆地中的林分在未来气候中面临最大的适应不良风险。蓝橡树在整个分布范围内表现出高水平的局部适应,正如其他橡树物种所显示的(Gugger等人2021;Mead等人2024;Buck等人2026),这对于具有较大有效种群规模的植物物种来说是预期的(Leimu和Fischer 2008)。总体而言,HadGEM2-ES气候模型预测的适应不良风险高于CNRM-CM5模型,这可能是由于它们对加州未来气候模式的差异,CNRM-CM5预测的气候比HadGEM2-ES更温暖/湿润(Stocker等人2014)。与夏季降水量是解释气候相关变异的最重要环境变量这一事实相结合,这些趋势揭示了水在蓝橡树系统中的重要性,这与其他研究结果一致(Davis等人2016年;Brown等人2018年;McLaughlin等人2020年)。像加利福尼亚这样的地中海型气候地区,夏季降水量通常较低,有限的夏季降雨似乎施加了足够强的选择压力,促使了当地的适应性进化。例如,Las Piletas牧场保护区目前的夏季降水量低于其他采样区域,但它却拥有适应性值最高的蓝橡树林之一,这表明那里的蓝橡树可能已经适应了更干燥的气候,这将有利于它们的未来生存。正如预期的那样,在两种模型的RCP 8.5情景下,适应性值预计会低于RCP 4.5情景,2070-2099年的时间框架内,种群面临的不适应风险将大于2040-2069年的时间框架,这可能是由于RCP 8.5情景下的排放预测随着时间的推移而恶化(Meinshausen等人2011年)。蓝橡树分布范围最北端的地区以及内华达山脉盆地周围的内陆种群,其林分预计将面临更大的不适应未来气候变化的风险,因此可能需要采取诸如辅助种子转移等措施来降低这种风险(Prober等人2019年)。
4.2 生态和基因组预测在范围尺度上是一致的
在物种范围内,LGMs(冰川最大期模型)和ENMs(生态网络模型)识别出无论使用哪种气候模型,蓝橡树种群都可能易受未来气候变化影响的相似区域。与Tournebize等人(2022年)的研究结果不同,我们发现LGMs和ENMs的预测之间存在显著相关性。尽管这两种指标总体上存在相关性,但在某些蓝橡树分布区域,LGMs预测的易受影响程度高于ENMs。关于ENMs在保护工作中的应用,一个担忧是它们没有考虑到重要的进化过程,如局部适应性(Aitken等人2008年;Lachmuth等人2024年),这些过程可以决定物种在局部尺度上的生存能力。尽管如此,如果缺乏基因组数据,ENMs仍能提供一个关于物种当前分布范围内哪些部分可能最易受影响的整体视图。在更局部的尺度上,例如TNC(树木国家委员会)管理的保护区,基因组预测并不总是与生态预测一致。例如,Dye Creek保护区包含一些预测气候适应性较低的林分,尽管这些地区的栖息地适宜性很高。在这种情况下,ENMs可能预测了未来适合橡树生长的栖息地,但现有的橡树林并没有适应未来气候所需的遗传变异。也有可能在广泛的尺度上,LGMs和ENMs的预测结果一致,但在更细的尺度上这种相关性会消失,因为预测差异变得更加明显。例如,在HadGEM2-ES气候模型中,Dye Creek的大部分地区被预测为不适宜橡树生长的栖息地,而气候适应性在该保护区内仍有差异。此外,在蓝橡树分布范围的最北端以及内华达山脉盆地周围的内陆种群中,林分预计将面临更大的不适应未来气候变化的风险,因此可能需要采取诸如辅助种子转移等措施来降低这种风险(Prober等人2019年)。
4.2 生态和基因组预测在范围尺度上是一致的
在物种范围内,LGMs(冰川最大期模型)和ENMs(生态网络模型)识别出无论使用哪种气候模型,蓝橡树种群都可能易受未来气候变化影响的相似区域。与Tournebize等人(2022年)的研究结果不同,我们发现LGMs和ENMs的预测之间存在显著相关性。尽管这两种指标总体上存在相关性,但在某些蓝橡树分布区域,LGMs预测的易受影响程度高于ENMs。关于ENMs在保护工作中的应用,一个担忧是它们没有考虑到重要的进化过程,如局部适应性(Aitken等人2008年;Lachmuth等人2024年),这些过程可以决定物种在局部尺度上的生存能力。尽管如此,如果缺乏基因组数据,ENMs仍能提供一个关于物种当前分布范围内哪些部分可能最易受影响的整体视图。在更局部的尺度上,例如TNC(树木国家委员会)管理的保护区,基因组预测并不总是与生态预测一致。例如,Dye Creek保护区包含一些预测气候适应性较低的林分,尽管这些地区的栖息地适宜性很高。在这种情况下,ENMs可能预测了未来适合橡树生长的栖息地,但现有的橡树林并没有适应未来气候所需的遗传变异。也有可能在广泛的尺度上,LGMs和ENMs的预测结果一致,但在更细的尺度上这种相关性会消失,因为预测差异变得更加明显。例如,在HadGEM2-ES气候模型中,Dye Creek的大部分地区被预测为不适宜橡树生长的栖息地,而气候适应性在该保护区内仍有差异。此外,在局部区域,选择梯度可能更为明显,LGMs方法能够检测到这一点,但ENMs没有考虑到这一点。也许增加范围范围内的基因组采样点或已知的分布点可以提高对未来气候变化遗传变异和栖息地适宜性的预测精度。目前尚不清楚在其他物种中,这种趋势是否会在更细的尺度上消失,但在具有高局部适应性多样性的物种中,LGMs和ENMs预测之间的不一致可能更为常见。LGMs预测和ENMs预测之间的一个显著区别是,基因组偏移和适应性指标与ENM指标不同,因为它们仅限于当前的分布范围,因为无法计算未来和当前适应性组成的差异。因此,ENMs可以用于预测物种当前分布范围之外的未来栖息地。同时,基于基因组的种子转移可以提高未来地点对蓝橡树的适宜性,有助于它们的建立。Camus等人(2024年)的一项最新研究发现,低基因组偏移(或用我们的术语来说,高气候适应性)是预测建立概率的一个良好指标。尽管Camus等人(2024年)研究的是入侵植物,但他们的发现表明,在新环境中适应性较高的个体具有有利于建立的基因型。因此,结合使用这两种工具可以通过ENMs识别未来的适宜栖息地,并通过LGMs利用预先适应的种子来源来帮助建立未来的树木种群。
4.3 评估未来气候下地点的恢复潜力
我们对不同类型假设恢复地点的气候适应性进行了比较,说明了地点选择如何有助于保护该物种。在寻找恢复地点时,资源管理者可能希望减少气候变化对受影响最严重区域的影响,可以选择那些预测最易受影响的地点,例如未来栖息地适宜性低或气候适应性低的地区。在这些高易受影响的情况下,我们发现,与预期相反,通过恢复地点适应性种子来源恢复的地区的林分适应性略高于通过气候适应性低种子来源恢复的地区。这种差异可能是由于ENMs认为未来环境变化相似的地区不适合橡树生长,但这些地区可能包含可以从引入适应性遗传变异中受益的局部适应林分。或者,资源管理者可能希望将精力投资于最有可能成功的地点,选择那些预测气候适应性低的地点,例如未来栖息地适宜性高或气候适应性高的地区。在这种情况下,我们的结果清楚地表明,通过恢复地点适应性种子来源恢复的地区的林分适应性显著高于通过预测未来栖息地适宜性高的地点恢复的林分,这可能是由于起始的适应性值较高。然而,通过恢复地点适应性种子来源恢复的地点适应性增加最大(当使用恢复地点适应性种子来源时),这表明结合生态和基因组方法可能会产生最有效的恢复效果。值得注意的是,无论是恢复低易受影响地区(高适宜性,高适应性)还是高适应性地区,都能提高林分的适应性。如果资源有限,管理者希望无论选择哪种种子来源都能获得最具韧性的林分,那么选择生态位模型预测的高适宜性地点或景观基因组模型预测的高适应性地点都会显著降低不适应的风险。如果资源管理者只能使用生态位模型,那么选择预测高适宜性的地点会更好;但如果可以使用景观基因组工具,那么选择具有高未来气候适应性值的地点将创建更具韧性的未来林分。使用景观基因组工具的额外好处是可以识别适应性种子来源,进一步提高种群持续存在的几率。
4.4 选择预先适应恢复地点的种子可以产生适应性最高的林分
选择种子来源是恢复工作中的关键决策(Miller等人2017年),对恢复项目的成功至关重要(Vitt等人2022年)。我们对种子来源的比较清楚地支持了这样的预期:选择预先适应未来恢复地点气候的种子来源将产生比传统种子来源方法更高的适应性值,并且是唯一能够提高基线适应性的方法。我们的模拟显示,典型的种子来源方法,如随机选择母树或在当地收集种子,会导致恢复地点的适应性低于不采取任何行动的情况。无论地点的质量或当地种群的遗传组成如何,转移预先适应未来恢复地点气候的基因型(恢复地点适应性种子来源)被认为是最佳实践。这种方法可以使用与识别当地气候适应性区域相同的基因组资源,但会检查潜在种子来源的当前气候相关遗传变异与未来恢复地点所需变异之间的差异,从而找到最能提高恢复地点适应性的来源。种子转移适应性模型可以生成与常规适应性模型相似的地图,但可以指示种子来源对特定恢复地点的有效性,便于资源管理者理解(例如,图S14;Buck等人2026年)。用于选择蓝橡树恢复地点种子的标准对未来种群有显著影响。其他三种种子来源方法——随机、附近和局部适应——与恢复地点适应性方法及不采取任何行动相比,都增加了不适应的风险,这表明在没有基因组信息的情况下种植种子可能会造成更大的伤害。选择附近种子的效果因恢复地点而异,有时比随机选择更好,有时则相反或没有差异,这可能是由于恢复地点内树木的适应性组成与附近树木相似。我们预期,如果没有引入新的适应性变异,适应性不会显著增加;而随机在整个保护区分布种子可能会引入与恢复地点适应性不同的基因型,从而在某些情况下提高适应性,但在其他情况下则不会。然而,我们的分析表明,引入与未来气候不适应的基因型可能会造成更大的伤害。选择具有高气候适应性的种子来源(即图4A)并没有在恢复地点产生显著更高的适应性,实际上没有恢复地点预测局部适应性种子来源比随机或附近策略更好。与Buck等人(2026年)在海岸活橡树中的发现类似,局部适应性并不一定意味着全球适应性。换句话说,现有的树木可能具有适合该地区未来气候的遗传组成,但不适合保护区的所有区域。这一结果表明,使用未来适应性地图是一种可行的方法来评估当地的适应性,但根据未来气候计算种子来源的适应性可能会产生适应性最低的林分。总体而言,种子转移后的适应性模型作为保护工具具有很大潜力,当与ENMs或表型数据结合使用时,可能会更加有效。然而,对于无法进行长期共同花园实验(Germino等人2019年)或无法获取表型数据的资源管理者来说,景观基因组工具是提高林分适应性的可行第一步。如果资源管理者寻求气候适应性强的恢复(Simonson等人2021年),希望提高林分适应性并减轻气候变化的影响,我们建议他们种植通过恢复地点适应性种子来源预测的低未来不适应风险的种子,以增加未来最具气候适应性的种群。
4.5 我们研究的注意事项
景观基因组研究需要在大范围的环境梯度上收集大量样本,以建立准确的基因型-环境关联(Sork等人2013年)。最近的一项研究模拟了大量复杂数据集,探讨了采样设计对景观基因组分析的影响,发现只要有足够的环境和地理覆盖范围,基因型-环境关联分析是稳健的(Bishop等人2025年)。他们能够通过至少100个个体检测到适应性等位基因——而我们的研究中有163个个体。然而,我们承认更多的采样可以提高统计功效,可能揭示更细微的局部适应性模式。此外,我们在遗传结构分析中观察到的轻微遗传分化可能是由于采样不足造成的。未来更连续的采样将使我们能够评估物种范围内的遗传结构。我们将搜索范围限制在保护区内,但在某些情况下,寻找来自更远地区的预先适应的种子可能更为有效,并且可能会使林分的适应能力比这里建模的结果更高(例如,Mead等人,2024年)。也可以考虑将本地基因型与种子来源进行杂交,因为这有可能将有益的本地适应性(如抗病性)传递给后代。然而,管理者在转移基因型时应谨慎考虑相关风险,包括疾病传播的可能性、物候差异、遗传负荷、杂交衰退以及本地基因型的遗传淹没效应(Todesco等人,2016年;Grummer等人,2022年)。不过,至少对于橡树来说,由于它们的遗传结构较弱,杂交衰退并不常见,转移预先适应的种子的目的是减少潜在的气候不适应,从而提高而不是降低适应性。该方法还假设种子与其来源具有相同的遗传变异,这在生物学上并不完全准确,因为蓝橡树既不是克隆的也不是自交的;然而,林分内的遗传变异在一代之间不太可能发生剧烈变化。此外,实际中的种子转移应用并不总是针对已经消失的地点,也可能是为了补充现有的林分。在这些情况下,适应性的值将由现有林分和新种植的种子共同决定,而这无法纳入我们的分析中。另外,种子来源区域和恢复地点的大小可以根据管理者的需要进行调整。需要进一步的研究来了解预测的适应性值之间的差异是否会在实际中导致显著的适应性差异(Hoban等人,2016年;Capblancq等人,2020年;Capblancq等人,2020年;Fitzpatrick等人,2021年;Rellstab等人,2021年;Láruson等人,2022年;Lind等人,2024年)。多项研究发现基因组偏移与适应性下降之间存在关联(Fitzpatrick等人,2021年;Láruson等人,2022年;Gain等人,2023年;Lind和Lotterhos,2024年),这表明仅使用基因组工具是管理树种群的一个好的初步步骤。然而,基因组偏移方法在预测能力上可能存在额外的限制(Rellstab等人,2021年),特别是当存在表型可塑性(Schmid和Guillaume,2017年)、非气候选择压力(Van Daele等人,2022年)、高迁移率或大连锁块时,这些因素都可能破坏与气候相关的本地适应模式或导致非选择性的适应性变化。目前可用的研究太少,无法确定适应性与适应性之间的相关性是否普遍存在,但不适应性的适应性后果可能非常严重(Goetz等人,2026年)。因此,在这种方法得到更充分的验证之前,资源管理者可以监测转移基因型的生长和存活情况,以验证是否能够实现预期的适应性收益。这里未测试的其他方法,如基因组增强育种值(Browne等人,2019年)和在共同花园中选择表现最佳的基因型(Goetz等人,2026年),已被证明可以将适应性提高近60%,这说明了适当选择种子来源对未来树木生长的影响。
**5 结论**
景观基因组学和生态位模型都预测,作为加州生态系统基础树种的蓝橡树,在其分布范围的许多地区将受到未来气候的影响而面临威胁。这一结果对于管理生态保护区内的本地蓝橡树种群非常重要,因为了解该地区蓝橡树的易感性将有助于保护工作。这两种指标在广泛的范围内识别出了类似的易感区域,表明在没有基因组数据的情况下,生态位模型可以提供对未来气候广泛适应性的粗略估计。然而,在局部尺度上,景观基因组学分析可能更能帮助资源管理者理解蓝橡树的响应。如果目标是增强现有的蓝橡树种群,景观基因组学提供了更精确的分析,以指导种子转移,这可能是一个更好的选择。我们得出结论,使用适应恢复地点的基因型将显著提高现有林分的适应性,无论该地点目前预测的适宜性或适应性是高还是低。这一发现对恢复生态学家来说是一个鼓舞,因为它证明了使用预先适应未来气候的基因型可以降低现有树种的不适应风险,并增加保护健康生态系统的可能性。
**作者贡献**
R.B.:设计研究、收集样本、进行研究、分析数据、撰写和编辑论文;H.S.B.:设计研究、获取资金、收集样本、编辑论文;E.H.T.H.:设计研究;J.H.:设计研究、获取资金、收集样本、编辑论文;Z.P.:设计研究、获取资金、收集样本、编辑论文;M.B.R.:进行研究、编辑论文;V.L.S.:设计研究、获取资金、提供资源、撰写和编辑论文。
**致谢**
作者承认加利福尼亚州的原住民是进行这项研究的生态系统的传统管理者。我们感谢大自然保护协会对这项研究的支持。我们感谢Crystal和Erik Anderson、Dillon Brook、Dave Campbell、Andrea和Sylvia Craig、Daniel Griffin博士、Scott Hardage、Ethan Inlander、Michael White博士以及Abigail Whittaker在野外工作和样本收集方面的帮助。Jacqueline Holmes协助进行了DNA提取工作。我们还要特别感谢Michael White博士在项目早期开发阶段的支持。测序工作由加州大学戴维斯分校基因组中心的DNA技术和表达分析核心团队完成,得到了NIH共享仪器资助(1S10OD010786-01)。这项工作得到了大自然保护协会的支持。
**资金**
这项工作得到了大自然保护协会的支持。
**披露**
利益共享声明:本研究涉及的遗传资源不受《名古屋议定书》规定的国际访问和利益共享义务的约束。橡树叶样本的收集得到了加州州立公园(#23-820-048)、加州大学自然保护区以及大自然保护协会的适当许可和批准。
**利益冲突**
作者声明没有利益冲突。
**数据可用性声明**
原始测序读段和元数据可在NCBI的BioProject PRJNA1284407(https://www.ncbi.nlm.nih.gov/bioproject/18284407)中获取。收集样本的地理位置数据见表1。分析脚本可在Github(https://github.com/ryancollinbuck/qdou)上获取,并存档在Dryad(https://datadryad.org/dataset/doi:10.5061/dryad.dr7sqvb9n)上。生态位模型预测结果可在Dryad(https://datadryad.org/dataset/doi:10.5061/dryad.gf1vhhmw6)上找到,由Rose等人(2023年)提供。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号