基于随机种群统计学预测检验挑战与诊断结构化种群模型

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Methods in Ecology and Evolution》：Challenging and diagnosing structured population models by testing predictions from stochastic demography

【字体：大中小】 时间：2026年06月11日 来源：Methods in Ecology and Evolution 6.2

编辑推荐：

　　摘要：结构化种群模型在参数化时常能准确预测期望种群规模、阶段/状态分布及种群增长率，但它们同样预测个体间的结果变异，例如终生繁殖输出（Lifetime Reproductive Output, LRO）与寿命的方差和偏度、终生不繁殖概率等诸多生活史度量。检验这

摘要：结构化种群模型在参数化时常能准确预测期望种群规模、阶段/状态分布及种群增长率，但它们同样预测个体间的结果变异，例如终生繁殖输出（Lifetime Reproductive Output, LRO）与寿命的方差和偏度、终生不繁殖概率等诸多生活史度量。检验这类关于个体水平结果的预测，可成为非常有用的模型“压力测试”，因为它们依赖于模型各组分（如存活与繁殖力亚模型）在多时间步长上的交互作用，而不仅仅是亚模型的准确性。由于个体间变异数据很少用于模型参数化，模型并不会自动通过这些检验。研究人员通过案例研究（包括浮游动物、植物和哺乳动物）展示如何通过比较现有模型的个体水平预测与个体水平数据，对结构化种群模型进行检验。若干共性主题浮现：（i）常检测到未建模的个体异质性；（ii）未建模的衰老可能影响寿命的高阶矩，即使低阶矩与LRO被较好预测；（iii）将单一参数模型拟合于多个克隆、物种、地点等，可能导致对该模型灵活性不足组别预测欠佳。模型预测失败的方式有助于识别问题所在，帮助判断问题对模型预期用途是否重要，并指导修正努力。结构化种群模型是生态学的“工作母机”：基于随机种群统计学预测的检验可助确保其可靠性。

研究背景与问题提出

结构化种群模型是种群与保护生态学的核心工具（工作母机），广泛用于投影长期种群增长/下降率、灭绝或准灭绝风险，以及这些属性对管理干预或环境变化的敏感性。传统模型验证多聚焦于各 demographic 亚模型（存活、生长、繁殖力）的适切性，例如存活是否仅为大小的函数或也受年龄影响，生长模型能否捕捉初始大小对年生长均值、方差、偏度与峰度的影响等。然而，全模型对种群的预测还取决于亚模型如何连接、以及在多年间如何交互。Kendall等人（2019）与Che-Castaldo等人（2020）指出的常见模型设定错误，多在于生命周期拼接不当，例如遗漏或错误纳入休眠阶段、混淆繁殖前与繁殖后普查。即便成体与新崽存活率准确，若放错位置或重复放置，模型依旧失准。单独的繁殖力与存活回归检验，也无法揭示存活–生长相关性（或其缺失）是否被正确建模。

此外，随着COMPADRE（植物矩阵投影模型MPM数据库）、COMADRE（动物MPM）以及PADRINO（积分投影模型IPM核数据库）的广泛应用，已发表模型被不断复用于新目的。原模型虽经验证，但其构造与验证均服务于原定目的，新用途需新验证。种群水平预测（如研究期内的种群增长率或大小/阶段分布）可与原数据比对，但仅当拥有种群水平数据时可行；若仅标记监测种群的小部分个体，基于个体水平预测的检验可能是排查模型重大错误的唯一途径。本研究主张，预测个体间变异——从LRO与寿命的方差、偏度起步——是对许多模型用途特别有用的“压力测试”。至少，LRO与寿命的高阶矩依赖多种 demographic 过程的联合效应，且个体间变异通常不参与模型拟合；更重要的是，许多种群模型要回答的问题（小种群灭绝风险、集合种群生存力、空间扩散速率、流行病基本再生数R₀等）都会受个体间LRO与寿命变异影响，其中未建模的个体异质性可能是关键。

论文来源

本文发表于《Methods in Ecology and Evolution》，通过多组案例研究，展示如何用随机种群统计学的个体水平预测检验、诊断并改进结构化种群模型。

关键技术与方法概要

研究人员采用“个体水平预测 vs. 个体水平数据”的对照框架，结合分析法与个体本位模拟（Individual-Based Models, IBMs）。主要技术路线包括：

1.
数据预处理：剔除研究开始前已出生、研究结束时仍存活、未从首个生命阶段被观测到的个体，以及ID重复的个体；
2.
理论预测计算：对恒定或时间不变环境模型，使用马尔可夫奖赏链（Markov Chains with Rewards）解析求解LRO与寿命的一至三阶矩；对含年份特异环境参数的模型，通过IBM模拟（按年际转移矩阵、状态依产卵量分布、每年观测新生数来模拟个体生命历程，剔除模拟期末仍存活者），多重复合（通常100次）获得预测矩及其模拟标准差；
3.
参数不确定性传播：当模型参数为后验分布（如贝叶斯GLMMs）时，每次重复从后验抽样生成参数向量再模拟；
4.
诊断流程（Box 1）：先判断预测是否真的差（自助法标准误、参数不确定性、跨处理/地点离群点），再分析偏差模式（高阶矩更差？寿命矩驱动LRO矩？），接着检查潜在问题（未建模异质性、未建模衰老、窝卵数分布设定），最后视需深入（模型形式不够灵活？补充其他可预测的生活史属性：首年死亡概率、终生不繁殖概率、年龄/大小依平均大小或窝卵数、死亡时年龄/大小分布等））；
5.
软件实现：R语言，包括mgcv包（GAM零膨胀泊松回归）、自编simulators.R（IBM模拟函数），复现原模型发布代码以保证忠实性。

样本队列来源涵盖实验室与野外：轮虫Brachionus manjavacas实验室微孔板每日追踪；大型溞Daphnia magna 4克隆×6温度实验室独立饲养每日记录；7种禾草田间小区有/无内生真菌多年度监测；圣基尔达群岛Hirta岛Village Bay 1985–2009年雌Soay绵羊Ovis aries长期生命史；美国科罗拉多州Gothic附近40余年黄腹土拨鼠Marmota flaviventer 若干殖民地1976–2016年生命史。

研究结果解读

3 ROTIFERS, Brachionus manjavacas（轮虫）

•
数据：实验室控制，雌新崽按母龄3、5、7、9天分组，单只饲养，日记录存活与活幼数，意外死亡右删失。
•
模型：Hernández等(2020a)按母龄分建矩阵模型，个体按年龄与母龄交叉分类，母龄为出生固定特征；存活用Weibull模型、繁殖用Coale–Trussell模型拟合，外推至1–16日母龄。
•
结果：矩阵模型对LRO均值、寿命的均值/标准差/偏度预测较好（图1a,d–f），但LRO的标准差与偏度预测明显偏低（图1b,c）。替换为原始年龄特异平均窝卵数（保留泊松假设）或进一步用观测的一–三阶矩代替泊松推导矩，改善有限。核心问题是模型低估了母龄组内LRO变异。进一步用零膨胀泊松GAM加个体随机截距拟合每日窝卵数，发现个体随机效应高度显著，个体间持久生育力异质性大（图3），且母龄7、9的随机效应标准差约为3、5组的2倍，与观测–预测LRO标准差差异模式吻合。原模型将LRO方差分解为母龄差异（~26%）与“个体随机性”（相同个体走相同概率的随机结局），但此处个体随机性不足以解释母龄组内观测方差，实为未建模的与年龄/母龄无关的生育力异质性。检验暴露了原模型对平均demographic率的聚焦所掩盖的异质性，若目标是灭绝风险等受个体间变异影响的量，则需扩展模型（如加入个体随机效应形成三维或四维分类）。

4 WATER FLEAS, Daphnia magna（大型溞）

•
数据：4克隆×6恒定温度（5–30℃），每处理10只，单只100 mL瓶，每日记录存活、蜕皮、成熟与繁殖。
•
模型：Vindenes等(2025a)分处理建矩阵，按相位（幼体/成体）、期内阶段（蜕皮次数）、阶段内年龄分类；存活与蜕皮概率用跨处理统计模型估计（考虑克隆、温度、相位、阶段、距上次蜕皮时间，相关个体随机效应），矩阵参数化置个体随机效应为0。
•
结果：因每处理样本小，聚焦跨处理趋势。模型极好预测LRO均值趋势，LRO标准差稍差、偏度差；寿命跨处理趋势同理，寿命偏度预测甚至不如用观测全局均值作为常数（图4）。LRO与寿命偏度在理论与实证上近似1:1（图5a,b），故寿命偏度问题是根。模拟实验抽样分布发现，23/24处理预测偏差超出抽样变异性；唯独克隆4（SE-BY）在5℃是离群点（图4f），其拟合死亡率无衰老（负衰老），预测寿命分布带极长薄尾（>300天），略微拉高预测标准差，大幅夸大偏度（图4d–f）；剔除后跨处理趋势预测可接受（图5c,d）。其余克隆–温度组合通过检验。表明：未建模衰老可能不影响低阶矩与LRO，但会扭曲寿命高阶矩；单一参数形式跨克隆/温度拟合，可能在少数组合下产生不现实分布尾。

5 GRASS POPULATIONS AND THE EFFECT OF ENDOPHYTES（禾草与内生真菌）

•
数据：美国印第安纳Lilly-Dickey Woods实验小区，2007年植7种禾草（Agrostis perennans等），半区含内生真菌、半区热处理消除真菌；保留田间招募个体，剔除2007年 ambiguous招募、起始大小为NA、招募当年死却具非零终生繁殖者。
•
模型：Fowler等(2024)分年(2009–2020)、分真菌状态建大小–阶段（新招募vs老株）矩阵；vital rates为贝叶斯GLMMs，依赖个体大小（连续）、真菌有无、随机小区效应（跨种共享）、种/真菌特异年随机效应；大小1=非生殖幼苗，更大由分蘖数定义，以种97.5%分位数封顶；年产=花序数；用后验500抽平均转移率，小区效应置0。
•
结果：有/无内生真菌下，多数种矩预测尚可，但少数离群驱动低R2（图6,7）。AGPE（A. perennans）有真菌时模型过预测平均LRO、无真菌时欠预测；原研究指出真菌降低AGPE开花与招募，但模型预测真菌提升平均LRO（与观测相反），可能因数据暗示真菌对移栽与田间植株效应不同，而模型合并二者。LOAR（L. arundinaceum）无真菌时模型大幅过预测平均寿命与LRO：无真菌41个体近半2009招募、过半首年死，拟合被移栽株主导（观测矩不含移栽），若条件于存活满首年，寿命预测改善，但LRO仍偏低，问题或在无真菌时生长速度被高估。有真菌时LOAR平均LRO欠预测，尽管平均寿命、大小依繁殖力与年龄依大小预测尚可。跨种普遍现象：有/无真菌下LRO与寿命标准差几乎全被低估，再次指向未建模异质性——已知小区效应存在但模型平均掉小区效应。显示多地点/处理共用模型可能平滑掉局部效应对高阶矩的贡献。

6 SOAY SHEEP（Soay绵羊）

•
数据：1985–2009年Village Bay雌羊，仅雌性子代计入LRO，仅已知死亡年份个体计寿命，筛选后LRO n=2128，寿命n=2200。
•
模型：Childs等(2011)积分投影模型IPM，按总体重与阶段（羔羊/母羊）分类，核从夏到次年夏，整合冬季存活、繁殖（含子代出生重积分）、单/双羔夏存活；无时变参数。
•
结果：模型极好预测LRO均值与标准差，略过预测LRO偏度；但全面过预测寿命各矩（图8a,b），预测平均寿命3.71年 vs 观测2.8年。过预测源于计算死亡年龄分布的长薄尾：5%概率>16岁（最老观测16岁），截断至16岁再归一化后预测均值2.74年≈观测。LRO偏度略高因模型假设2岁后年产大致年龄无关，而实际老羊繁殖力骤降（图8e）；极少个体够老使繁殖力下降，且3–6岁年产略低估，故均值与标准差不受未建模繁殖衰老影响，但分布尾轻微拉伸足以影响偏度（高阶矩对尾敏感）。尺寸与阶段在死亡时预测：过多羔羊期死亡、过少母羊期死亡，死亡羔羊预测尺寸略小（图8d），可能来自拟合逻辑回归对极小尺寸存活不够灵活（附图S-8）。显示：时间不变IPM可抓LRO同时轻微误判寿命尾；未建模衰老影响高阶矩甚于低阶矩。

7 YELLOW-BELLIED MARMOTS（黄腹土拨鼠）

•
数据：1976–2016年选定殖民地（bench, boulder, cliff, gothic, marmot meadow, picnic, river, stonefield），剔除研究期外起止者，最终1181完整生命史个体，1902出生幼崽为模拟基底。
•
模型：Paniw等(2020)IPM，按体重与阶段（幼体、一龄、非生殖成体、生殖成体）分类；为模拟不完美相关的年际存活/生长/招募变异，含影响所有rate的冬季严酷度潜变量及存活/生长/招募各自年效应，分冬夏存活生长函数。
•
结果：模型大体好预测LRO与寿命矩，但明显低估LRO标准差（图9）；略过预测寿命偏度，略过估首年死亡（观测0.50 vs 模拟均值0.65±0.02）。寿命偏度过预测可用未建模衰老解释：模拟最大寿命均值18.9±3.6天（观测15），截断至15年后偏度预测吻合（附S-10），高阶矩对尾误敏感。LRO标准差低估是否来自生殖成体窝卵数零膨胀？观测终生不繁殖比例86.1% vs 模拟82.8%±0.2%，接近，故不是主因。均值亦略低估：模拟LRO均值=73%观测，SD=66%观测；第一年生存过预测（0.35 vs 0.5）可解释均值差（0.35/0.5=0.7），但人工调第一年生存匹配均值后，LRO SD仍为观测77%。殖民地间均值LRO有差异（图9底），但殖民地间方差远小于预测–观测LRO方差差，说明还有未建模个体/空间/社会互作异质性。原模型为不过估环境变异，省略若干具后验支持的年效应，也可能压缩了LRO变异。显示：多殖民地IPM复用需注意未建模的细尺度异质性对高阶矩的压缩。

讨论与结论总结

本文通过对已发表结构化种群模型做“压力测试”——将模型视为生成个体随机路径的配方，预测个体间LRO与寿命变异（均值、方差、偏度等），再比对待测系统的个体水平数据——揭示原模型未覆盖的潜在缺陷。检验尤适合模型被二次复用（COMPADRE/COMADRE/PADRINO）时，因为原验证服务于原目的。

跨案例共性：

1.
未建模个体异质性常暴露为高阶矩误差：轮虫生育力持久个体差异、土拨鼠未建模殖民地/社会微环境、禾草小区效应平滑，均压低LRO/寿命标准差预测，提示此前对“个体随机性”贡献的估计偏差。
2.
未建模衰老可能不影响LRO低阶矩，但拉长寿命分布尾，扭曲寿命偏度/方差（Soay羊、Daphnia一克隆–温度组合）；高阶矩对尾误更敏感。
3.
跨组（种/克隆/地点）共用单参数形式有代价：借力提高估计效率、便对比，但简化交互可能掩盖特定组特征（Daphnia SE-BY 5℃负衰老、禾草AGPE真菌效应符号反了可能因移栽–田间合并）。
4.
问题是否需修视模型目标而定：轮虫原目标为母龄平均效应，未建模组内异质性未必伤结论；但若用于灭绝风险、疾病R₀、集合种群存活力等受个体间变异影响的量，则需考量。当无法立刻建更好模型，可检验结论对压力测试暴露偏差的稳健性（剔除离群组、用接近观测值替换最差预测等）。

方法上，这类检验要求回溯原始个体数据，呼吁开放数据与元数据；即便短研究无完整一生观测，也可用模型模拟研究年内个体生命史（按年观测招募数），对比个体水平合成度量（LRO矩、终生不繁殖比例、各年繁殖个体比例等）以诊断模型。

综上，研究人员提出并演示了基于随机种群统计学的个体水平预测检验框架，作为结构化种群模型的补充验证与诊断工具，通过多个生物学系统证明其对未建模异质性、衰老遗漏、跨组过度简化的检出力，并强调结合预测偏差模式与额外生活史度量可定位模型短板，以服务于模型改进或目标依存的鲁棒性判断。

联系信箱：

粤ICP备09063491号

热点排行