《Animal Behaviour》:Observation methods in animal behaviour: a simulation study of performance
编辑推荐:
### 中文摘要翻译
大多数行为研究依赖于系统性的行为抽样,因为观察和记录所有发生的行为事件通常不可行。选择观察方法来抽样行为涉及几个关键决策,包括观察哪些个体、观察多长时间以及如何在时间上分配抽样工作量。这些决策影响行为估计在多大程度上反映真实的出现情况,以
### 中文摘要翻译
大多数行为研究依赖于系统性的行为抽样,因为观察和记录所有发生的行为事件通常不可行。选择观察方法来抽样行为涉及几个关键决策,包括观察哪些个体、观察多长时间以及如何在时间上分配抽样工作量。这些决策影响行为估计在多大程度上反映真实的出现情况,以及这些估计在使用不同方法的研究之间是否具有可比性。在此,研究人员采用一种模拟方法,评估不同观察方法在不同情境下真实行为出现情况的准确性和精确性。研究人员模拟了在群体大小和地形可见性不同的动物群体中,持续时长、频率和可见性各异的行为。然后,研究人员测试了两种最常见的观察方法——焦点跟踪(focal follows)和群体扫描(group scans)——在不同研究时长、扫描间隔和焦点时长下对这些行为的捕捉情况。研究人员发现,对于短时且罕见的行为,焦点跟踪能产生更准确和精确的行为估计;而对于长时且常见的行为,群体扫描表现更佳。只要大部分个体可见,群体扫描在大型群体和短期研究中也表现更好。研究人员为研究者提供了一个交互式工具,以探索哪种观察方法最适合其系统和研究问题的特定属性。总体而言,该研究及应用程序为焦点跟踪和群体扫描在不同情境下的性能提供了指导,并强调了对于使用不同方法收集的数据进行比较研究时可能存在的潜在陷阱。
### 论文解读文章
#### 研究背景与问题
行为是动物与其环境之间相互作用的关键界面,塑造其广义适合度并驱动进化变化。然而,直接观察所有发生的行为事件通常不可行,因此研究人员依赖于系统性行为抽样,如焦点跟踪和群体扫描。这些观察方法的选择涉及关键决策:观察哪些个体、如何抽样、时长多久以及如何分配时间。这些选择不仅影响行为估计的统计功效、可靠性、有效性和普适性,还影响跨研究比较和比较分析的可靠性。尽管已有理论工作(如Altmann, 1974)和实证研究(如Amato等, 2013)比较了不同方法的优劣,但尚未有研究系统评估系统特异性、行为特异性和观察设置特异性因素如何影响方法性能。主要原因在于真实世界中行为的真实出现情况通常未知,难以将行为估计与“地面真相”进行基准比较。模拟研究允许设定已知的真实行为参数,从而量化不同方法的表现,为研究人员选择观察方法提供定量指导。
#### 研究内容与结论
研究人员以虚拟动物群体为对象,模拟了不同持续时长、频率和可见性的行为,并改变群体大小、地形可见性、研究时长、焦点时长、扫描间隔等参数,评估焦点跟踪和群体扫描在准确性和精确性上的表现。研究得出以下核心结论:焦点跟踪更适合短时、罕见行为,而群体扫描更适合长时、常见行为;群体扫描在大型群体和短期研究中表现更佳,前提是大部分个体可见。此外,两种方法产生的行为估计之间相关性中位数仅为0.18,表明它们的结果通常不可直接比较。研究还提供了一个交互式Shiny应用程序(SIMBO),帮助研究人员根据系统特性选择最佳观察方法。该论文发表在《Animal Behaviour》上,为行为和比较研究中的方法选择提供了定量指导,并强调了不同观察方法带来的偏差对多层网络分析和比较研究的潜在影响。
#### 主要关键技术方法
研究人员采用模拟研究方法,通过生成虚拟动物群体和预设行为参数(如行为频率、持续时长、可见性)构建“地面真相”,然后模拟焦点跟踪和群体扫描的记录过程。在不同参数组合下(如群体大小10-100、地形可见性0.1-1、研究时长30-180天等),共运行约14.1万次随机模拟(另有约3.1万次用于Shiny app)。基于每次模拟,计算标准化均方根误差(RMSE)衡量准确性、变异系数(CV)衡量精确性,并计算偏差和Spearman秩相关性。利用CART决策树分析参数对方法选择的影响,并通过多维模型评估各参数效应。样本队列来源为虚拟群体,无需试剂或培养步骤。
#### 研究结果
##### 焦点跟踪和群体扫描的性能表现如何?
通过所有参数下的总体估计,焦点跟踪的准确性(标准化RMSE中位数=54.67)略优于群体扫描(63.89),但两种方法精度相似(CV中位数分别为35.40和34.17)。焦点跟踪倾向于低估真实值,而群体扫描有时会高估,特别是短时行为。相关性方面,两种方法与真实值的相关系数中位数分别为0.41和0.39。
##### 焦点跟踪和群体扫描能产生可比的结果吗?
对于相同真实行为,两种方法估计值之间的Spearman相关系数中位数仅为0.18,表明在大多数情况下,两种方法的结果不能直接比较。
##### 系统、行为和观察参数如何影响方法性能?
- **群体大小**:焦点跟踪准确性和精确性随群体增大而下降,而群体扫描不受直接影响。
- **地形可见性**:群体扫描的准确性随可见性比例上升而提高,但对焦点跟踪影响很小。
- **行为频率**:两种方法均受益于高频率(更准确、更精确)。
- **行为持续时长**:群体扫描对短时行为更易遗漏,持续时间影响比焦点跟踪更大。
- **行为可见性**:高可见性提升两种方法的性能,对焦点跟踪尤为明显。
- **研究时长**:更长研究时长稍微改善两种方法的准确性。
- **扫描间隔**:更短扫描间隔(更频繁扫描)提高了群体扫描的准确性和精度。
- **焦点时长和焦点间隔**:对焦点跟踪性能影响可忽略。
##### 哪些参数驱动群体扫描和焦点跟踪之间的差异?
决策树分析显示,行为持续时长是最关键的分裂点:当持续时长<33秒(实际分裂点介于30-35秒之间)时,焦点跟踪在67%的案例中表现更优;当持续时长≥33秒时,群体扫描在60%的案例中更优。对于短行为,高可见性(>0.55)进一步强化焦点跟踪优势(87%案例更优);对于长行为,高行为可见性和高地形可见性(均>0.35)时群体扫描优势最大(74%案例更优)。
#### 讨论总结与结论翻译
**讨论总结**:该模拟研究首次系统评估了焦点跟踪和群体扫描在不同参数下的准确性、精确性及相关性。两种方法均存在固有偏差:焦点跟踪低估真实值,群体扫描高估。这些偏差导致方法间估计值相关性低。群体大小、地形可见性、行为持续时长和频率等因素对不同方法的影响差异显著,研究人员需根据系统特性谨慎选择。对于长时、常见行为(如梳理、旅行),群体扫描在大型群体和良好可见性下更有效;对于短时、罕见行为(如攻击、威胁姿态),焦点跟踪更优。混合方法(如结合焦点跟踪和定期群体扫描)可能最优。研究还强调,在多层面网络分析和比较研究中,需谨慎处理方法差异带来的偏差,建议使用生成式网络模型(如BISoNs)整合测量误差,或通过标准化估计、引入观察努力作为统计偏移等方式减轻偏差。
**研究结论(原文翻译)**:认识到焦点跟踪和群体扫描的优势与局限性,不仅对于指导特定研究的观察方法选择至关重要,而且对于更广泛地解释行为估计也至关重要。行为估计始终只代表真实行为出现的一个子集,不同的方法可能引入不同的抽样偏差,导致同一行为的估计可能不同。仔细考虑行为观察在多大程度上反映了所关注行为的真实出现情况,可以指导合理的方法选择,为考虑抽样偏差的建模方法提供信息,并实现方法间和研究间的更准确比较,最终提升对动物行为的理解。