可解释的机器学习揭示了中国中全新世时期人类定居模式中存在的非线性人与环境之间的关系

《Palaeogeography, Palaeoclimatology, Palaeoecology》:Explainable machine learning reveals nonlinear human-environment relationships in mid-holocene settlement patterns across China

【字体: 时间:2026年04月29日 来源:Palaeogeography, Palaeoclimatology, Palaeoecology 2.6

编辑推荐:

  **费高|刘辉|郭秦|辛宇** 西安建筑科技大学建筑学院,中国西安710055 **摘要** 理解史前人类与环境的关系仍然是考古学的核心问题,然而现有的研究受到区域尺度和线性建模假设的限制,这些限制掩盖了宏观尺度的模式。为了解决这些方法论上的局限性,本研究使用了一种

  **费高|刘辉|郭秦|辛宇**
西安建筑科技大学建筑学院,中国西安710055

**摘要**
理解史前人类与环境的关系仍然是考古学的核心问题,然而现有的研究受到区域尺度和线性建模假设的限制,这些限制掩盖了宏观尺度的模式。为了解决这些方法论上的局限性,本研究使用了一种可解释的机器学习框架,分析了中国境内21,526个中全新世(约8000–5000年前)的考古遗址,该框架在预测准确性和机制可解释性之间取得了平衡。我们采用核密度估计(KDE)值作为因变量,将离散的遗址位置转化为连续的聚居强度度量,反映了人类对特定环境条件的偏好程度。这种方法量化了环境梯度如何影响聚居强度,而不仅仅是预测遗址的出现。结果表明,温度季节性(TS)是聚居密度的最强预测因子(平均SHAP=81.11),为气候稳定性假说提供了大陆尺度的证据。土壤类型(ST)和河流网络密度(RND)位居其次,反映了新石器时代经济的农业基础。广义加性模型(GAMs)分析揭示了所有17个环境变量之间的非线性关系,这些关系具有阈值效应,表明古代人群系统地避免了环境不足和过度的情况。部分依赖图(PDPs)分析发现了显著的交互效应,其中土壤类型-温度和河流网络密度-温度的组合表现出明显的协同模式。本研究证明,可解释的机器学习可以在考古建模中调和预测与解释之间的矛盾,为遗产管理和对史前人类适应策略的理论理解提供了实际价值。

**引言**
史前人类聚居与环境条件之间的关系长期以来一直是考古学和环境考古学的核心问题(Binford, 2001; Butzer, 1982; Burroughs, 2005)。了解哪些环境因素支配了古代的聚居模式不仅有助于理解过去的人类适应策略,也为文化遗产管理和保护规划提供了宝贵的视角。中全新世(约8000–5000年前)时期,以全新世气候最适期和新石器时代基础农业社会的出现为特征,是研究这一形成时期人类与环境关系的理想时间窗口(An et al., 2000; Wenxiang and Tungsheng, 2004)。

为了解决这一挑战,考古预测建模(APM)在过去几十年中成为了一种将遗址位置与环境变量联系起来的强大工具(Mehrer and Wescott, 2005; Verhagen and Whitley, 2012)。先前的研究已成功应用各种建模方法来预测区域尺度上的新石器时代聚居分布。例如,Wachtel(Wachtel et al., 2018)比较了逻辑回归和Maxent方法在中国东北部预测考古遗址的效果,证明了环境变量在聚居建模中的实用性。在此基础上,Yan(Yan et al., 2021)为嵩山地区的仰韶时期聚居地开发了预测模型,确定了河流邻近性、坡度和海拔作为关键决定因素。最近,Fan(Fan et al., 2025)使用XGBoost和SHAP分析对浙江省的新石器时代遗址进行了分类,发现海拔、地表起伏和坡度是最重要的预测因子。这些研究显著推进了我们对特定地区史前聚居模式的理解。然而,三个关键限制限制了当前的知识状态,阻碍了我们全面理解大陆尺度上的人类与环境关系。

首先,传统的分析方法主要依赖于逻辑回归和加权叠加方法(Yaworsky et al., 2020; Li et al., 2024a),这些方法假设环境变量与遗址出现之间存在单调关系。然而,生态理论表明,人类对环境梯度的反应本质上是非线性的。Richerson(Richerson et al., 2001)提出,气候稳定性而非气候平均值对农业的出现至关重要,这意味着古代人群更倾向于占据中等环境条件,同时避免极端情况。这种单峰或基于阈值的反应模式无法通过线性工具充分捕捉。尽管最近的研究越来越多地使用能够建模非线性关系的机器学习算法,但这些方法往往像黑箱一样,只能指出关键预测因子,而无法显示反应曲线的确切形式,无论是单调的、单峰的、基于阈值的,还是量化变量之间的交互效应。这种预测能力与机制可解释性之间的差距限制了我们对环境因素如何塑造史前聚居决策的理解。

其次,传统的考古预测模型主要采用二元存在-缺失分类框架,将遗址出现视为二分结果。这种方法自然忽略了关于聚居强度的关键细节,因为拥有数十个遗址的地区与只有一个遗址的地区被视为相同,掩盖了古代人类在不同环境条件下的偏好差异。

第三,现有研究主要在区域尺度上进行,如单个河谷、省份或考古文化,这阻碍了宏观尺度的模式识别和跨区域概括(Li et al., 2024a; Li et al., 2024b; Li et al., 2025; Zhou et al., 2025; Tan et al., 2022; Wu et al., 2023)。中国面积达960万平方公里,环境梯度从热带延伸到亚北极气候,海拔从海平面到4000米以上,为大陆尺度分析提供了无与伦比的自然实验室。然而,尚未有任何研究系统地分析过整个文明区域内的人类与环境关系。

本研究将机器学习(ML)模型与基于Shapley加性解释(SHAP)的特征归因、广义加性模型(GAMs)衍生的响应曲线和部分依赖图(PDPs)分析相结合,以实现三个目标,直接解决上述限制:(1)识别影响大陆尺度聚居分布的主要环境因素,从而克服区域尺度限制;(2)描述人类与环境关系中的非线性响应模式和阈值效应,超越线性假设;(3)揭示塑造古代聚居决策的环境因素之间的交互效应,提供黑箱模型无法提供的机制可解释性。与以往的研究相比,这项工作在考古预测建模和人类与环境互动研究领域做出了三个主要贡献。首先,我们引入KDE值作为连续的因变量来衡量聚居强度,解决了传统二元存在-缺失分类系统中固有的信息损失问题,这些系统将高密度聚居核心与孤立出现区域视为相同。其次,我们开发了一个综合的可解释机器学习框架,结合了基于SHAP的特征归因、GAMs衍生的非线性响应曲线和PDPs交互分析,从而解决了考古建模中预测准确性和机制可解释性之间的长期矛盾。第三,通过分析中国960万平方公里领土内的21,526个中全新世遗址(涵盖热带到亚北极生态区),我们首次提供了关于史前人类与环境关系中的非线性阈值效应和多因素交互模式的大陆范围定量证据。

**研究区域概述**
中国位于东亚,太平洋西岸。地形从西向东呈现出特征性的三级下降:青藏高原(平均海拔>4000米)、内陆高地和盆地(1000–2000米)以及东部平原和丘陵(<500米)(Fu and Pan, 2016)。这种宏观地形模式从根本上影响了河流系统,主要河流包括黄河、长江和辽河,主要向东流入太平洋。

**古代遗址的空间分布特征**
KDE被用来将离散的考古遗址位置转化为连续的密度表面(图2a)。结果显示,中国古代遗址的分布存在显著的空间异质性。高密度遗址主要集中在黄河和辽河的中下游,形成了以陕西省关中平原、辽河和河南省中部为中心的主要聚集带。

**温度季节性作为与聚居位置相关的关键因素**
在我们的建模框架中,温度季节性被确定为中全新世聚居密度的最强预测因子,这是本研究的一个关键发现。这一结果为Richerson(Richerson et al., 2001)提出的气候稳定性假说提供了大陆尺度的实证支持,该假说认为全新世期间气候变异性减少是农业发展的前提。虽然原始假设侧重于时间转变……

**结论**
本研究使用一种可解释的机器学习框架分析了中国境内的21,526个中全新世考古遗址,该框架结合了ML建模、SHAP特征归因、GAMs响应曲线和PDPs分析。主要结论如下:
(1)在当前建模框架中,温度季节性是影响中全新世聚居密度的最强环境预测因子,其次是土壤类型和河流网络密度。

**作者贡献声明**
费高:写作——审稿与编辑、撰写原始草稿、可视化、验证、方法论、正式分析、数据管理。
刘辉:资源获取、项目管理、资金筹措。
郭秦:监督、资金筹措。
辛宇:正式分析、数据管理。

**未引用参考文献**
Cliff and Ord, 1981

**利益冲突声明**
作者声明没有利益冲突。

**致谢**
本研究得到了国家自然科学基金(52578097和5240872)的支持。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号