《Frontiers in Environmental Science》:Unraveling the nonlinear drivers of urban land surface temperature in high-density cities: an explainable machine learning analysis of Wuhan, China
编辑推荐:
摘要
引言:在全球气候变化与快速城镇化背景下,地表城市热岛(SUHI)效应的持续加剧已成为威胁公众健康与城市可持续发展的关键问题。然而,社会经济活动、蓝绿基础设施与三维城市形态之间的非线性耦合机制尚未得到充分量化,制约了精细化规划干预的科学制定。方法:因此
摘要
引言:在全球气候变化与快速城镇化背景下,地表城市热岛(SUHI)效应的持续加剧已成为威胁公众健康与城市可持续发展的关键问题。然而,社会经济活动、蓝绿基础设施与三维城市形态之间的非线性耦合机制尚未得到充分量化,制约了精细化规划干预的科学制定。方法:因此,本研究以中国典型高密度“火炉城市”武汉为案例,整合多源数据,开发并比较六种回归算法,并将最优模型与基于博弈论的SHAP可解释性框架耦合,系统识别驱动因素的全局重要性、非线性阈值响应及双变量交互机制。结果:结果表明:(1)LightGBM模型优于所有对比模型(R2 = 0.631,RMSE = 2.781),证实了可解释集成学习方法在高密度城市热环境建模中的优越性;(2)社会经济强度是主导驱动力,GDP与人口密度对地表温度(LST)的贡献最大(>18%),并表现出显著的非线性增长与热饱和效应;(3)蓝绿基础设施呈现出关键的降温阈值特征,水体指数(NDWI)与植被覆盖率(VR)需达到特定阈值才能触发显著的冷岛效应;(4)交互分析揭示了“高热源”与“低冷汇”之间的严重空间错配,经济集聚密集区域往往伴随蓝绿空间的匮乏。讨论:基于上述发现,本研究构建了面向“源–汇”平衡的城市热环境空间优化框架,倡导高密度建成区的存量更新、基于阈值锚定的蓝绿网络连通性保护以及基于地形特征的通风廊道系统建设。方法上,本研究拓展了可解释机器学习在城市气候研究中的应用边界;实践上,将复杂非线性模式转化为可实施、空间差异化的规划策略,从而为缓解高密度城市的SUHI效应提供科学依据。
以下是根据论文主体内容撰写的解读文章:
---
**高密度城市地表温度非线性驱动机制与规划应对——基于可解释机器学习解析**
**研究背景与问题**
在全球气候变化与快速城镇化的双重作用下,城市热岛(UHI)效应持续加剧,已成为威胁城市可持续发展与公众健康的重大环境问题。城镇化进程中,自然植被和水体等生态空间被道路、建筑物等不透水面大量替代,增强了地表蓄热能力并削弱了蒸散冷却效应,导致城市地表温度(LST)升高。相比近地表气温,LST能更连续地刻画城市地表热环境的空间异质性,因此被广泛用于地表城市热岛(SUHI)的区域尺度研究。现有研究表明,城市热过程受建成环境密度与几何形态、人口密度与人为热排放、植被与水体覆盖以及地表材料与反照率等多因素共同驱动。然而,现有研究存在两大不足:一是社会经济活动与物理空间形态之间的交互耦合机制尚未被充分揭示,多数研究孤立地考察土地覆盖或社会经济因素对LST的影响,缺乏统一框架来量化这些异质驱动因素之间的非线性交互;二是关键作用阈值的精确识别不足,传统线性回归模型难以捕捉复杂的非线性阈值特征,限制了精细化调控策略的制定。因此,有必要在高密度城市中系统量化多维度驱动因素对LST的非线性贡献、阈值效应及空间交互机制,为科学制定缓减SUHI的规划策略提供依据。该论文发表在《Frontiers in Environmental Science》。
**主要技术方法**
研究人员选取中国典型高密度“火炉城市”武汉的中心城区为研究区,整合多源遥感与社会经济数据,构建包含社会经济(GDP、人口密度(PD))、自然生态(归一化水体指数(NDWI)、植被覆盖率(VR)、数字高程模型(DEM))、城市形态(建筑高度(BH)、建筑密度(BD)、道路密度(RD))三个维度共10个潜在驱动因子的数据集,统一投影至WGS 1984 / UTM Zone 50N并重采样至500 m × 500 m网格。在剔除高度冗余变量(CH、NDVI)后,采用反距离权重(IDW)插值填补缺失值,并以7:3比例划分训练集与测试集,构建六种回归模型:多元线性回归(MLR)、支持向量回归(SVR)、AdaBoost、XGBoost、CatBoost和LightGBM,通过五折交叉验证以R2、RMSE、MAE评估性能。选择最优模型LightGBM,耦合基于博弈论的SHAP可解释框架,进行全局重要性排序、特征效应方向识别、局部贡献解释,并结合偏依赖图(PDP)与SHAP交互分析,识别关键驱动因素的非线性响应阈值及其空间协同机制。
**研究结果**
**3.1 变量相关性诊断与模型性能评估**
通过Pearson相关性分析,发现植被覆盖率(VR)与冠层高度(CH)高度相关(r=0.87),归一化植被指数(NDVI)与归一化水体指数(NDWI)强负相关(r= -0.78),因此剔除CH与NDVI,保留剩余8个变量。在模型性能比较中,LightGBM在测试集上表现最优(R2=0.631,RMSE=2.781),优于CatBoost(R2=0.622)、XGBoost(R2=0.617)、AdaBoost(R2=0.594)、SVR(R2=0.46)和MLR(R2=0.222),证实了集成学习方法在高密度城市热环境建模中的优越性,且LightGBM在极端热条件下预测更稳定。
**3.2 SHAP模型解释与特征重要性分析**
SHAP全局重要性排序显示,GDP(平均贡献18.7%)和PD(18.3%)是LST最重要的驱动因素,表明社会经济活动强度与人口集聚程度是城市热环境的核心驱动力。NDWI位列第三(15.9%),凸显水体在缓解地表热条件中的关键作用;DEM与BH重要性相当(各12.4%)。SHAP蜂群图揭示:GDP、PD、BD、BH、RD的高值主要导致LST升高(SHAP>0),而NDWI和VR的高值则显著降低LST(SHAP<0),其中NDWI的降温幅度最大(SHAP约-10至-15),证实水体是最有效的生态冷源。DEM呈正向关联,低海拔对应江河湖泊的低温区,较高海拔多为建设用地或丘陵的高温区。
**3.3 偏依赖非线性响应与阈值效应**
偏依赖图(PDP)显示:社会经济因素(GDP、PD)对LST的影响呈非线性增长并伴有饱和效应。GDP低于0.5(标准化值)时,LST随经济活力增加急剧上升;超过0.5后斜率逐渐平缓,表明核心区边际增温效应减弱。PD呈阶梯式上升,在标准化值接近1.0时进入高水平平台。自然生态因素呈现显著的“阈值特征”:NDWI超过约1.0(标准化)时,LST急剧下降,证实水面需达到一定规模才能产生强冷岛效应;VR在低于0.5时LST维持高位,超过0.5和1.0阈值时曲线显著下降,表明绿化斑块需达到足够的冠层郁闭度与空间规模才能实现实质性降温。BH在中低层向高层过渡阶段(-0.5至0.5)显著增温,最高值处出现局部波动,与超高层集群阴影部分抵消热积累有关。DEM呈“M型”波动,低值处为水体低温区,中高值对应密集建设台地高温区,极高值对应外围山地森林次低温区。
**讨论与结论**
**4.1 主要影响因素的交互效应**
双变量SHAP交互分析揭示:社会经济因素与蓝绿因素之间存在显著的“空间排斥”效应,GDP×NDWI和PD×NDWI交互图中,高经济活力与高人口密度几乎严格局限于NDWI极低的区域,呈现“L型”分布,即高热源与低冷汇空间重叠导致核心区双重热积累。GDP与PD之间存在正协同,高值样本形成“核心-边缘”结构,人为热排放与地表辐射加热叠加,单一措施难以快速缓解。GDP×DEM和NDWI×DEM交互表明,武汉城市发展与水文格局受地形严格控制,高GDP、高PD集中在低DEM的平原台地,水体严格对应最低DEM区间,形成“冷-热-冷”的地形驱动空间结构,通风廊道规划应顺应地貌特征。
**4.2 规划启示与管理**
基于研究发现,研究人员构建了面向“源-汇”平衡的城市热环境空间优化框架:(1)在高密度建成区,调控人为热排放、推进存量优化策略,包括推广绿色建筑与节能技术、优化垂直空间形态以避免“屏风效应”阻隔通风廊道,并在超高层建筑中融入空中花园或垂直绿化。(2)优先保护蓝绿网络,利用阈值效应提升降温效率,建立“蓝优先、绿交织”的连通性海绵城市水系,严格保护大型湖泊生态岸线并通过渠道与湿地公园连接分散水体形成网络化冷岛效应;提升绿地冠层郁闭度,确保超过有效降温阈值。(3)打破源-汇空间隔离,实施差异化分区管控:核心区采用微更新措施嵌入小水面、绿色屋顶与垂直绿墙;扩张区划定生态红线、预留足够宽度通风廊道并规定新建高密度组团与自然水体的缓冲距离;外围生态敏感区优先保护山水自然地貌,作为区域尺度“气候泵”引入郊外冷湿空气。
**结论**
本研究以武汉为典型案例,基于LightGBM算法耦合SHAP博弈论可解释框架,开发了高密度城市LST驱动因子分析模型。主要结论:(1)LightGBM相比传统线性模型(MLR)及其他机器学习算法,在大规模异质性城市数据集上表现优越(R2=0.631,RMSE=2.781),为精细模拟城市热环境提供了可靠技术路径。(2)全局SHAP解释表明,武汉LST空间异质性主要由社会经济强度驱动,GDP和PD贡献最大;NDWI的降温贡献显著高于植被与建筑形态指标,证实“百湖之市”的水系网络是城市热韧性的核心生态本底。(3)驱动因子的影响呈现显著阈值效应:社会经济因素呈对数增长模式,生态因素呈阶梯式降温,仅在覆盖达到特定阈值时才产生显著效益。(4)交互分析揭示武汉高热源与低冷汇之间存在严重空间错配,且DEM对城市形态具有显著锁定效应,使SUHI主要集中在低海拔河湖平原。研究局限性在于主要聚焦夏季白天热环境,未来应拓展至昼夜与季节差异分析,提出全气候适应策略。总之,该研究不仅建立了LightGBM+SHAP方法在城市气候研究中的适用性,还为核心区存量微更新、扩张区基于阈值的蓝绿廊道保护提供了可量化、空间差异化的规划策略,为系统性缓解高密度城市热环境提供了科学依据。