同一城市,两种热体验:利用大型语言模型(LLM)对中国北京地区的热感知、热环境及健康影响进行比较分析

《Sustainable Cities and Society》:One City, Two Heats: An LLM-enabled comparative analysis of heat perception, thermal environment, and health pathways in Beijing, China

【字体: 时间:2026年03月27日 来源:Sustainable Cities and Society 12

编辑推荐:

  本研究通过整合社交媒体热感知数据(SMHP)与物理热环境数据(PTE),利用大语言模型(LLM)和统计方法揭示北京城市公园热环境与健康关联。结果表明PTE对健康影响更显著,且存在资源分配与热暴露的悖论,同时发现感知热与物理热的空间异质性及滞后效应。

  
Jiaqi Zhang|Weijing Wang|Jin Rui|Ziwen Sun
爱丁堡大学艺术学院建筑与景观建筑系,英国苏格兰爱丁堡市Lauriston Place 74号,EH3 9DF

摘要

城市化加剧了城市热岛效应和健康风险,但大多数研究主要关注物理性的热暴露。新兴研究表明,人们对热的感知可能与热度测量结果存在差异,然而对此的严格比较仍然有限。我们通过使用大型语言模型(LLM)从关于北京城市公园的社交媒体帖子中提取热感知(SMHP),并将其与通过遥感和人口加权模型得出的物理热环境(PTE)相结合来填补这一空白。结合各子区域的身体健康和福祉指标,我们应用偏最小二乘-结构方程建模(PLS-SEM)来识别直接和中介路径,并使用多尺度地理加权回归(MGWR)来绘制空间异质性。结果表明,LLM能够稳健地检测到语义上的热感知,在极端热不适案例中实现了94.5%的真正阳性率。研究结果表明,PTE是预测健康结果的更强指标,受宏观尺度景观和区域背景的影响,而SMHP则与公园内的微观特征相关。生物物理冷却效应对PTE的影响大于SMHP,这表明在表达情感与客观测量之间存在“感知滞后”。建筑和社会经济因素表现出一种“热悖论”,即资源越丰富,暴露程度越高。SMHP与PTE之间的空间不匹配表明,仅依赖温度指标可能会忽略隐藏的脆弱性。我们倡导一种协调的、双维的、多尺度的策略,以支持基于证据的气候适应和健康公平。

引言

近几十年来,城市热浪变得更加强烈、频繁和持久,由于全球变暖,这些趋势正在恶化(Arsad等人,2022年)。气候变化和城市热岛效应(UHI)的共同作用导致城市温度上升,对人类健康构成严重威胁,例如2019年因高温导致的死亡人数超过35万,比1990年增加了近10万(Lancet,2021年)。为应对日益严重的与热相关的健康风险,中国建立了从国家到地方的多层次适应政策体系。在国家层面,如《城市适应气候变化行动计划》(2016年)等政策明确了UHI缓解目标。在地方层面,各城市制定了针对自身情况的UHI缓解计划和热健康应急方案。基于自然的解决方案(NBS)作为增强极端气候事件抵御能力的长期策略受到越来越多的关注(Augusto等人,2020年)。政策制定者正在各个尺度上推进绿化策略:在宏观尺度上通过区域绿色基础设施网络、通风走廊和分区UHI缓解;在微观尺度上通过提供遮荫、口袋公园、透水铺装和绿色立面来提高日常活动空间的热舒适度(Kumar等人,2024年;Ferrari等人,2020年)。补充措施包括为易受热影响的人群建立预警系统以及适应性分配医疗资源(Schuster等人,2025年),以减轻心血管、呼吸系统和热应激相关的健康风险(O’Connor等人,2025年)。
尽管付出了这些努力,准确评估城市热环境及其健康影响仍然具有挑战性。首先,城市热的时空复杂性和数据异质性阻碍了基于证据的决策。不同数据来源(如遥感、固定站点、移动设备)和监测尺度(Gao等人,2024年)之间的差异不仅影响了物理热环境(PTE)的量化,还偏置了社交媒体热感知(SMHP)的评估(Liu和Hang,2025年),削弱了与热相关的健康风险模型的预测有效性以及公共卫生干预措施的目标性。在这里,PTE是基于客观测量(如LST指标)得出的公园级物理热强度的代理指标,而SMHP则是从社交媒体上的热相关表达中推断出的集体热体验的代理指标。其次,由于数据可获取性、城市形态和规划范式的差异,城市热环境在不同地区表现出显著的空间和表征异质性(Chengcong Wang等人,2024年),限制了缓解策略和健康政策的可转移性。第三,许多研究依赖于单一数据来源,未能充分利用整合多种数据来源在政策设计中的互补优势。这一限制限制了对热-健康路径和风险的理解,导致“一刀切”的干预措施在实践中效果不佳。
社交媒体平台使个人能够自发地表达他们的日常热感知。特别是在极端热浪事件期间,用户经常在微博和Twitter等平台上发布关于炎热户外环境的不适感。这些数据范围广泛、更新迅速且高度主观,为大规模测量感知热提供了巨大潜力。越来越多的研究证明了这种方法的可行性。例如,(R. Xu等人,2025年)量化了微博上与热相关的内容比例,揭示了热暴露的空间差异;(Liu和Hang,2025年)利用带地理标签的社交媒体数据揭示了热暴露的不平等;(He等人,2026年)开发了HP-BERT,显著提高了对微博文本中热相关表达的语义理解和预测性能。然而,尽管之前的研究有效利用了SMHP来描述热暴露的空间模式和相关不平等,但这些研究大多仍处于描述性阶段,很少将感知热作为区域健康分析框架中的模型-ready环境维度(Campbell等人,2018年)。因此,主观热应力与区域健康变化之间的实证关系尚未得到充分描述,特别是在感知信号是否以及在空间上如何补充或偏离客观热指标方面(Ellena等人,2020年)。为解决这一差距,我们将SMHP和PTE整合到一个统一的分析框架中,并对其空间特征及其与健康结果的统计关联进行空间单元级别的比较。这种方法有助于阐明感知热与区域健康风险之间的联系(Liu和Hang,2025年)。
本研究通过将高粒度的感知强度纳入空间健康框架,从而明确了感知热与区域健康风险之间的联系(Q. Liu和Hang,2025b)。我们将研究范围限制在城市公园,原因有二。基于上述发现的差距,我们将社交媒体衍生的热体验信号锚定在一个具有更清晰空间背景和更强可识别性的典型环境中——即城市公园。一方面,先前的研究表明,城市公园在缓解热暴露、塑造个人热感知以及与健康结果相关方面发挥着重要作用(X. Zhang等人,2025年)。与一般城市空间相比,公园提供了一个热对比和感知反应更易识别的微观环境,使其成为研究社交媒体热感知与健康之间关联的关键场所(Y. Song等人,2022年)。为了弥合这些差距,我们开发了一个综合框架,该框架(i)融合了异构数据——北京地区年度社会经济调查(BAS)、社交媒体流和遥感产品;(ii)采用互补方法:大型语言模型(LLMs)从文本中提取情感和SMHP,偏最小二乘结构方程建模(PLS-SEM)识别因果路径,以及多尺度地理加权回归(MGWR)揭示空间异质性。基于这一框架,四个相互关联的研究问题指导了本研究。首先,LLM能否可靠地从关于城市公园的社交媒体文本中识别和量化SMHP?其次,环境因素、SMHP、PTE和健康相关结果(包括福祉和身体健康)之间有什么关系?根据这些问题,我们提出了以下假设:H1,环境因素影响SMHP;H2,环境因素影响PTE;H3–H4,SMHP和PTE分别影响福祉;H5–H6,SMHP和PTE分别影响身体健康;H7,环境因素通过SMHP和PTE间接影响健康结果(福祉和身体健康)。第三,PTE和SMHP的空间模式在城市景观中在多大程度上是一致的或存在差异?第四,热-健康联系在空间上如何变化,以及是什么局部机制驱动了这种空间异质性?

章节片段

城市热岛效应与城市公园

持续的全球变暖提高了基线温度,增加了热浪的频率和持续时间,加剧了城市热异常,使城市热环境成为紧迫的全球公共卫生问题(Jang和Jung,2025年)。城市热环境是由人类活动、建筑密度和土地利用变化塑造的热力学状态;其核心表现是城市热岛效应,即城市空气温度超过附近农村地区的温度(Oke,1982年)。

研究框架

本研究的技术流程包括以下关键步骤(图1):首先,我们从2019年8月3日的Landsat-8场景中检索LST,以得出人口加权的PTE,并使用ChatGPT-4o和七点量表从2019年6月至8月的微博“超级话题”签到中提取SMHP,将文本与255个公园对齐。通过空间插值和人口加权聚合,协调BAS中的子区域级福祉和身体健康指标;LLM标记

GPT-4o模型的性能

我们通过从每个模型分配的七个强度级别(-3至+3)中随机抽取200条帖子,构建了一个分层验证集,总共得到1,400条帖子。两位环境科学专家在经过七级尺度的联合培训后独立注释了这些帖子,在培训期间他们使用了包含明确类别定义、边界案例和示例帖子的书面指南,以确保评分标准的一致应用。

LLMs可以识别城市公园中的社交媒体热感知

我们使用ChatGPT-4o自动检测和量化2019年6月至8月关于北京城市公园的微博超级话题帖子中的SMHP。与1,400个专家注释样本的验证结果显示,总体准确率为84.0%,精确率为83.5%,证明了大型语言模型在量化SMHP方面的方法学有效性和实际效用。混淆矩阵分析表明,在感知谱的两个极端都表现出明显的优势。

结论

本研究构建并验证了一个基于大型语言模型的社交媒体分析框架,用于评估北京城市公园环境中热环境与健康之间的关系,为气候适应性规划提供了方法学支持和实证证据。结果表明,PTE具有更高的解释能力,主要受宏观尺度景观和区域背景的影响,而SMHP的解释能力相对较弱,但依赖性更强。

未引用的参考文献

北京市园林绿化局的通知

CRediT作者贡献声明

Jiaqi Zhang:撰写——原始草稿、可视化、验证、软件、资源、方法论、调查、正式分析、数据管理、概念化。Weijing Wang:撰写——审阅与编辑、可视化、验证、软件、资源、项目管理、方法论、数据管理、概念化。Jin Rui:撰写——原始草稿、可视化、验证、软件、资源、方法论、调查、正式分析、数据管理、概念化。Ziwen Sun:

利益冲突声明

作者声明他们没有已知的可能会影响本文所述工作的竞争性财务利益或个人关系。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号