《International Journal of Disaster Risk Reduction》:Socio-technical regional disaster recovery modelling using generative LLM-based agents
编辑推荐:
理解和模拟人与基础设施之间的相互作用对于灾害后的规划和管理至关重要。灾后背景下的人类决策通常使用基于智能体的模型进行模拟,其中家庭行为由决策规则表示。由于数据稀缺以及影响家庭的参数数量增加,此类规则往往难以校准且变得难以处理。本文旨在用大语言模型(Large
理解和模拟人与基础设施之间的相互作用对于灾害后的规划和管理至关重要。灾后背景下的人类决策通常使用基于智能体的模型进行模拟,其中家庭行为由决策规则表示。由于数据稀缺以及影响家庭的参数数量增加,此类规则往往难以校准且变得难以处理。本文旨在用大语言模型(Large Language Models, LLMs)取代规则,将经典智能体转变为灾害恢复模拟中的生成式智能体。LLMs的训练涵盖了广泛的人类行为模式,此外还可以通过特定领域的科学文献和决策规则进行提示,以模拟人们在灾后的行为,从而实现复杂决策的模拟。研究表明,与美国人口普查家庭脉搏调查(US Census Household Pulse Survey)中报告的灾后家庭流离失所情况相比,生成式智能体达到了70%的准确率。随后,生成式智能体被整合到技术系统的区域恢复模拟器中,以开发一种预测模型,用于预测随着建筑环境在恢复过程中不断演变,家庭如何做出决策。一个考虑加利福尼亚州阿拉米达岛(Alameda Island, CA)地震后建筑物和供水系统恢复的案例分析,展示了如何利用生成式智能体预测灾后背景下的人类行为。随着实证数据的获得,研究人员发布了该框架的开源实现,以促进区域社会技术模型的验证,同时也承认当前的工作是初步的。
论文解读:《基于生成式大语言模型智能体的社会技术区域灾害恢复建模》
一、 研究背景与意义
可持续发展取决于抵御极端事件并从冲击中恢复的能力。为了实现这一目标,分析工具必须能够预测不同政策和资源约束下的恢复进程,从而指导最优行动。然而,灾后恢复预测的一个主要复杂性在于理解并模拟社会与技术系统在灾后背景下的相互作用。在过去二十年中,针对建筑环境(即建筑物和基础设施系统)中技术系统的恢复建模取得了显著进展,从简单的单参数模型发展到复杂的序列恢复活动模拟。尽管技术系统建模有所突破,但模拟灾后的人类决策仍然是一个关键挑战。传统的基于智能体模型(Agent-Based Models, ABMs)通常依赖硬编码的规则集来代表家庭行为,这在面对大量影响家庭决策的参数时,往往面临数据稀缺和校准困难的问题。人类行为的空间广阔而复杂,将其全部编码为预设规则集极具挑战性,且随着与社会技术系统交互广度的增加,规则集的复杂性会呈指数级增长。因此,斯坦福大学的研究人员在《International Journal of Disaster Risk Reduction》发表的这篇论文,旨在通过将大语言模型(Large Language Models, LLMs)引入传统的社会系统智能体模型中,替代原有的规则逻辑,从而开发一个能够更灵活、准确地预测灾后家庭行为与基础设施恢复互动的综合模型。
二、 关键技术与方法
为实现上述目标,研究人员采用了几项关键技术方法。首先,研究利用OpenAI的GPT系列模型作为生成式智能体的核心推理引擎,通过自然语言提示(Prompt)引导其进行决策。其次,研究设计了三种不同的提示策略以评估性能:默认GPT行为(无特定领域指令)、文献知情提示(向智能体提供灾后决策的科学文献摘要)以及基于规则的提示(在系统指令中编码明确的决策规则)。第三,研究引入了滚动摘要机制来处理智能体的记忆限制,确保其在长时间跨度的模拟中能依据过往经验进行连贯决策。第四,为了验证模型,研究使用了来自美国人口普查局家庭脉搏调查(Household Pulse Survey, HPS)的9819份家庭微观数据作为实证基准。最后,研究构建了一个社会技术交互机制,将代表家庭的生成式智能体与模拟建筑和相互依赖基础设施(如供水网络)的区域恢复模拟器(pyrecodes软件)进行双向耦合,形成一个动态的时间步进循环,模拟资源供需变化如何影响家庭搬迁决定,反之亦然。案例研究区域选在加利福尼亚州阿拉米达岛,模拟了海沃德断层(Hayward Fault)发生矩震级7.05地震的情景。
三、 研究结果
- 1.
使用生成式智能体模拟灾后家庭决策
通过对HPS数据的验证,研究发现无论采用何种提示策略或模型版本(GPT-4o mini或GPT-5 mini),生成式智能体在预测家庭是否会流离失所超过一周这一二元分类任务上的总体准确率均约为70%。研究指出,主要的误分类来源集中在报告中等建筑损坏的家庭,因为中度损坏处于一个模糊的阈值区间,在HPS数据中未明确界定。相比之下,处于损坏分布极端的家庭(受损极小或严重受损)则能被更准确地分类。这表明生成式智能体在明确的损坏阈值下能可靠地复现家庭决策,但在处理模糊条件时仍面临挑战。
- 2.
社会技术区域恢复模拟
该部分详细阐述了家庭恢复智能体与技术系统模拟器的结合。家庭智能体的社会经济特征(如房屋所有权、收入水平、家庭构成)被视为静态变量,而位置则是动态变化的。研究特别引入了社会资本变量(如社区内的朋友数量),并通过情境叙事(Situation Narrative)将技术系统模拟器提供的建筑损坏信息和基础设施访问权限实时传达给智能体。模拟算法建立了一个双向反馈回路:当家庭的基础设施需求未得到满足时会发生迁移,这改变了技术系统的空间需求分布;反过来,这又影响了这些系统为剩余家庭提供资源的能力。这种社会技术反馈滞后一个时间步长,确保了模拟的逻辑闭环。
- 3.
阿拉米达岛100户家庭的社会技术地震恢复模拟
在具体的案例研究中,模拟显示地震造成的破坏导致所有100栋独户住宅受损,约77%的建筑受到中度损坏。由于住房严重受损,大多数家庭在地震后立即搬迁,最初倾向于投靠朋友而非离开城镇。然而,由于大部分朋友家也受到影响,许多家庭被迫做出第二次搬迁决定。研究对比了四种配置的智能体:标准GPT-4o mini、文献知情GPT-4o mini、规则约束GPT-4o mini和GPT-5 mini。结果显示,文献知情的智能体表现出更强的“地方依恋”(Place Attachment),更倾向于留在社区内;而受规则约束的智能体则严格遵循房屋修复后即返回的指令,其行为轨迹与建筑恢复曲线高度一致。GPT-5 mini智能体则表现出更稳定的行为,较少频繁变更居住地。
- 4.
区域损坏对家庭流离失所的影响
通过改变完全损坏建筑的比例(假设供水网络无损坏),研究发现随着建筑损坏比例的上升,离开城镇的家庭数量急剧增加。这是因为严重的住房损坏减少了可投靠朋友家的可用性,降低了社区存在感(Neighborhood Presence),使得离开城镇成为更可能的选择。研究捕捉到了一种涌现行为(Emergent Behavior):离开社区的人越多,剩余家庭留下的可能性就越低。这表明生成式智能体能够在没有明确指定包含社会存在感的决策规则的情况下,捕捉到这种复杂的社会互动模式。
- 5.
生成式智能体决策的影响因素
通过对智能体推理过程的分析,研究发现满足住所和安全饮用水需求是所有智能体配置的首要任务。其次是地震前居住建筑的损坏程度。不同配置的智能体在引用因素时表现出偏好:例如,GPT-4o mini智能体经常提及社区存在感,将其视为社区稳定性和恢复的指标;而GPT-5 mini智能体在推理中较少提及这一点,但整体行为更稳定。社会经济特征(如收入、移民身份)在智能体的推理中被引用的频率低于情境叙事信息,但在文献知情的智能体中,这些特征的引用率有所提升,表明外部知识能有效引导智能体关注特定的决策维度。
四、 讨论与结论
讨论部分强调,虽然生成式智能体在模拟灾后恢复方面展现出巨大潜力,但目前的工作仍是初步的。未来的验证工作需要真实的纵向数据支持。此外,LLMs的“黑盒”特性意味着其训练数据和架构对输出的影响尚不完全清楚,且专有模型可能存在数据泄露风险,影响验证的客观性。同时,LLM训练数据可能编码的社会偏见也可能系统性地影响智能体的决策,且模型的透明度问题限制了结果的可解释性。因此,在使用此类模型指导政策或资源分配决策时需保持谨慎。
结论部分指出,本研究成功地将生成式智能体与区域恢复模拟器相结合,证明了该方法在模拟动态环境中家庭流离失所决策的有效性。模型不仅达到了与实证数据相当的准确度,还捕捉到了如“社区人口流失加剧个体离开意愿”这样的涌现行为。研究展示了科学文献对智能体决策的影响,并验证了结合LLM推理与基于规则逻辑的混合智能体的可行性。生成式智能体的核心优势在于其开放式的决策范围,超越了预定义规则集的限制。尽管仍需进一步验证和完善,但这项工作为现实主义的灾后恢复模拟提供了一条充满前景的新途径,有助于更好地为灾害韧性规划和可持续城市发展提供信息支持。