将基于大语言模型(LLM)的视觉感知预期解释技术整合到城市绿地更新的路径优化过程中

《BUILDING AND ENVIRONMENT》:Integrating LLM-Based Interpretation of Visual Perceptual Expectations into Path Optimization for Urban Green Space Renewal

【字体: 时间:2026年03月25日 来源:BUILDING AND ENVIRONMENT 7.6

编辑推荐:

  老龄化城市绿地空间可通过路径设计优化视觉感知体验而不破坏原有结构。本研究提出LLM增强的用户感知路径生成框架,将自然语言描述转化为量化视觉指标,结合点云建模实现多目标优化路径设计,验证了感知驱动设计在遗产绿地更新中的可行性。

  
张晓涵|程子谦|范博清|张敦松
德国慕尼黑工业大学工程与设计学院,慕尼黑

摘要

老化的城市绿地(UGSs)通常面临空间质量下降和公共使用减少的问题,而其生态和文化价值使得大规模重建变得不切实际。路径设计通过重新安排游客的空间体验,提供了一种在最小物理干预下更新这些空间的潜在策略。然而,现有的路径生成方法很少将游客的视觉感知期望纳入老化UGSs的更新过程中。本研究提出了一种基于大型语言模型(LLM)的用户导向路径生成框架,该框架能够将用户对视觉感知期望的自然语言描述转化为量化的感知趋势,这些趋势成为多目标路径优化过程中的目标。该框架结合了基于点云的视觉特征建模和基于LLM的用户期望解读。通过在一个现有UGS中的概念验证案例研究,展示了将定性感知期望转化为可计算设计参数的方法可行性,并在保持场地物理结构的同时生成基于感知的路径配置。本研究提供了一种结构化的方法路径,通过连接视觉感知分析、计算建模和用户导向的设计过程,支持基于证据和感知导向的UGS更新。

引言

城市绿地(UGSs)对城市居民的日常休闲、体育活动和社交互动至关重要[9,10]。高质量的UGSs提供了多种生态系统服务,并有助于市民的健康和福祉[11,12,19,23,56]。然而,许多老化或长期存在的UGSs面临着空间质量下降和基础设施退化的挑战,这导致了公共使用的逐渐减少[63]。
随着时间的推移,密集的植被生长、设施的老化以及用户偏好的变化,导致原有的空间布局或质量与当前的使用模式不匹配[3,7]。然而,全面的重新开发往往受到生态、历史和政治因素的限制[2,18,50]。这就需要采用最小干预或适应性设计策略[54],以可持续的方式提升老化UGSs的空间质量,同时尽量减少对其物理和生态环境的改动。
视觉特征是评估UGSs空间质量的关键因素之一[45,53]。许多研究已经建立了UGSs的视觉特征与人们偏好、感知以及使用动机之间的联系[35,59,64,74]。例如,大约60-80%的绿色视野被认为是人类视觉舒适度的理想范围[73],而空间开放性已被证明能积极影响人们对景观的偏好[67]。然而,传统的UGSs更新方法主要关注物理改造,如修剪、移除树木或重新配置种植布局,这可能导致大量资源浪费(例如产生绿色废弃物和碳排放),甚至可能破坏场地的生态、历史或文化价值[29,32,47]。
人们在UGSs中的体验本质上是动态的,他们对UGSs的整体印象往往源于在多个空间环境中持续积累的感知体验[27,31]。路径不仅支持移动,还引导用户在穿过UGSs时的所见所感[41,44]。通过精心设计,路径可以重新安排空间感知,例如从封闭的绿地过渡到开阔的草坪,或逐渐展示建筑地标景观[6,58]。因此,设计创造连续且动态视觉体验的路径,而不是改变物理结构,可能是对老化UGSs进行最小干预更新的一种微妙而有力的方法。
先前的研究表明,路径是促进公园使用的有效干预措施,但很少有研究探讨如何将路径设计与用户在UGSs中的感知体验相结合[43]。最近,一些研究采用了生成算法,如基于代理的建模或骨架算法,来生成或优化路径[28,36]。然而,这些方法通常根据几何或可访问性规则定义路径,而没有考虑人们如何沿着这些路径感知和体验空间。尽管一些研究使用了街景图像或众包的环境感知数据来探索最优路径生成,但大多数研究集中在大规模的城市步行网络上,而不是UGSs内的细粒度路径体验[17,46,68]。因此,如何系统地将用户视觉感知期望纳入老化UGSs的更新中,仍然是一个未充分探索的问题。
准确量化UGSs的空间视觉特征对于生成和设计符合用户视觉感知期望的路径至关重要。以往使用2D图像的方法主要分析了固定视角下的可见元素[24,73]。然而,这些方法在捕捉环境的三维深度和空间复杂性方面存在局限性。在植被不规则且密集的老化UGSs中,2D照片分析无法充分代表从单一视角看到的整体空间体验。对于那些在UGSs中行走时视觉感知会动态变化的用户来说,需要更详细、连续的视觉特征量化。基于3D模型的可见性分析能够在虚拟环境中更真实地模拟人类视觉感知[45,66]。尽管这种方法已被用于探索行人沿预定义路径的动态视觉感知[22,41],但其用于生成路径设计的潜力尚未得到充分探索。
另一个挑战在于如何捕捉用户在UGSs内行走路径上的视觉感知期望,并将其转化为可以嵌入路线规划和设计中的数字表示。用户导向的设计,如参与式设计,为将公众意愿和偏好纳入决策提供了重要框架,强调用户与设计师之间的共同创造和相互学习[13]。然而,一个根本性的挑战是,用户通常用自然语言表达他们对动态视觉体验的期望,而不是通过结构化的评估或评分系统[37,38]。相比之下,当前的设计工具或框架依赖于可量化的输入,缺乏能够直接将用户期望转化为空间生成目标或算法参数的机制[1,60]。大型语言模型(LLMs)的最新进展显示了将自然语言或文本描述转化为定量变量的潜力[33,34,61]。尽管如此,将基于LLM的转换机制整合到用户导向的生成设计框架中仍然是一个未充分探索的领域。
本研究旨在为老化UGSs开发一种基于视觉感知的路径生成框架。该框架将用户定义的感知期望转化为定量目标,以指导路径生成,同时保留UGS现有的生态和空间特征。基于这一目标,本研究解决了以下研究问题:
  • (1)
    如何在用户导向的设计过程中有效地从自然语言描述中提取用户定义的视觉感知期望?
  • (2)
    如何通过将用户定义的视觉感知期望与场地的现有空间配置对齐来实现基于视觉感知的路径生成?
  • 为了弥合用户视觉感知期望与计算设计参数之间的差距,本研究提出了一种基于视觉感知的多目标路径优化框架,该框架将自然语言描述转化为量化期望趋势,以指导路径生成,同时保留现有的空间条件。该框架通过在一个老化UGS中的概念验证案例研究进行了演示,展示了在计算优化工作流程中实现感知期望的方法可行性,并支持最小干预更新策略。

    部分片段

    框架概述

    如图1所示,该框架包括三个相互连接的组成部分:(1)基于现有场地条件的空间数据采集和视觉指标建模;(2)收集参与者的自然语言描述,并将这些描述基于LLM转化为量化期望趋势;(3)多目标路径优化和优化路径可视化。第一个组成部分使用点云数据量化场地的视觉特征,而

    研究地点描述

    本案例研究在中国南京的历史城区内的一个老化UGS中进行(图3)。该地点包含一座建于20世纪30年代的遗产建筑和一棵估计有1500多年历史的古树,这两者都具有重要的历史和文化价值。同时,这个绿地也为附近的居民提供了方便且可访问的日常活动场所。
    然而,长期的植被生长导致了大量的树冠遮挡

    将基于LLM的解读融入用户导向的设计

    本研究展示了LLMs通过将参与者口头表达的感知期望转化为可计算的设计目标,从而增强用户导向设计的潜力。在用户导向设计中的一个关键挑战在于将来自多个利益相关者的多样化且有时相互冲突的输入转化为连贯且可操作的设计信息[48]。此外,用户的定性输入往往难以转化为可以直接指导设计的量化输入

    结论

    本研究开发了一种基于视觉感知的路径生成框架,该框架结合了基于LLM的解读、基于点云的视觉指标计算和多目标优化,用于UGS的更新。通过将参与者对视觉感知期望的自然语言描述转化为量化期望趋势,该框架建立了主观感知与空间设计目标之间的计算联系。结果证明了这种方法的可

    科学写作中关于生成式AI的声明

    在准备这项工作时,作者使用了ChatGPT-4来提高文本的语言表达和可读性。此外,在研究过程中还使用了GPT-4o模型对参与者的口头描述进行语义解读,具体细节见方法部分。作者审查并验证了所有AI输出,并对出版物的内容负全责。

    CRediT作者贡献声明

    张晓涵:撰写——审阅与编辑,撰写——初稿,可视化,验证,项目管理,方法论,调查,正式分析,数据管理,概念化。程子谦:撰写——审阅与编辑,撰写——初稿,项目管理,调查,数据管理。范博清:撰写——审阅与编辑,方法论。张敦松:可视化。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号