实现受限神圣空间的包容性进入:VR360与人工智能驱动的虚拟现实的真实世界对比
作者:Phimphakan Thongthip, Darin Poollapalin, Songpon Khanchai, Pakinee Ariya, Phichete Julrode
《Informatics》:Enabling Inclusive Access to Restricted Sacred Spaces: A Real-World Comparison of VR360 and AI-Driven Virtual Reality
Phimphakan Thongthip,
Darin Poollapalin,
Songpon Khanchai,
Pakinee Ariya and
Phichete Julrode
【字体:
大
中
小
】
时间:2026年04月14日
来源:Informatics 2.8
编辑推荐:
摘要 本研究探讨了虚拟现实系统如何支持对受文化限制的文化遗产场所的包容性访问。研究开发并部署了两种扩展现实(XR)技术:VR360虚拟游览和具备对话交互功能的AI驱动沉浸式虚拟现实原型。通过混合方法(包括标准化问卷调查、用户参与度量表和群体沉浸感问卷、回顾性
摘要 本研究探讨了虚拟现实系统如何支持对受文化限制的文化遗产场所的包容性访问。研究开发并部署了两种扩展现实(XR)技术:VR360虚拟游览和具备对话交互功能的AI驱动沉浸式虚拟现实原型。通过混合方法(包括标准化问卷调查、用户参与度量表和群体沉浸感问卷、回顾性访谈以及展览工作人员观察),对136名参与者进行了实地研究。研究结果揭示了这两种系统之间的明显权衡。VR360系统表现出更高的可用性和操作可靠性,所需的监督和技术资源较少;而AI驱动的沉浸式VR系统则支持身体化的探索和对话式探究,这有助于提升空间沉浸感,并帮助游客在探索过程中解决问题。定性研究结果进一步表明,对话交互增强了用户体验,但也带来了更高的技术复杂性和人员配备要求。总体而言,本研究为设计和部署文化遗产领域的XR系统提供了实证见解,并强调了不同沉浸程度和交互方式如何影响可用性、沉浸感和操作可行性,特别是在支持对受文化限制场所的包容性访问方面。
1. 引言
文化遗产场所的访问对于促进文化理解、历史解读和可持续遗产旅游至关重要。然而,由于保护要求、建筑脆弱性、安全顾虑或长期形成的仪式和文化习俗等因素,实际访问这些场所往往受到限制[1,2]。特别是,神圣建筑空间通常受到传统规范的管理,这些规范限制了特定区域或某些访客群体的进入。这些访问限制并非个别场所的特例,而是全球不同宗教和文化背景下普遍存在的现象[3]。因此,文化遗产场所的文化价值与所有访客直接体验和解读它们的能力之间存在持续差距。
为了解决这一挑战,虚拟现实(VR)技术逐渐被采纳为文化遗产解读的替代访问方式[4]。基于VR的系统使游客能够远程探索遗产空间,减少对脆弱结构的物理影响,并提供了对地理位置遥远或受文化限制场所的访问途径。在现有方法中,VR360系统因其相对较低的开发成本、简单的部署方式以及呈现高保真全景视觉内容的能力而被广泛使用[5]。然而,先前的研究指出,VR360系统通常依赖于预定义的视野点和固定的信息热点,导致用户体验较为被动,互动性有限,对用户主导的探究支持不足[6]。相比之下,基于完全可导航三维重建的沉浸式VR系统允许更深入的空间探索和用户自主性,但需要更复杂的内容制作流程和互动设计[7]。因此,沉浸感和空间体验已成为虚拟遗产研究中的关键评估维度,通常通过标准化的沉浸感测量工具进行评估[8]。
最近的人工智能进展,尤其是大型语言模型(LLM),通过实现在虚拟环境中的对话和自适应交互,进一步扩展了沉浸式VR的功能[9]。AI驱动的对话界面允许用户提出自然语言问题并获得基于上下文的解释,使VR从静态可视化媒介转变为交互式信息系统。尽管对AI增强型虚拟遗产的兴趣日益增加,但在具有仪式访问限制的真实世界遗产环境中,传统VR360系统与AI驱动的沉浸式VR系统之间的实证比较仍然有限[10]。当前文献中存在三个主要局限:首先,许多研究分别研究沉浸式VR和全景VR360系统,而未在同一遗产背景下进行受控比较;其次,大量关于AI增强型虚拟遗产的研究集中在技术原型或实验室演示上,缺乏来自真实世界遗产部署的实证证据,这些环境中的操作限制和访客多样性会影响系统使用;第三,尽管提出将对话AI作为丰富解读和提升访客参与度的手段,但关于对话交互如何影响用户体验的实证证据仍然不足。
为了填补这些空白,本研究采用了一种实地比较方法,研究了两种虚拟遗产访问方式——VR360系统和具有对话交互功能的AI驱动沉浸式VR系统——在受访问限制的神圣遗产场所中的应用。为了加强研究的理论基础,我们采用了以互动为导向的视角,将VR360和AI驱动的沉浸式VR视为通过互动特征差异(包括用户自主性、系统响应性和认知负荷)塑造用户体验的不同互动模式。这一视角立足于受访问限制的神圣空间背景,其中虚拟现实充当了一种中介访问机制。
本研究在三个方面为学术界做出了贡献:理论层面,阐明了互动模式如何影响受文化限制遗产环境中的沉浸感和用户体验;方法层面,展示了真实世界比较评估对XR遗产系统的价值;实践层面,指出了VR360和AI驱动沉浸式VR在设计和操作上的权衡,为寻求平衡包容性、体验深度和部署可行性的遗产机构提供了参考。为了指导比较分析,本研究提出了以下研究问题:
RQ1:在受访问限制的神圣遗产背景下,VR360系统和AI驱动沉浸式VR系统在感知可用性和用户参与度方面有何不同?
RQ2:在受访问限制的神圣遗产背景下,VR360系统和AI驱动沉浸式VR系统在沉浸感和感知空间沉浸感方面有何不同?
RQ3:从基于VR360的遗产访问系统转向AI驱动的沉浸式VR系统时,系统层面会遇到哪些设计和操作上的权衡?
2. 相关工作
2.1. 用于文化遗产访问的虚拟现实
当实际访问受到距离、保护要求或场所脆弱性的限制时,VR已成为扩展文化遗产访问的广泛采用的技术。在文化遗产应用中,VR不仅用于视觉再现,还作为中介访问层,支持在重建的遗产环境中的解读、导航和上下文信息传递。系统评价的最新证据表明,文化遗产领域的VR已经从早期演示发展成为一个结构化的研究领域,其目标(如访问、保护、教育、旅游)和评估实践(包括可用性和用户体验)有更清晰的分类[11,12]。特别是,全面的评估强调VR可以提升感知的可访问性和参与度,但结果很大程度上取决于系统设计选择、互动机制以及硬件和软件堆栈提供的沉浸程度[11,12]。
最近的研究进一步强调向沉浸式、内容丰富的遗产体验转变的趋势,以及需要将VR系统视为中介访客空间理解和解释深度的信息系统。例如,关于虚拟展览和遗产VR研究的系统性和文献计量综合分析显示,该领域持续增长,越来越关注互动设计、沉浸感和部署现实性(即超越仅限于实验室的原型[13]。在应用层面,博物馆和考古遗址等场所的最新实施表明,沉浸式VR流程正被用于保护和访客体验,同时也揭示了成本、内容创作和可用性方面的实际权衡——这些因素直接影响VR在真实环境中的“访问”效果[14,15]。
2.2. 基于VR360的遗产文档化
基于VR360的遗产文档化(如360°全景图和基于热点的虚拟游览)被广泛采用,作为在时间、预算或建模限制导致无法进行全3D重建时扩展公众访问的一种实用方法。最新研究强调,VR360虚拟游览可以提供高视觉真实感和快速内容制作,使其成为博物馆和遗产场所寻求可扩展在线访问的吸引人选择。例如,关于在线博物馆虚拟游览的实证评估研究提出了评估感知质量和有效性的测量框架,表明当VR360设计有明确的导航和解释线索时,它可以成为一种可行的访问媒介[16]。同时,最近针对博物馆的评估比较了不同沉浸式技术(包括VR360),报告指出VR360可以有意义地支持访客体验,但结果很大程度上取决于互动设计和叙事结构与探索行为之间的契合度[17]。
然而,更多的综合研究和实施也指出了VR360作为文档化导向范式的局限性:固定的视野点和预定义的热点可能会限制用户自主性,减少信息探究的深度,并限制与交互式重建环境相比的自适应解释能力。文献计量和系统分析表明,人们对交互性、沉浸感和“超静态”参与度的关注日益增加,这表明VR360越来越多地作为一种基准参考条件,而非最终解决方案[18]。同样,现实世界的数字遗产流程(如将展览数字化为在线可访问的“数字孪生”)展示了VR360如何集成到更广泛的文档工作中,同时也揭示了与元数据、互操作性和长期维护相关的实际权衡[19]。最近关于物理博物馆与虚拟博物馆行为的比较研究进一步支持了将虚拟游览格式视为形用户参与度和互动模式的信息系统的需求,而不仅仅将其视为纯粹的视觉文档[20]。因此,关于虚拟博物馆游览用户体验评估的最新范围工作总结了最近的方法,并强调了将VR360设计选择与可测量的体验结果和互动行为联系起来的比较研究的必要性[21,22]。这些发现促使本研究使用VR360作为基准,以便与更具交互性的AI驱动沉浸式VR方法进行比较。
2.3. 用于文化遗产的沉浸式虚拟现实系统
用于文化遗产的沉浸式虚拟现实(iVR)系统正从全景观看转向强调沉浸感、身体化导航和情境学习的交互式、基于模型的体验。最新的综合研究表明,iVR文化遗产重建通常结合了3D数据采集(如摄影测量/激光扫描)、实时渲染和交互机制,以支持探索、解读和体验式叙事,同时也报告了在面向公众的部署中视觉保真度、性能、移动舒适度和可用性之间的设计权衡[23]。实证案例研究同样表明,当交互 ???c仔细设计(如引导任务、辅助线索和优化导航)以及内容符合博物馆限制(如短暂会话时间和首次用户需求)时,沉浸式遗产VR可以显著提升感知的真实感和参与度[24,25]。
最新的评估研究还强调了方法论的转变:沉浸式遗产系统正通过多维用户体验指标(如沉浸感、参与度、动机、感知真实感和行为意图)进行评估,而不再仅仅依赖于临时性的满意度问卷。在博物馆环境中对比多种XR模式(VR、VR360、MR)的比较工作表明,沉浸程度和互动设计共同塑造了访客结果——这支持了在遗产访问场景中对沉浸式VR和低交互性基线进行受控比较的理由[26]。此外,技术贡献通过整合客观-主观框架(如计算机视觉+ iVR用于遗产场所的视觉感知评估)和形式化文化遗产XR应用的设计/评估流程,扩展了评估范围[27,28]。除了访客解读之外,沉浸式VR系统还被探索用于专业应用,如文化遗产结构的远程检查和监控。最近的综述研究表明,结合AI辅助视觉分析的VR环境使专家能够远程检查建筑状况和结构细节,减少了持续现场访问的需求,同时支持保护和文档工作[29]。总体而言,这些最新文献将沉浸式VR定位为强大的遗产解读和访问平台,同时强调了将特定的交互功能(如身体化交互、对话式指导和自适应信息传递)与现实世界遗产访问限制下的可衡量结果联系起来的比较研究的必要性[30,31,32]。
2.4. 用于文化遗产的AI驱动互动和对话系统
AI驱动的互动已成为数字文化遗产中日益突出的设计方向,特别是随着博物馆和虚拟遗产体验从静态内容传递转向基于对话的解读和个性化引导。关于文化遗产中的生成式AI的最新研究强调,对话系统可以支持可扩展的解读(如自动化解释、自适应叙述和访客支持),同时也提出了关于准确性、来源和AI生成内容中的策展监督的现实要求[33]。在以VR为导向的遗产应用中,基于LLM的聊天机器人被提出作为一种机制,使访客能够提出自然语言问题并获得更符合个人好奇心和探索风格的上下文响应[34]。
在沉浸式和虚拟博物馆环境中,最近的研究和系统研究进一步探讨了对话互动的形式(文本聊天机器人、语音互动、具身化虚拟角色/代理)如何影响参与度、信任感和感知体验质量[35,36]。实证研究表明,比较基于大语言模型(LLM)的聊天机器人与基于虚拟形象的对话界面时,交互方式可以显著影响用户的参与度和感知体验效果,这表明“对话式人工智能”应被视为一种交互设计变量,而不仅仅是一个纯粹的技术附加组件[35]。关于虚拟博物馆中具身对话代理的互补人机交互(HCI)研究强调,具身特性和代理行为能够塑造社交存在感和访客的感知体验,进一步凸显了在设计对话系统时需要关注角色、个性和博物馆沟通目标[36]。除了实验室研究之外,最近针对虚拟博物馆导览代理的实际应用研究也表明,代理的响应能力(回答问题)和情境意识(导航支持)能够显著影响访客体验,为将对话式导览设计为虚拟游览系统的一部分提供了实证依据[37]。大规模文化遗产项目也报告称,正在整合由人工智能驱动的组件(包括聊天机器人和情境感知工具)作为更广泛的数字文化遗产生态系统的一部分,进一步推动了在文化遗产访问环境中对对话交互设计的严格比较评估[38]。
2.5. 概念框架
本研究基于一种以交互为驱动的理论视角,将虚拟现实系统视为在文化限制环境中的一种中介访问机制。在那些访问受到严格限制的宗教空间中,物理访问受仪式规范和文化界限的约束,虚拟现实不仅仅是一种可视化技术,而是一种解释性界面,它决定了用户如何体验和参与这些原本无法进入的环境。在这个框架下,VR360和由人工智能驱动的沉浸式虚拟现实被视为两种不同的交互方式,它们通过其底层的交互特征(包括用户主动性、系统响应性和感知认知负荷)来构建用户体验。这些交互特征作为中介机制,解释了不同交互方式如何影响用户体验结果。在这个过程中,交互方式塑造了用户的交互特征,而这些特征又反过来影响用户的体验反应(如存在感和参与度),最终影响整体用户体验。概念框架如图1所示。具体而言,更具交互性和对话性的系统预计能够增强参与度和存在感,但可能会引入更高的交互复杂性,从而可能影响可用性。基于这一框架,本研究比较了VR360和由人工智能驱动的沉浸式虚拟现实系统,以考察交互特征的差异如何导致可用性、参与度和存在感的差异。
3. 系统概述
3.1. 受限制的宗教空间的文化遗产背景
Wat Sri Suphan的Silver Ubosot是一座具有文化意义的宗教建筑,它源于泰国北部(Lanna)的佛教传统以及Wua-Lai社区的悠久银器工艺传统。这座寺庙可以追溯到16世纪的Lanna时期,历史上既是宗教中心,也是由当地银匠和手工艺行会塑造的社区身份的焦点[39,40]。当代的Silver Ubosot以其复杂的银器浮雕装饰而著称,体现了这一工艺传统的延续性,并在其建筑设计中融入了象征性和宇宙论元素。作为寺庙的仪式核心,Ubosot受到与僧侣仪式相关的习俗约束,其中女性传统上被禁止进入。这种限制反映了当地对仪式纯洁性的理解以及对神圣边界的保护,而不是现代意义上的排斥或歧视,这与男性银匠在寺庙建设和仪式管理中的历史角色密切相关。这些访问限制通过建筑界限和现场标识明确传达出来(图2),反映了物理访问的结构性限制。在这种情况下,虚拟现实系统提供了一种伦理性的访问方式,使人们能够在不违反既定宗教规范的情况下,理解和参与该地点的艺术和历史价值。
3.2. 整体系统架构与设计理由
整个系统架构旨在提供一种尊重文化的访问方式,以便同时访问这个仪式上受限制的宗教空间,并能够对两种虚拟现实范式进行结构化的比较:一种基于VR360的遗产访问系统,另一种是由人工智能驱动的沉浸式虚拟现实(VR)系统。如图3所示,这两个系统都基于共享的文化遗产数据流构建,确保用户体验和交互的差异主要归因于系统设计的选择,而不是内容不一致性。这种方法支持公平的比较分析,同时保持文化遗产在各种系统条件下的表示一致性。
3.3. Wat Sri Suphan银 Ubosot的三维重建
Wat Sri Suphan银 Ubosot的三维数字模型是使用基于摄影测量的重建工作流程创建的,以支持沉浸式虚拟现实交互。使用iPhone 15 Pro Max在现场拍摄了高分辨率的照片数据,大约收集了1200张银 Ubosot外部和内部的照片,以确保覆盖建筑几何形状和装饰细节。这些图像数据通过Agisoft Metashape(Agisoft LLC,俄罗斯圣彼得堡)进行处理,生成了密集的点云、多边形网格和纹理映射,从而获得了保留银器浮雕工艺结构和表面特征的详细3D模型。这种方法的选择是为了在真实世界的遗产环境中平衡重建的精细度和实用性。如图4所示,摄影测量流程生成了一个结构化的线框网格,捕捉了银 Ubosot的几何复杂性(图4),一个适合实时渲染的完全带纹理的外部可视化效果,以及一个保留了空间布局和装饰细节的重建内部空间,用于沉浸式探索(图5)。所得的3D模型专门用于本研究描述的由人工智能驱动的沉浸式VR系统中,实现自由的空间导航和与神圣空间的互动体验。相比之下,基于VR360的遗产访问系统依赖于360度摄影图像,而不是重建的几何形状。通过明确区分用于沉浸式VR的基于摄影测量的3D重建和基于图像的VR360内容,系统设计确保了每种访问方式的技术适用性,同时在比较研究中保持文化遗产表示的一致性。
3.4. 基于VR360的遗产访问系统
基于VR360的遗产访问系统实现为一个基于节点的虚拟游览,使用在Silver Ubosot内部和周围选定地点拍摄的360度摄影图像。该系统不支持连续的自由导航,而是允许用户在神圣空间内预定义的视点之间移动,从而在尊重访问限制的同时保持空间连贯性。这种节点到节点的导航模型提供了一种有指导但灵活的探索体验,类似于结构化的现场导览(图6)。在每个全景场景中,交互通过嵌入的视觉图标来实现,这些图标支持不同层次的解释(图6)。提供了三种类型的交互图标:蓝色信息图标显示建筑元素、银器浮雕图案和直接与其空间位置相关联的装饰图案的文字描述;白色播放图标激活描述遗址历史和文化方面的叙述性音频解释;红色图标链接到YouTube上的视频叙述,介绍历史背景、宗教象征意义以及与银 Ubosot特定特征相关的社区故事。通过结合静态全景可视化与分层的解释性媒体,VR360系统强调了叙事控制的一致性和视觉真实感,从而为与基于人工智能驱动的沉浸式VR系统的比较提供了稳定的基准。补充材料中提供了额外的演示材料。
3.5. 基于人工智能驱动的沉浸式VR系统与LLM交互
基于人工智能驱动的沉浸式VR系统支持在完全可导航的Silver Ubosot三维重建中的多模态对话交互,允许用户超越预定义的叙事进行探究性探索。除了自由的空间导航外,游客还可以在近距离观察建筑结构、宗教元素和艺术细节时,向基于人工智能的导览助手提出口头问题。这种交互模式允许用户根据个人兴趣和空间背景发起信息请求,而不是遵循固定的故事叙述顺序。如图7所示,在探索过程中捕获口头查询并实时处理,使对话交互无缝嵌入沉浸式体验中,而不中断导航或视觉体验。通过将基于语音的查询直接整合到空间探索中,该系统旨在增强用户的主动性,并支持更自然、更直观的文化遗产解读方式。这种交互模型被设计为一个情境感知的解释性界面,而不是一个开放领域的对话系统,其中用户的查询被有意限制在与遗产地点相关的文化和情境相关的话题范围内。
3.6. AI交互流程与可靠性保障
沉浸式VR系统的对话功能遵循一个基于检索的生成流程。当游客提出口头问题时,首先使用OpenAI Whisper语音转文本模型将音频输入转录为文本。然后,检索组件处理该文本查询,搜索一个包含由策展人准备的描述、历史文献和与Silver Ubosot相关的结构化元数据的策划遗产知识库。最相关的段落被插入提示模板中,作为ChatGPT-4o模型(OpenAI,美国旧金山;2025年版本)的上下文基础,生成最终的自然语言响应。这种基于检索的提示方法类似于轻量级的检索增强生成(RAG)机制,限制模型使用经过验证的遗产信息进行响应,而不是生成不受限制的答案。这种设计还通过将生成过程基于策划的知识源来降低产生幻觉性或不合适文化内容的风险。这种架构体现了一种受限的、上下文感知的对话设计,其中用户查询在预定义的文化和信息边界内被解释,确保系统响应与领域特定知识和文化敏感性要求保持一致。为提高响应的可靠性,实施了几项保障措施。提示模板明确指示模型避免生成超出检索知识范围的信息,当无法识别相关信息时,系统会返回拒绝消息,表明问题无法以足够的信心得到回答。在实际部署中,对话流程依赖于基于云的AI服务,因此需要稳定的互联网连接。在典型网络条件下,包括语音转录、检索和大型语言模型(LLM)生成在内的平均端到端响应延迟约为6.3秒。当连接不稳定时,系统偶尔会无法返回响应,在这种情况下,用户可以在虚拟环境中继续进行视觉探索,而对话互动暂时不可用。为了评估响应质量,定期由领域专家和展览工作人员审查一小部分生成的答案,以验证事实准确性和文化适宜性。此外,还收集了系统级别的交互日志,包括查询频率、响应延迟和交互持续时间,以支持系统性能和用户交互行为的分析。对话日志以匿名形式存储,用于系统监控目的,且没有记录任何个人可识别信息,这符合清迈大学研究伦理委员会批准的伦理指南。
4. 研究方法
4.1. 研究方法
本研究采用了实地研究方法[41,42],在真实世界条件下考察用户与虚拟遗产系统的互动和体验。系统不是被置于严格控制的实验室环境中,而是被部署在真实的情境中,使参与者能够根据兴趣自由探索,从而保持了生态有效性。这种方法特别适合文化遗产应用,因为用户体验受到情境背景、内在动机和探索行为的影响。通过观察自然发生的交互模式并在现场收集体验反馈,本研究旨在生成反映扩展现实系统在文化遗产访问中的实际使用和真实世界部署的见解。这种方法还允许收集行为交互数据,如交互持续时间和频率,这些数据可用于进一步研究系统使用期间的用户参与模式。
4.2. 参与者
参与者通过现场和社区推广活动招募,采用方便抽样方法,即在研究期间位于展览区附近的访客被邀请自愿参与研究。然后将参与者分配到两个实验组,每个组有68名参与者(总共136名)。为了在研究场地的操作限制内获得一致的体验反馈,参与者被限制为在招募时自称为女性的个体,这反映了研究期间与虚拟遗产系统互动的主要访客群体。参与者的平均年龄为M = 37.87岁(SD = 7.74岁)。一组与基于VR360的遗产访问系统互动,而另一组则体验了具有对话交互功能的AI驱动的沉浸式VR系统。除了自我标识的性别外,没有评估其他性别身份,也没有收集或分析性取向,因为这些因素超出了研究的范围和目标,研究重点在于系统互动和体验反馈。所有参与者在参与前都提供了知情同意,且没有收集任何个人可识别信息。实验会在银乌博索特(Silver Ubosot)对面指定的小房间里进行。如图9所示,这种设置允许参与者在接近实体遗产地点的地方与虚拟系统互动,同时避免干扰宗教活动(图10)。研究在官方工作时间进行,以确保适当的监督并遵守场地管理规定。
4.3. 工具和测量
本研究中使用的测量工具基于人类-计算机互动和虚拟现实研究中广泛验证的量表。具体来说,研究采用了系统可用性量表(SUS)、用户参与量表(UES)和群体沉浸感问卷(IPQ),这些量表在以往的研究中被广泛用于评估交互系统的可用性、参与度和沉浸感。
4.3.1. 系统可用性量表
SUS用于评估参与者对虚拟遗产系统的感知可用性[43,44]。SUS包含十个项目,采用五点李克特量表进行评分,涵盖了使用便利性、可学习性和整体满意度等方面。它提供了一个单一的可用性分数,可以可靠地比较不同的系统条件,并在交互式和沉浸式系统之间得到广泛验证。完整的问卷项目见附录A。
4.3.2. 用户参与量表
用户参与度通过UES进行测量,该量表捕捉了多个参与维度,包括专注注意力、感知可用性、美学吸引力和奖励[45,46]。UES特别适合沉浸式和探索性系统,因为它反映了用户互动的认知和情感方面,而不仅仅是任务表现。完整的问卷项目见附录A。
4.3.3. 沉浸感和空间体验
使用IPQ评估参与者的沉浸感和空间体验(这里指感知的空间沉浸感)。IPQ测量虚拟环境中的感知空间沉浸感、参与度和体验的真实性[47]。该工具在虚拟现实研究中得到广泛应用,有助于评估用户如何令人信服地感知和体验重建的文化空间。完整的问卷项目见附录A。
4.3.4. 回顾性访谈
为了补充定量测量,对一部分参与者在系统使用后进行了回顾性访谈[48]。访谈重点关注参与者的主观体验、对系统的感知优势和局限性,以及对互动、解释和文化理解的反思。这一定性部分有助于深入解读问卷结果,并提供与实地研究方法相一致的情境洞察。访谈记录由两名研究人员转录和审查,他们识别出重复的模式并将它们分类为主题。第5节提供了代表性的匿名引用来说明参与者的观点。
4.4. 实验设计和程序
本研究采用了被试间比较设计,每位参与者只体验一种系统条件,以避免学习效应和跨条件偏见。参与者首先接受了简短的介绍,解释了研究目的和系统使用方法,随后在被参与前被要求提供知情同意。实验设置使用了Meta Quest 3头戴显示器;VR360系统直接在独立头戴设备上运行,而AI驱动的沉浸式VR系统则通过连接头戴设备的高性能个人计算机呈现,该计算机配备了NVIDIA GeForce RTX 4060显卡(NVIDIA Corporation,美国加州圣克拉拉)、16 GB的RAM和基于AMD的CPU,以确保稳定的实时渲染和AI交互。在获得同意后,参与者可以根据自己的兴趣自由探索虚拟遗产环境,最长时间为30分钟,没有固定任务顺序,以保持与实地研究方法一致的自然探索行为。在整个会话期间,系统自动记录了交互持续时间、导航行为和对话使用情况。
4.5. 数据收集和分析
定量数据使用了标准化问卷收集,包括SUS、UES和IPQ。所有定量分析均使用IBM SPSS Statistics(版本27)进行。计算了所有指标的描述性统计(均值和标准差)。在进行推断分析之前,检查了独立样本t检验的标准统计假设,包括分布的正态性和方差的同质性。独立样本t检验用于比较两种系统条件下的总体得分,统计测试仅针对总体综合得分进行了预先指定,以减少I类错误的风险。选择这种统计方法是因为研究采用了比较两种独立系统条件(VR360和AI驱动的沉浸式VR)的被试间实验设计。因此,分析的目标是检查两组之间的用户体验结果差异,而不是建模潜在结构之间的关系。效应量使用Cohen’s d计算,所有推断分析采用的显著性水平为p < 0.05。由于研究不旨在测试变量之间的因果关系,而是关注比较不同实验条件下的用户体验指标,因此没有应用结构方程建模。除了独立样本t检验外,还进行了回归分析,以进一步研究交互行为与用户体验结果之间的关系。具体来说,系统条件和交互持续时间被作为预测变量,感知沉浸感被指定为因变量。这项分析探讨了感知沉浸感不仅受系统类型的影响,还受用户参与程度的影响。这种方法使得可以更细致地解释交互行为如何影响感知沉浸感的变化,而不仅仅是系统条件之间的差异。定性数据通过在实验会话后进行的回顾性访谈获得。访谈记录经过转录,并使用主题分析方法进行分析,经过迭代编码过程来识别参与者之间的重复模式和主题。
5. 结果
5.1. 系统可用性量表和用户参与量表的结果
如图11所示,SUS结果显示两种系统在感知可用性方面存在可测量的差异。VR360系统的平均SUS得分为81,而AI驱动的沉浸式VR系统的平均得分为74。根据标准的SUS基准,两个得分都处于可接受的可用性范围内,并且对应于“良好”的形容词评级,表明参与者普遍认为两个系统都是可用的。然而,得分分布显示VR360系统在良好范围内的位置更高,接近于更高可用性分类的上限。相比之下,AI驱动的沉浸式VR系统在同一可用性范围内的位置较低,反映了参与者中较低的可用性得分。
5.2. 沉浸感和空间体验的结果
如图12所示,并在表2中总结,IPQ结果显示两种系统在感知沉浸感方面有相似的模式,AI驱动的沉浸式VR系统在所有维度上均表现出更高的平均得分。在空间沉浸感方面,VR+AI系统的平均得分(3.75)高于VR360系统(3.57),而在参与度(3.68 vs. 3.53)和体验真实性(3.81 vs. 3.71)方面也显示出类似的趋势。在总体沉浸感方面,VR+AI系统的平均得分(3.75)也高于VR360系统(3.60)。仅针对总体IPQ得分进行的统计测试显示两种条件之间存在统计学上的显著差异(p = 0.027),效应量较小(Cohen’s d = 0.38)。
5.3. 行为互动的结果
行为互动指标提供了关于两种系统之间用户参与模式的额外见解(表3)。使用人工智能驱动的沉浸式VR系统的参与者在探索环境上花费的时间更长(平均9.4分钟),而VR360系统的参与者则为6.8分钟。在沉浸式VR条件下,互动频率也更高(平均14.4次互动),而在VR360条件下为12.3次互动。此外,参与者在探索过程中平均提出了6.6个问题,平均响应延迟约为6.3秒。表3展示了行为互动指标。为了进一步研究互动行为与用户体验结果之间的关系,进行了一项线性回归分析,以感知沉浸感作为因变量,系统条件和互动时长作为预测变量。回归模型在统计上具有显著性(p < 0.05),表明系统条件和互动时长都显著影响了感知沉浸感。这些发现表明,感知沉浸感不仅仅由系统类型决定,还受到用户体验过程中用户互动程度的影响。特别是,互动时长对感知沉浸感有积极影响,表明较长的互动时间有助于提升沉浸式体验,而不仅仅是VR模式之间的结构差异。
在实验结束后,对28名参与者(每组14名)进行了回顾性访谈,以进一步探讨他们的主观体验,并对定量研究结果进行背景补充。访谈重点关注了用户体验的可用性、真实性、互动体验以及展览部署的实际考虑因素。主题分析揭示了两种系统条件下的四个重复出现的主题。
5.4.1 可用性与真实性的权衡
参与者一致认为,两种系统的体验真实性感知水平大致相当,因为它们都依赖于直接来自真实世界环境的视觉素材。VR360系统和人工智能驱动的沉浸式VR系统都使用了真实的图像,从而有助于营造相似的视觉可信度和环境真实性,减少了参与者对真实性的明显差异。因此,当用户反思整体体验时,体验真实性并未被确定为主要区别因素。相反,参与者的评价更多地集中在他们与系统的交互和导航的便捷性上,这将注意力从视觉真实性转移到了实际可用性上。VR360系统被普遍描述为易于使用且立即可理解,几乎不需要指导。参与者表示,从第一次使用开始就能够直观地导航和参与内容,使他们能够专注于遗产信息而非系统操作。相比之下,人工智能驱动的沉浸式VR系统则被认为更加复杂。参与者报告了与交互机制相关的问题,包括难以理解如何启动和管理与AI的对话、AI响应时的偶尔延迟、对可用交互功能的困惑以及AI语气的不一致性。这些与可用性相关的问题增加了互动时的认知负担,并影响了用户的整体印象,这解释了为什么相似的真实性感知水平并没有转化为更高的参与度或可用性评分。
5.4.2 感知控制与互动体验
参与者普遍报告称,在两种条件下,基本系统控制都是可管理的,没有遇到重大困难。VR360系统和人工智能驱动的沉浸式VR系统都被认为是可控的,用户表示他们能够理解如何导航环境和操作系统,且没有显著问题。这表明,在基本层面上,参与者在与这两种系统互动时都感到有足够的控制感。然而,在互动体验方面出现了显著差异,尤其是在人工智能驱动的沉浸式VR条件下。虽然参与者发现对话式AI功能有趣且引人入胜,但他们也指出与AI的互动需要进一步的改进。一些参与者表示,启动和管理基于AI的互动的过程并不总是直观的,例如使用语音录制按钮时的不确定性、AI响应时间的延迟以及等待回答的时间。尽管存在这些挑战,参与者仍然认为AI能够提供多样化且符合情境的回应,对话式互动为体验增加了价值。总体而言,尽管对互动概念持积极看法,但参与者强调了改进互动流程、响应速度和反馈机制的必要性,以提升人工智能驱动的沉浸式VR系统的感知控制和可用性。
5.4.3 展览操作与社交环境
参与者指出,将实验装置设置在靠近实际遗产地点的位置使他们更容易理解虚拟内容与真实环境之间的联系。位于遗址附近有助于减少对受限空间内情况的不确定性和好奇心,使参与者在参与虚拟系统之前能够形成更清晰的预期。在这方面,VR360系统和人工智能驱动的沉浸式VR系统之间没有显著差异,因为两者都被认为在支持情境理解和解答游客关于遗址内部的问题方面是有效的。总体而言,参与者认为展览布置是一种实用的解决方案,它成功地增强了可解释性,同时保持了与神圣空间的适当分离。
5.4.4 展览工作人员的操作视角
从展览工作人员的角度来看,两种系统在操作管理方面存在显著差异。VR360系统被一致描述为易于管理,需要很少的设置和几乎不需要工作人员的干预。工作人员报告称,用户从第一次使用起就能独立使用该系统,没有遇到重大的技术或操作问题。相比之下,人工智能驱动的沉浸式VR系统则被认为管理起来更具挑战性。工作人员注意到,用户在互动AI功能时经常寻求帮助。操作问题如间歇性的网络连接问题偶尔会导致AI无法响应用户查询,进一步增加了对工作人员支持的依赖。此外,人工智能驱动的沉浸式VR的初始系统设置比VR360系统更为复杂。总体而言,工作人员强调沉浸式VR系统需要持续的监督和技术支持,而VR360系统则在几乎没有工作人员参与的情况下可靠运行。
6. 讨论
6.1 在限制进入的神圣遗产环境中可用性与参与度的权衡
以下讨论将研究结果与先前的虚拟遗产和沉浸式媒体研究进行了对比。针对研究问题1,本研究结果表明,在限制进入的神圣遗产环境中,比较VR360系统和人工智能驱动的沉浸式VR系统时,感知可用性和用户参与度之间存在明显的权衡。这些发现与所提出的概念框架一致,即互动方式通过互动特性(尤其是用户自主性和感知认知负荷)来塑造用户体验。与定量结果一致,VR360系统表现出更高的可用性,而两种系统的整体参与度水平相当。定性洞察进一步说明了这些发现,因为参与者经常提到VR360系统无需预先指导即可立即使用,使他们能够专注于遗产内容而非系统操作。VR360系统的较高可用性反映了其较低的交互复杂性和受限的导航结构,这减少了感知认知负荷,支持了用户的即时理解。相比之下,尽管人工智能驱动的沉浸式VR系统常被描述为有趣且引人入胜,但参与者报告了额外的互动需求,包括管理基于AI的对话时的不确定性、系统响应的延迟以及与语音交互功能相关的困惑。这些发现表明,增加的用户自主性和对话式互动引入了额外的认知需求,限制了参与度的有效性。因此,增加的互动复杂性并没有转化为更高的参与度。这一模式支持了之前的研究结果,即在遗产和博物馆环境中,互动的便捷性在塑造用户体验方面起着关键作用,尤其是在系统部署在真实世界且时间有限的场景中[12,23]。行为互动指标进一步支持了这一解释,因为VR360条件下的参与者表现出更短的会话时间和稍少的互动动作,反映了更简单的互动结构,这可能有助于解释为什么在SUS结果中观察到更高的可用性评分。这些模式表明,增加的互动努力并不一定能够改善用户体验结果,反而反映了不同系统条件下的互动需求差异。
现有关于虚拟遗产和沉浸式媒体的文献也报告了互动丰富性与可用性之间的紧张关系。轻量级的VR方法,如全景或VR360系统,已被证明可以减少认知负荷并降低入门门槛,适用于公共展览和初次使用用户[49]。相比之下,结合了先进交互技术(包括体感导航和对话式界面)的沉浸式VR系统可以增强体验深度,但通常会引入需要额外学习和持续支持的可用性挑战[50,51]。这种比较表明,只有当互动复杂性对初次使用用户在公共展览环境中仍然是可管理的时,先进交互机制的好处才会变得有意义。本研究中观察到的权衡与这些发现一致,表明交互复杂性在调节互动模式和用户体验结果之间起着中介作用。在所提出的框架中,这种权衡反映了简单交互模式中的认知负荷减少与复杂系统中的用户自主性增强之间的平衡。一个可能的解释是,在遗产环境中,游客通常更重视解读的清晰度和访问的便捷性,而不是技术的新颖性,尤其是在短时间的展览访问中。这表明,为限制进入的神圣遗产地点设计时,应仔细平衡参与度目标与可用性和操作限制,而不是假设增加的沉浸感本身就能显著提升用户体验。从设计角度来看,这些结果强化了将交互复杂性与使用情境相协调的重要性,其中简单性和可靠性可能比高级交互能力更能支持包容性的遗产访问。
6.2 不同VR模式下的沉浸感和感知空间存在感
针对研究问题2,研究结果表明,人工智能驱动的沉浸式VR系统引发了更高的整体沉浸感和更强的感知空间存在感,尽管这种差异的程度较小到中等。这些发现与所提出的概念框架一致,即互动方式通过互动特性(如用户自主性和体感参与)影响感知存在感。IPQ的定量结果显示,沉浸式VR条件在整体存在感方面具有明显优势,尽管在维度层面的差异较小。相对较小的效应大小表明,沉浸式VR与VR360之间的存在感差异可能受到视觉保真度和内容真实性的调节,而不仅仅是沉浸水平的因素。定性反馈表明,这种差异主要不是由视觉真实性驱动的,因为参与者经常提到,由于两种系统都依赖于来自真实世界环境的图像,它们看起来同样真实。由于两种系统都源自真实世界的视觉捕捉,全景VR和完全可导航VR环境之间典型的感知差距可能在这种应用场景中被减少了。相反,感知存在感是由互动方式、空间导航以及每个系统支持的体感参与程度所决定的。特别是,更高的用户自主性和在沉浸式VR环境中自由导航的能力支持了更强的体验参与度,从而提升了感知存在感。行为互动指标进一步支持了这一解释,因为沉浸式VR条件下的参与者在每次会话中花费更长的时间探索环境并进行了更多的互动动作,这些模式与IPQ结果中观察到的更高空间存在感评分一致。回归分析进一步证实了这种关系,表明互动时长显著预测了感知存在感,表明较长的互动时间有助于提升沉浸式体验,超出了系统条件之间的差异。这些结果表明,感知存在感不仅仅由系统类型决定,还部分受到互动行为的影响,特别是持续的参与度。这一发现为所提出的中介机制提供了实证支持,其中交互特征——尤其是持续参与——作为连接交互模式和感知存在感的关键途径。定性洞察进一步阐明,在沉浸式VR条件下,参与者经常描述出更强的“置身于环境之中”的感觉,他们将这种感觉与身体感知的探索和移动自由联系在一起。相比之下,使用VR360系统的参与者将他们的体验描述为更偏向观察性的,经常将其描述为在空间中“四处查看”而不是占据它。在最近的沉浸式VR和文化遗产研究中也报告了观察性与身体感知存在感之间的类似区别,这些研究强调了交互和空间参与在塑造存在感中的作用,而不仅仅是视觉保真度[31,52]。然而,参与者也报告说,沉浸式VR系统中的交互复杂性以及偶尔出现的系统延迟破坏了他们的沉浸感,这与研究表明可用性问题及系统响应性可以调节沉浸式环境中的感知存在感和整体用户体验是一致的[53,54]。在所提出的框架内,这表明虽然增加互动性可以通过增强用户的自主性来提升存在感,但同时也引入了交互摩擦,从而限制了整体体验效果。这一观察突显了一个重要的设计启示:如果交互摩擦或系统延迟中断了体验流程,仅凭技术上的沉浸感并不能保证更强的存在感。综合来看,现实世界部署的结果表明,结合了身体导航和对话交互的AI驱动沉浸式VR比VR360具有更高的空间存在感。参与者报告说,在探索过程中能够提问并获得情境解释有助于解决出现的不确定性,从而提供更加连续和沉浸的体验。这一发现强化了以互动为导向的沉浸式体验解释,即存在感不仅受到视觉真实性的影响,还受到用户与虚拟环境互动深度和连续性的影响。
6.3. 对包容性和尊重性的文化遗产访问的设计启示
针对研究问题3,两种系统的现实世界部署揭示了超出沉浸水平之外的实质性设计和运营权衡。这些发现可以通过所提出的概念框架来解释,其中交互模式的差异不仅塑造了用户体验结果,还通过交互特征的变化影响了运营需求。从运营角度来看,AI驱动的沉浸式VR系统需要大量更多的技术和人力资源,包括高性能PC、稳定的高带宽互联网连接以及持续的工作人员监督。来自参与者和展览人员的定性反馈表明,访客在与基于AI的对话界面互动时经常需要帮助,尤其是在处理语音输入、理解交互提示以及应对网络不稳定导致的响应延迟方面。在这个框架内,增加用户自主性和对话互动与更高的交互复杂性相关,这转化为更大的技术和运营需求。同时,参与者一致报告说,在探索过程中能够自由提问并获得情境解释有助于他们在遇到不熟悉或文化复杂的神圣空间元素时解决不确定性。这种探究驱动的互动有助于提供更加连续和沉浸的体验,并增强存在感,这与先前的研究结果一致,这些研究强调了在文化遗产VR系统中,相比单纯的视觉沉浸,交互和解释性支持的作用更为重要[12,23]。在这种情况下,包容性访问不应被理解为对神圣空间的无限制物理访问。相反,本研究中的包容性访问指的是解释性和信息性访问,它使访客能够在尊重社区定义的边界和仪式实践的同时,与文化受限区域进行互动。系统的部署与当地利益相关者(包括寺庙代表和展览工作人员)进行了协调,以确保虚拟体验能够补充现有的文化规范,而不是与之冲突。
相比之下,VR360系统在可用性、可靠性和运营可持续性方面表现出了明显优势。观察和访谈数据显示,参与者无需指导即可立即使用VR360系统,展览工作人员报告称该系统的运行一直很稳定,无需持续监督。基于节点的导航结构和预定义的信息热点足以回答大多数访客的常见问题,特别是与视觉访问和受限空间的基本解释相关的问题。这一发现与之前的研究结果一致,即轻量级VR和全景式方法可以有效减轻认知负担,并在面向公众的文化遗产背景下提供可解释的体验[49,50]。在所提出的框架内,这反映了较低的交互复杂性和受限的交互结构如何减轻认知负担,并支持在现实世界环境中的稳定、可扩展部署。综上所述,研究结果表明,对于拥有足够资源和专职人员的机构(如博物馆和策划展览),AI驱动的沉浸式VR更为适合,因为这些机构重视深入的、基于探究的互动;而VR360系统则更适合一般的文化遗产和旅游场所,能够提供包容性和尊重的访问方式,而不会带来过重的运营负担。然而,本研究识别的设计启示应在特定文化和机构背景下进行解读。虽然这些设计原则可能适用于其他具有访问限制的文化遗产环境,但其实施必须考虑当地的文化规范、治理结构和利益相关者的期望。为了在更广泛的虚拟文化遗产访问方法背景下进一步具体化这些发现,表4总结了常用文化遗产解释VR方法(包括VR360虚拟游览、沉浸式VR环境和本研究开发的AI驱动沉浸式VR方法)的主要优点和局限性。
6.4. 局限性与未来工作
在解释这些发现时,应认识到本研究的几个局限性。首先,评估是在一个涉及访问受限的神圣场所的单一现实世界文化遗产背景下进行的,这可能限制了结果在其他文化、机构或空间环境中的普适性。此外,所有参与者均为女性,这反映了研究期间使用虚拟系统的主要访客群体以及该场所的文化限制。虽然这种关注点适合于考察在仪式限制下的包容性访问,但它限制了结果对具有不同人口特征或交互偏好的更广泛访客群体的适用性。此外,AI驱动的沉浸式VR系统依赖于稳定的互联网连接和基于云的AI服务,这偶尔会导致响应延迟,并需要在部署过程中进行人工干预。另外,AI驱动的沉浸式VR系统可能需要大量的计算资源和技术支持,以确保在现实世界文化遗产环境中的稳定运行。这些技术依赖性可能会影响用户体验的感知,并调节观察到的AI驱动交互的体验优势。此外,本研究并不旨在定量评估基础语言模型的性能;相反,AI组件是在一个受限制的、特定领域的知识环境中在系统层面进行评估的。未来的工作应在多个方向上扩展这项研究,以解决这些局限性。跨多个文化遗产场所(包括世俗博物馆、户外景点和具有不同访问限制的场所)的比较研究将有助于验证和完善所提出的设计启示。扩展参与者的人口统计范围,超越仅限女性的群体,将进一步支持结果的普遍适用性。此外,未来的系统开发可以探索混合设计方法,将VR360的运营简洁性与选择性激活的AI驱动功能(如可选的对话辅助)相结合,以平衡成本、可用性和互动性。未来的研究还可以加入更正式的AI生成响应评估指标,如响应准确性评估、一致性分析或幻觉检测,以更全面地验证AI的性能。最后,边缘计算和离线或轻量级AI模型的进步可能会减少基础设施和人员需求,使得增强AI的沉浸式VR在更广泛的文化遗产和旅游环境中变得更加可行。
7. 结论
本研究通过现实世界部署提供了实证证据,展示了不同的虚拟现实方法如何支持对仪式限制的神圣遗产场所的包容性访问。研究结果表明,VR360系统提供了高可用性、运营稳定性和低维护要求,使其能够有效满足访客的好奇心,并以最少的基础设施和人员支持提供基本的解释性访问。相比之下,AI驱动的沉浸式VR通过支持身体感知的探索和对话式探究,使访客能够当场提问并解决不确定性,从而增强了感知的空间存在感和解释性参与度,特别是在涉及文化复杂或不熟悉文化遗产元素的情境中。除了用户体验结果之外,这项工作还提供了信息学导向的见解,有助于系统选择、部署决策和虚拟文化遗产应用的机构规划。结果表明,仅靠沉浸式技术本身并不能保证改善体验;只有当交互设计、解释性支持和系统可靠性与运营可行性及机构能力相匹配时,才能实现有意义的空间存在感。通过基于现实世界部署和定性反馈的比较,本研究为文化遗产机构和文化组织提供了基于证据的指导,以采用平衡包容性、文化尊重、体验深度和系统长期可持续性的VR策略。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号