《Behaviour & Information Technology》:Gaze-aware support for security surveillance: a user-centered field study
编辑推荐:
安防监控的特点是操作人员面临显著的认知挑战。Scantracker是一种混合现实(MR)注视感知支持工具,可就被忽视的摄像机、注意隧穿以及警觉性下降向监控操作人员发出提示。早期研究工作已在模拟环境中开展,以考察Scantracker对监控绩效的影响;然而,该工
安防监控的特点是操作人员面临显著的认知挑战。Scantracker是一种混合现实(MR)注视感知支持工具,可就被忽视的摄像机、注意隧穿以及警觉性下降向监控操作人员发出提示。早期研究工作已在模拟环境中开展,以考察Scantracker对监控绩效的影响;然而,该工具尚未在真实世界的操作环境中部署并测试。在当前研究中,研究人员在机场运行控制中心对Scantracker进行了测试,以评估其集成的可行性,并收集专家关于其操作相关性的反馈。操作人员在工作班次期间自愿使用Scantracker,同时眼动数据使系统能够生成通知。研究人员收集了操作人员对感知效用、工作负荷和人体工效学质量的评分,以及关于其使用体验的定性反馈。结果模式突显了Scantracker支持监控操作人员的潜力,并证明了以用户为中心的现场测试对于开发智能监控辅助系统的价值。
本文发表于《Behaviour》。该研究聚焦于安防监控这一高度依赖人类操作员持续视觉监测与判断的应用场景。尽管计算机视觉、模式识别以及半自动或全自动监控技术不断进步,现实中的安防中心仍需依赖人工操作员对多源信息进行监督、解释、优先级排序与处置,这是因为安全关键决策需要明确责任归属,同时人机协同(human-automation teaming)在复杂监控任务中仍具有不可替代的价值。然而,监控操作员长期面临信息过载、多任务并行、背景声音干扰、任务中断、疲劳以及低事件率等问题。尤其是在关键事件发生频度较低的情况下,操作员必须在大量常态化画面中维持警觉,这会加剧漏检风险、削弱动机并增加情境不确定性。因此,如何在不替代人的前提下,通过智能支持工具缓解认知负荷、改善注意分配与监控行为,成为安防监控人因工程中的重要研究议题。
围绕这一问题,研究人员考察了Scantracker在真实运行环境中的应用可行性与用户接受度。Scantracker是一种注视感知(gaze-aware)混合现实(MR)辅助工具,基于实时眼动数据分析用户的视觉监控行为,并针对三类潜在问题发出提示:其一是摄像机画面被忽视;其二是对个别画面过度聚焦所致的注意隧穿;其三是随时间出现的警觉性下降。既往研究已在模拟监控环境中验证该工具可改善部分视觉扫描行为指标,但尚未在实际安防场所完成部署和现场测试。为此,本研究在加拿大魁北克市机场(YQB)运行控制中心开展现场研究,让真实安防操作员在自然工作班次中自愿使用该系统,并从工作负荷、通知效用、人体工效学与定性体验等多个层面进行综合评估。研究结果表明,Scantracker在真实场景下具有支持监控工作的潜力,尤其有助于提升操作员对自身监控行为的觉察;同时,现场测试也揭示了设备舒适性、通知呈现方式与工作流适配性等需要进一步优化的问题。这项研究的重要意义在于,它推动了注视感知辅助系统从实验室走向真实运行环境,为安防智能辅助技术的用户中心化开发提供了方法学示范。
研究人员主要采用了以用户为中心设计(UCD)框架下的现场混合方法研究。样本来自加拿大魁北克市机场(YQB)运行控制中心的10名志愿安防操作员。研究在真实班次中实施准实验设计,设置对照条件与Scantracker条件。硬件平台为集成眼动追踪功能的Microsoft HoloLens 2,眼动数据经Sensor Hub实时处理,驱动忽视、注意隧穿与警觉性模型生成提示。定量部分包括NASA-TLX工作负荷量表、通知效用评分和人体工效学评价;定性部分包括开放式用户反馈。统计分析采用贝叶斯分层模型与Hamiltonian Monte Carlo方法。
在研究结果方面,论文首先报告了“3.1. Quantitative data”。研究共收集25个监控时段,其中对照条件12次,Scantracker条件13次,单次时段平均持续62.82 min。HoloLens 2在Scantracker条件下获得的眼动有效性平均达到96.10%,说明系统在真实运行环境中的眼动采集质量较高,具备实际部署的技术基础。就主观工作负荷而言,各NASA-TLX分量表在两种条件下整体相近。除绩效分量表外,其余维度的贝叶斯分层双样本检验均倾向于支持条件间无明显差异。绩效维度中,对照条件自评绩效高于Scantracker条件,但其贝叶斯因子仅呈现对备择假设的轶事性证据,且β估计的95%可信区间并未稳定支持这一差异。因此,研究更稳妥的结论是:在真实运行中心中使用Scantracker并未显著增加操作员的主观工作负荷。
关于人体工效学与通知效用,研究显示MR集成版本的Scantracker具有中等可接受性。人体工效学测量中,“需要休息的次数”与“头痛程度”评分显著低于量表中点,说明设备使用并未明显诱发过度不适,这一点得到较强贝叶斯证据支持。眼部刺激感方面仅出现较弱证据,未形成稳定结论。舒适度、视觉质量与整体易用性则大致接近量表中点,提示系统在可佩戴舒适性和视觉呈现方面仍有改进空间。对于通知效用,三类通知的评分均未稳定显著高于中点,且个体差异较大;在相对排序上,操作员认为“忽视提醒”最有用,其次是“警觉性提醒”,最后为“注意隧穿提醒”。这表明不同提示类型的操作价值并不一致,且受使用者特征与任务情境影响较大。
在“3.2. Qualitative feedback from users”部分,研究人员进一步通过用户口述反馈揭示了系统的实际使用特征。多名参与者指出,Scantracker能帮助其在处理文书或其他次级任务时记得回看监控画面,从而增强对摄像机监控频率的自我意识。换言之,该工具并不必然改变既有工作习惯,但可以作为一种外部提示机制,防止摄像机被长时间忽视。这一点与忽视通知的设计目标一致,也从侧面支持了系统在元认知(metacognitive)层面的价值,即帮助操作员意识到自身注意分配与监控策略。
与此同时,定性数据也揭示了若干局限。部分操作员反映,在执行文书工作时会因为等待或响应通知而感到分心,说明工具在支持监控的同时,可能对并行任务构成干扰。另有参与者指出,当系统提示正在关注某些画面时,又收到要求查看其他画面的通知,会产生一定扰动感。这说明基于纯粹自下而上(bottom-up)的眼动触发逻辑,在复杂真实工作流中可能并不总是最佳。论文据此强调,未来可考虑引入结合任务优先级的自上而下(top-down)机制,以便仅在特定次级任务期间提示被忽视画面,或对高优先级摄像机实施预设提醒。
硬件层面的反馈同样具有重要启示。用户提到HoloLens 2的手部菜单有时会在双手进入视野时意外弹出,甚至造成误触,影响通知设置;设备重量与面罩轻微着色也会影响部分其他操作,例如查看较暗的电话显示界面。这些问题并非完全源于Scantracker算法本身,而是与当前MR集成平台密切相关。研究因此指出,现场研究的核心价值之一正在于暴露实验室环境中难以充分识别的设备与交互问题,为后续技术迁移和界面优化提供依据。另一个积极发现是,随着使用次数增加,参与者对系统启动、模式切换、故障排查以及场景识别检查等流程逐渐熟练,说明该工具存在一定学习适应过程。
论文讨论部分指出,本研究最重要的发现之一,是在真实机场运行控制中心中,Scantracker能够在不显著增加主观工作负荷的前提下,为监控任务提供一定支持,尤其体现在帮助操作员关注被忽视摄像机、提升对自身监控行为的觉察方面。与既往实验室研究相比,当前现场研究中报告的工作负荷总体更低,这既与真实工作场景中任务节律不同有关,也说明实验室模拟结果不能完全替代现场评估。研究同时强调,辅助工具的感知效用依赖于用户经验水平与任务压力。对于经验丰富的操作员,系统在常规场景中的帮助可能有限;但在高负荷条件下,或在新手培训中,Scantracker可能具有更明显的应用价值。尤其在培训场景下,眼动追踪可用于促进更优监控策略的形成,例如更均衡的画面巡视策略。
在方法学层面,作者将本研究界定为以用户为中心设计过程中的关键现场评估步骤。通过在真实工作环境中开展部署测试,研究人员不仅获得了有关工作负荷、人体工效学和效用感知的数据,也捕捉到系统与既有工作流交互的细节、用户适应过程以及突发技术问题。这些都是提升技术成熟度所不可或缺的信息。论文特别指出,尽管现场研究常受样本量小、实验控制弱、安全与保密限制多等挑战影响,但其生态效度高,能够为智能辅助系统的实际可用性与可接受性提供更可靠证据。
研究局限方面,作者明确说明本研究采用准实验设计,未进行随机分配,也难以控制工具使用时点与现场任务状态,因此对因果效应和外推性应保持谨慎。样本量较小也是典型的现场研究限制。不过,研究通过定量与定性相结合的混合方法在一定程度上弥补了这一不足,使研究结论更具情境解释力。未来工作将需要在更大样本和纵向设计中,进一步评估MR决策支持工具对监控绩效、工作负荷与用户体验的长期影响,并探索对不同MR硬件平台的适配,以及对通知策略进行情境化和个体化调整的可能性。
论文结论部分可概括为:本研究提出了一种用于测试和分析终端用户对原型化注视感知支持工具感知的方法,该工具旨在增强安防监控。依据用户反馈,Scantracker似乎能够为摄像机监控提供适当支持,但与人体工效学及使用情境相关的若干组成部分仍需优化。未来开发可纳入对特定监控区域的自上而下优先级设定。后续研究将致力于进一步调整该工具,并在更大样本和包含客观绩效指标的条件下开展实证研究,以检验Scantracker在减轻监控操作员认知负担并维持有效监控行为方面的潜力。