信任度上升,关注度下降:接触与教育在推动自动驾驶发展中的不同影响
《Frontiers in Computer Science》:Trust rises, attention falls: divergent effects of exposure and education in driving automation
【字体:
大
中
小
】
时间:2026年04月21日
来源:Frontiers in Computer Science 2.7
编辑推荐:
摘要
引言:在汽车系统控制转向和速度的情况下,监督二级自动化功能的驾驶员必须保持情境意识。对系统的信任度校准不当可能导致过度依赖和监控失误,而信任度不足则可能导致系统被闲置。长时间进行监督与思维分散增加有关,这会减慢对关键事件的反应速度。本研究测试了简短的教育干预是否会影响二
摘要
引言:在汽车系统控制转向和速度的情况下,监督二级自动化功能的驾驶员必须保持情境意识。对系统的信任度校准不当可能导致过度依赖和监控失误,而信任度不足则可能导致系统被闲置。长时间进行监督与思维分散增加有关,这会减慢对关键事件的反应速度。本研究测试了简短的教育干预是否会影响二级驾驶过程中的信任度、注意力以及接管准备情况。我们关注简短干预,是因为驾驶员在采用驾驶自动化系统时通常接受的是时间有限的入职培训。
方法:55名没有二级自动化实际操作经验的持证驾驶员完成了一次15分钟的自动高速公路驾驶测试。参与者接受了最低限度的指导(基础培训)、基于能力的教育(知识导向)或基于限制的教育(规则导向)。信任度在四个时间点进行了测量;此外还收集了自我报告的思维分散情况、注视行为和接管反应时间的数据。
结果:所有组的信任度都随时间显著增加,且教育方式并未改变这一趋势。基于能力的教育在两个经过错误发现率校正的指标上增强了人对人机界面的监控,并比基于限制的教育产生了更快的接管反应(与基础培训无差异)。在参与者中,信任度的增长与更高的思维分散程度相关,而更有结构的注视行为则与较低的思维分散程度相关。
讨论:总体而言,信任度的形成主要与直接的系统性能体验有关,而针对性的教育则细化了驾驶员监控的内容和反应速度。这些结果说明,经验是建立信任的基础,而教育则选择性地提高了对自动化的注意力和响应准备度。这些发现明确了经验和简短教育在监督自动化中的不同作用,并对驾驶员培训、人机界面设计和基于注视的监控具有指导意义。
1 引言
二级驾驶自动化(根据美国汽车工程师学会SAE International 2021年的定义)结合了纵向控制(自适应巡航控制)和横向控制(车道保持辅助),旨在减轻驾驶员持续手动转向和速度调整的负担。尽管有这些操作支持,二级系统仍明确要求持续的人工监督,因为自动化可能会遇到超出其设计范围或能力的情况。因此,驾驶员必须随时准备好在接收到接管请求或交通条件超出系统限制时立即恢复手动控制。在此背景下,接管性能通常表现为接管请求与驾驶员首次执行手动控制之间的延迟时间,这反映了重新参与驾驶任务的准备程度(Merat等人,2014;Gold等人,2013;Eriksson和Stanton,2017)。
这种监督角色带来了基本的人员因素挑战。在长时间自动化过程中保持持续的监控在心理上非常耗费精力,尤其是在系统表现可靠且任务提供的认知刺激有限的情况下(Warm等人,2008)。在这种条件下,驾驶员可能会过度依赖自动化,导致对道路环境的视觉扫描减少,以及在需要干预时反应变慢(Parasuraman等人,1993;Parasuraman和Riley,1997;Inagaki和Itoh,2013)。日本的道路安全举措,包括国土交通省(MLIT)的先进安全车辆(ASV)计划,已将适当的人工监督视为政策优先事项。类似的问题也体现在国际框架中,例如欧盟的“Vision Zero”战略以及联合国到2030年将全球道路交通事故伤亡人数减少50%的承诺。
尽管在自动化设计方面取得了进展,但人们对用户如何有效监督此类系统的理解仍然有限。本研究通过探讨驾驶前的教育方式如何影响二级自动化过程中的信任度、注意力和接管准备情况来填补这一空白。它探讨了有针对性的指导是否能够塑造驾驶员的心理模型,并减轻先前的研究中观察到的注意力漂移现象。
对于二级系统,很少提供长时间的驾驶员教育。目前的入职培训主要是非正式的,依赖于被动材料或自学:大多数驾驶员报告说他们是通过试错、手册或用户指南来学习的,只有少数人接受经销商的指导(Harms等人,2020;Oviedo-Trespalacios等人,2021;DeGuzman和Donmez,2021)。鉴于这些方法提供的详细解释时间有限,因此确定即使是最低限度的驾驶前教育是否也能影响用户对自动化的信任度和监督方式至关重要。这一挑战呼应了Bainbridge(1983)描述的自动化悖论:系统越可靠,人类操作员的监控角色就越关键和困难。随着自动化处理常规控制,驾驶员被留给监督罕见但安全关键情况的任务,往往没有足够的机会来维持必要的监控和手动控制技能。这些悖论在现代驾驶自动化中尤为明显,因为持续的可靠性可能会侵蚀警觉性并延迟干预。
在监督任务中,对自动化的信任度在驾驶员如何分配注意力和努力方面起着核心作用(Lee和See,2004)。在这里,信任指的是当结果不确定或情况涉及风险时,人们相信自动化系统会支持他们的目标。信任度影响人们选择如何与自动化互动、依赖或避免自动化。当信任与系统能力相匹配时,驾驶员更有可能保持适当的警觉性。信任度校准不当会增加安全风险:过度信任可能导致自满和监控减少(Parasuraman和Riley,1997;Parasuraman等人,1993),而信任度不足则可能导致系统被闲置,即驾驶员即使自动化可以提供帮助也避免使用它(Lee和See,2004;Parasuraman和Riley,1997)。
在驾驶自动化中,信任度校准面临特殊挑战,因为对系统能力的错误假设可能导致立即的安全风险(Khastgir等人,2018;Inagaki和Itoh,2013)。正如Inagaki和Itoh(2013)指出的,驾驶员可能会过度信任系统,从而导致过度依赖和干预延迟。与受控工业领域的自动化不同,驾驶自动化在动态且不可预测的交通环境中运行,这些环境不断考验系统的边界(Campbell等人,2018)。这种不确定性要求驾驶员不仅要了解自动化在理想条件下的性能,还要了解其性能如何随着环境复杂性的增加而下降(Khastgir等人,2018)。
Endsley(1995b)的三层次情境意识框架为理解驾驶员如何保持有效监督提供了基础模型,该框架区分了环境元素的感知、它们与目标的关联以及对其未来状态的预测。维持这些层次对于安全监督控制至关重要,并为后续的理论发展奠定了基础,包括本研究中采用的情境意识差异模型。信任的理论模型有助于解释这些机制。Confidence, Awareness, Understanding, Satisfaction, and Enactment(CAUSE)模型(Rowan,1991)是一个结构化的风险沟通框架,展示了如何通过顺序信息传递建立信任和支持行为改变。沟通者首先建立信任,然后提高风险意识,促进对解决方案的理解,接着促进满意度,最后鼓励采取行动。在驾驶员教育的背景下,这表明信息的排序和框架不仅决定了内容,还影响了用户如何形成和校准信任。相比之下,信任校准模型(Lee和See,2004;Hoff和Bashir,2015)描述了用户通过将观察到的系统行为与先前的预期进行比较并相应调整信任的反馈过程(Merritt和Ilgen,2008)。这些经验机制与教育过程同时作用,教育过程在互动开始前形成最初的预期。Malleable Attentional Resources Theory(MART)(Young和Stanton,2002;Warm等人,2008)进一步解释了一致的系统性能如何逐渐压缩注意力资源。当系统无误运行时,监控活动会简化为在常规条件下足够用的简短扫描程序,但在罕见的关键事件发生时可能不足(Parasuraman等人,1993;Parasuraman和Riley,1997;Warm等人,2008)。
实证研究支持这些理论解释(Hoff和Bashir,2015;Gold等人,2015)。研究表明,教育信息和直接的操作经验都可以影响信任的发展,尽管这些影响的相对强度尚待确定(K?rber等人,2018;Merritt和Ilgen,2008)。在长时间接触一致的系统性能后,驾驶员减少了对前方道路的视觉注意,更频繁地从事次要任务,并对意外的接管请求反应更慢(Louw和Merat,2017;Merat等人,2014;Gold等人,2013)。即使驾驶员被明确要求保持警觉,这种模式仍然存在,表明经验学习在持续与自动化互动过程中具有强烈影响(Gold等人,2013;Hoff和Bashir,2015)。
除了信任动态之外,还有一个相关挑战是单调监督期间注意力自然倾向于漂移。思维分散指的是注意力从外部任务转向自我产生的想法和情感。在本文中,我们将思维分散与更广泛的注意力漂移现象区分开来。注意力漂移是指在低需求自动化监督期间主动任务监控的逐渐减少,而思维分散特指与任务相关的注意力相竞争的内部生成的想法。这种状态在低刺激环境中很常见,并对持续表现带来可测量的代价(Smallwood和Schooler,2015)。在手动驾驶研究中,思维分散与驾驶员行为的变化和反应能力的降低有关,反映了注意力从外部驾驶环境向内部生成的思维的转移(He等人,2011;Baldwin等人,2017)。接管研究的证据进一步表明,当驾驶员没有积极监控时反应更慢,强调了注意力漂移的安全相关性(Eriksson和Stanton,2017)。
驾驶自动化通过减少即时任务需求创造了鼓励注意力漂移的条件。手动控制的减少和系统的可预测行为降低了即时任务需求,可能会使注意力从道路上转移(Merat等人,2019)。这种低刺激环境已知会增加思维分散(Smallwood和Schooler,2015)。实证研究表明,自动驾驶改变了与手动控制相比的视觉监控模式,表明监督注意力的变化(Louw和Merat,2017)。当注意力转向内部时,驾驶员通常需要更多时间来重新参与场景并采取行动,这种模式与监控减少时更长和更不确定的接管反应一致(Eriksson和Stanton,2017)。从眼睛注视中得出的视觉注意力模式提供了可以作为注意力投入的代理指标(Underwood等人,2003)。结构化的视觉扫描,其特征是在前方道路、后视镜和外围区域之间的系统转换,反映了对该交通环境的主动监控(Underwood等人,2003)。相比之下,碎片化或无系统的扫描模式表明情境意识和注意力脱离(Louw和Merat,2017;Schnebelen等人,2020)。最近应用了一阶马尔可夫链分析来量化注视转换的组织,使研究人员能够描述驾驶员在自动化下的监控模式(Rabiner和Juang,1986;Schnebelen等人,2020;Chouchane等人,2026)。为了客观地研究这些监督行为,本研究使用眼动追踪指标分析了自动化监督期间预定义兴趣区域之间的注视转换。
鉴于信任度校准不当和注意力漂移的挑战,驾驶员教育提供了一种潜在有价值的干预措施,有助于在自动化监督期间支持适当的信任度和持续注意力。知情安全的概念强调用户应接收关于自动化能力和限制的清晰、全面的信息,以便适当校准信任(Campbell等人,2018;Khastgir等人,2018)。因此,有效的教育不仅包括操作指令,还包括对传感原理、边界条件和预期驾驶员角色的理解。这些知识有助于形成现实的心理模型,并帮助避免在监督自动化时的过度信任和系统闲置。
我们介绍了两种不同的二级监督教育框架:基于知识的教育(能力导向)和基于规则的教育(限制导向)。这种区分基于认知控制和监督行为的成熟模型。Rasmussen的Skills-Rules-Knowledge框架(Rasmussen,1983)区分了能力导向的行为(在 unfamiliar 或可变情况下依赖对系统内部模型的推理)和限制导向的行为(将存储的程序应用于熟悉的信号和边界条件)。在驾驶自动化中,基于能力的信息可以帮助驾驶员构建关于系统如何感知和控制车辆的心理模型,这与认知负荷理论强调的支持模式构建和系统结构理解的教学一致(Sweller等人,2011)。这种理解有助于 Lee和See 所指出的信任校准的基础:过程信息和目的信息。相比之下,以限制为重点的信息突出了自动化性能可能下降的情境,以及驾驶员需要采取的行动,强化了对边界条件的准备意识,有助于降低过度信任的风险(Rasmussen, 1983; Lee and See, 2004)。因此,这些框架针对的是互补的认知途径——概念理解和条件反应——这些途径可能会影响驾驶员在监督过程中如何监控系统并为干预做准备。以往关于自动化背景下教育框架的研究结果不一。一些研究表明,提供关于系统限制的清晰信息可以减少不当依赖并支持监控(DeGuzman et al., 2020; K?rber et al., 2018)。其他研究则强调,信任校准在很大程度上受到使用过程中的性能反馈的影响,这可能会限制短暂驾驶前指导的持久效果(Hoff and Bashir, 2015)。从方法论上讲,许多研究评估的是即时、短期的影响,而不是长期暴露于自动化环境后信任和监控行为的演变(Gold et al., 2015)。总的来说,这些观察结果强调了需要检验有针对性的教育干预是否能够改变在持续自动化过程中的信任和注意力过程。
在此背景下,本研究探讨了这些不同的教育框架是否会影响信任的发展、通过注视行为体现的注意力管理,以及在二级自动化过程中的接管准备情况。基于先前证据表明,长期暴露于自动化性能可能会降低监控模式(Louw and Merat, 2017; Merat et al., 2014; Cooper et al., 2023),我们调查了有针对性的驾驶前指导是否可以通过塑造驾驶员的预期、心理模型和监督策略来缓解这些影响。我们采用了之前研究中引入的情境意识差异模型(Chouchane et al., 2022),该模型将驾驶员监督定义为驾驶情境所需的情境意识(α)与驾驶员实际实现的情境意识(α′)之间的差异。假设教育干预能够维持α′(即实现的监控)在适当的水平上,从而减少差异δ = α ? α′。这一模型扩展了Endsley(1995b)的三级情境意识框架的逻辑,将监督注意力表示为规范监控需求与驾驶员描述性行为之间的可测量平衡。它也与监控与响应任务(MART)框架(Young and Stanton, 2002; Warm et al., 2008)以及Parasuraman和Riley(1997)关于自动化使用、误用和废弃的分类法相一致,将认知状态动态与可观察的注视模式联系起来。在这个模型中,我们区分了信任校准(反映驾驶员如何感知和内化系统的可靠性和限制)和以能力为重点的监控策略(决定他们如何视觉分配注意力和验证驾驶场景)。这些组成部分可能通过部分独立的途径对教育框架作出反应:信任主要通过累积的性能反馈发展,对短暂指导可能不太敏感(Hoff and Bashir, 2015; Merritt and Ilgen, 2008),而监控策略可能更容易适应有针对性的指导(K?rber et al., 2018)。
为了测试这些效应,实验采用了三组教育条件之间的被试间设计。基本指导条件(参考条件)提供了当前入职培训中典型的最少信息,而以能力和限制为重点的条件则反映了上述以能力和限制为重点的框架。在整个80分钟的会话中,分别在四个时间点测量了信任水平,以捕捉指导后的即时效应以及自动化暴露期间的后续演变(Gold et al., 2015)。其他测量指标包括心旷神怡现象(Smallwood and Schooler, 2015)、使用注视转换分析的视觉扫描模式(Schnebelen et al., 2020; Underwood et al., 2003),以及在关键接管事件期间的反应时间(Gold et al., 2013; Lu et al., 2017)。
指导这项研究的核心问题是:
(1)驾驶员教育的框架如何影响在监督二级驾驶自动化过程中信任动态的变化?
(2)指导框架是否会影响驾驶员在监督自动化时的心旷神怡倾向?
(3)不同的教育方法是否会影响监督过程中的视觉扫描模式?
(4)不同的教育方法是否会影响接管性能?
(5)信任发展、注意力分散和接管准备情况之间是否存在关联?
最后,为了探讨教育框架如何影响二级驾驶自动化中的监督,我们根据研究问题提出了一系列假设,并基于已建立的理论模型和先前的实证证据进行了推导。
H1.1(信任轨迹):预计随着对自动化系统的重复暴露,信任评分从基线(T1)到驾驶后评估(T4)会显著增加(Lee and See, 2004; Hoff and Bashir, 2015)。
H1.2(教育对信任发展的影响):教育框架预计会影响信任随时间的发展(从T1到T4)。以限制为重点的指导通过提高对边界线的理解来促进更好的信任校准(DeGuzman et al., 2020),而累积的可靠经验可能会抵消短暂指导的效果(Lee and See, 2004; Hoff and Bashir, 2015)。
H2(教育对心旷神怡的影响):以限制为重点的教育预计会通过鼓励积极监控和维持实现的监控努力(α′)来减少心旷神怡现象,从而减少先前研究中定义的情境意识差异(δ = α ? α′)(Chouchane et al., 2022)。这一预测与情境意识和警觉性的理论一致,这些理论认为,在长时间自动化过程中,更高的监控参与度可以保持注意力资源(Endsley, 1995b; Young and Stanton, 2002)。
H3(教育对注视行为的影响):以限制为重点的教育预计会产生更结构化的注视模式,表现为更频繁地回到道路中心,并减少外围注意力(Price et al., 2019; Chouchane et al., 2022)。
H4(教育对接管性能的影响):接受以限制为重点教育的参与者在接管任务中的反应时间预计会更短,这与持续注意力参与度和提高的情境意识有助于及时干预的证据一致(Endsley, 1995b; Greenlee et al., 2018)。
H5.1(信任-心旷神怡关系):预计更大的信任发展(从T1到T4的变化)会与心旷神怡现象呈正相关,因为对系统可靠性的信心增加会降低感知的监控需求(Lee and See, 2004; Parasuraman and Riley, 1997; Hergeth et al., 2016; Walker et al., 2019)。
H5.2(心旷神怡-注视关系):预计较高的心旷神怡得分与较不结构化的扫描模式相关,包括较少的回到道路中心的注视和更多的外围瞥视(Louw and Merat, 2017; Merat et al., 2014)。
这些假设通过将教育框架、信任校准、注意力状态、注视行为以及二级自动化过程中的接管性能联系起来,从而回答了上述研究问题。
2. 材料与方法
2.1 参与者
数据来自55名参与者,他们是由日本汽车研究所(JARI)委托的第三方机构招募的。所有参与者都报告说没有之前使用二级自动化系统的经验,因此在测试时代表了自动化新手样本。研究旨在每个教育条件下大约有20名参与者,以提供平衡的设计并合理地检测中等到大的效应。参与者被随机分配到三个组:基本教育组(n = 20)、以能力为重点的组(方法1,n = 15)和以限制为重点的组(方法2,n = 20)。轻微的不平衡是由于出勤的常规变化和提前退出造成的,而不是任何计划中的分配差异。
在最终样本的55名参与者中,16名为女性,39名为男性(表1)。各组之间的性别分布大致相当:基本教育组有6名女性和14名男性,以能力为重点的组有5名女性和10名男性,以限制为重点的组有5名女性和15名男性。按教育组划分的年龄和自报的年驾驶里程见表2。
表1 性别与教育条件的参与者分布
B:基本教育;M1:以能力为重点的教育;M2:以限制为重点的教育
表2 按教育条件划分的年龄(岁)和年驾驶里程(公里)
统计量 BM1 M1 M2
有效案例 20 15 20
缺失值 0 0 0
平均值 40.2 6.7 3.6
标准差 11.6 10.2 10.9
25百分位数 30 29 34.5
50百分位数 39 36 43
75百分位数 49 42.5 24.2
所有参与者在研究前都提供了知情同意书。协议已经得到了JARI研究伦理委员会的审查和批准。没有保留任何个人身份数据;所有数据集都使用数字标识符进行了匿名处理。
2.2 实验设计
研究采用了3 × 4的混合因子设计,其中教育条件(基本、以能力为重点、以限制为重点)作为被试间因素,时间(T1、T2、T3、T4)作为被试内因素,对应于会话过程中的四个测量点。这种结构(图1)允许检验教学框架在自动化体验中的即时和演变效应,捕捉信任校准和行为结果的变化。
图1 实验设计。被试间因素:教育条件(基本、方法1、方法2)。被试内因素:时间(T1至T4)。箭头表示每个参与者在四个时间点的重复测量。
2.3 教育干预
教育简报旨在考察不同的沟通策略如何塑造驾驶员对自动化的理解及其对系统行为的预期。每个简报都传达了相同的核心信息内容:自动化支持驾驶,但仍需要人工监督。简报在教学重点上有所不同(以能力为重点与以限制为重点的框架)。指导问题是:如何传达有关系统能力和限制的信息以适当调整驾驶员的预期?
教育内容通过 standardized 的口头和书面简报传递给参与者。三种条件在持续时间和传递格式上保持一致,而在教学重点(以能力为重点与以限制为重点的框架)上有所不同。
基本教育(参考条件):参与者仅获得了当前车辆手册或驾驶前解释中通常提供的最少信息。简报内容为:“您今天将使用的驾驶自动化系统是一个部分自动化的驾驶系统。当系统激活时,车辆可以在没有踏板或转向操作的情况下自动行驶。但是,驾驶员必须监控道路和周围环境。当出现警报时,您必须接管车辆的控制。” 这一条件作为一个参考点,反映了最小的入职信息。
以能力为重点的教育(方法1):该简报解释了自动化系统的工作原理及其对周围环境的感知。它描述了系统在高速公路上控制转向和速度的能力,以及前后摄像头如何检测周围的车辆和障碍物。参与者被告知系统的准确性取决于图像质量,这在恶劣天气中可能会下降。他们被告知,当系统达到其操作极限时,会发出警报并解除控制,尽管如果感测受损,警报可能会延迟。这种教育旨在建立对系统工作原理及其在某些条件下性能变化的总体理解。视觉辅助工具说明了摄像头的位置和传感器覆盖范围。完整脚本见附录4.12.2。
以限制为重点的教育(方法2):该简报传达了与方法1相同的核心信息,但重点关注操作边界。它解释了系统在正常交通和天气条件下的转向和 pedals 控制,并能在车道内调整速度,最高可达100公里/小时。参与者被告知,在雨天或雾天能见度降低可能会影响传感器性能并延迟警报。该信息强调,当系统达到其极限时,会发出警报并解除控制。视觉辅助工具展示了恶劣天气如何影响传感器。这种框架鼓励驾驶员监控情况并在必要时准备接管控制。完整脚本见附录4.12.3。
所有简报均由同一实验者使用标准化脚本进行,以确保一致性。每个简报大约持续5分钟。参与者不知道存在不同的教育版本,也不知道研究正在考察信任校准。
这些框架基于Rasmussen的技能-规则-知识框架(Rasmussen, 1983)。以能力为重点的条件提供了关于系统如何感知环境和控制速度及转向的概念信息。以限制为重点的条件强调了操作边界、环境限制以及驾驶员在感测受损时进行干预的责任。基本条件仅提供了当前入职培训中典型的最少信息。这些区别使我们能够测试不同类型的驾驶前信息如何在二级自动化过程中塑造监督。
2.4 驾驶模拟器环境和关键场景
实验使用的是日本汽车研究所的全向驾驶模拟器,这是一个高保真系统,配备了一个安装在运动平台上的完整车辆驾驶舱和360度视觉投影(图2)。模拟器提供了真实的车辆动态,包括加速、制动和横向移动的运动提示,增强了驾驶员在自动化监督和接管事件中的生态有效性。
图2 日本汽车研究所(JARI)使用的全向驾驶模拟器设置。插图显示了模拟器设置(a)和投影环境(b)。
模拟环境描绘了一个双向、二车道的日本高速公路,中间有隔离带,交通密度适中。交通由计算机控制的车辆组成,这些车辆被编程为保持真实的速度和跟车距离。二级自动化系统在15分钟的自动驾驶过程中控制了模拟车辆的转向和速度,保持车辆在中间车道上以大约80公里/小时的速度行驶,并调整速度以保持与前方车辆的安全跟随距离。在15分钟自动驾驶时段结束时,发生了一个关键的接管场景(图3):前方车辆进行了紧急制动操作,超出了系统的制动能力。系统发出了视觉和听觉接管请求,要求驾驶员重新接管并施加制动以避免碰撞。这个场景旨在评估驾驶员在长时间自动化监控后对安全关键事件的干预准备情况。
2.5 测量和数据收集
2.5.1 对自动化的信任
对驾驶自动化系统的信任度使用与Abe等人(2017年)相同的问题进行测量。参与者根据“当前您对驾驶自动化系统的信任程度如何?”的提示,在一个从0到100的连续量表上做出评分,其中0表示“完全不信任”,100表示“完全信任”。该问题用日语提出,原始的日语和英语版本分别提供在附录4.10中。得分越高,表示对自动化的主观信任度越高。数据在实验的四个时间点收集:基线(T1)、教育环节后(T2)、练习驾驶后(T3)以及自动驾驶环节后(T4)。这样的时间安排旨在捕捉教育的即时效果以及通过与自动化系统的直接互动后所发生的后续变化。选择了一个简洁的单项量表,以便在不中断驾驶任务的情况下进行重复测量,这与先前的研究结果一致,即简单的评分量表可以有效捕捉对自动化信任度的即时变化(Lee和Moray,1992;Muir,1996)。
2.5.2 思维奔驰
思维奔驰使用了一个单项回顾性量表进行测量,该量表改编自Mars等人(2014年)的研究,并已翻译成日语。在接管事件发生后,参与者立即回答了以下问题:“与手动驾驶相比,在自动驾驶期间(在警报发出之前),您有多少时间思考与驾驶无关的事情?”他们在一条从0%(“像手动驾驶时一样始终思考驾驶”)到100%(“从未思考驾驶”)的连续横线上做出回答。完整的英语和日语版本提供在附录4.11中。选择回顾性自我报告方法是为了保持自动驾驶体验的自然流程,并避免使用可能干扰认知处理和改变任务投入的侵入性探查技术(Endsley,1995a,1988)。这种格式允许参与者反思整个自动驾驶过程中的注意力分布,而不仅仅是在特定时刻。正如Smallwood和Schooler(2015)所指出的,思维奔驰是一种内在的、主观的状态,通过自我报告最为有效地进行研究,尤其是在研究人员希望捕捉注意力的一般波动而不干扰任务表现时。尽管回顾性报告依赖于记忆并且可能存在估计误差,但在这里这种方法适用,因为它保持了未受干扰且真实的监控环境。因此,它提供了 participants 在自动化过程中整体注意力分散的生态学上有效的测量。
2.5.3 注视行为
在整个自动驾驶过程中,使用头戴式的NAC EMR-9系统以60赫兹的频率记录了眼球追踪数据。注视坐标根据ISO 15007:2020标准,逐帧手动注释到九个预定义的兴趣区域(AOIs)中。AOI的定义、逐帧注释协议和转换概率构建程序遵循我们之前报告的转换分析流程(Chouchane等人,2026)。这些区域包括道路中心(RC;AOI 1)、后视镜(RVM;AOI 2)、右侧后视镜(AOI 3)、左侧后视镜(AOI 4)、人机界面(HMI;AOI 5)、右侧视野(RP;AOI 6)、左侧视野(LP;AOI 7)、驾驶员侧窗口(AOI 8)以及其他场景区域(AOI 9)(图4)。AOIs由一名经过培训的注释者根据预定义的注释协议逐帧手动注释,对于有歧义的帧制定了决策规则,以确保一致性,尽管存在头部移动的干扰。注释工作流程和质量控制程序的详细信息在我们的转换分析流程描述中有所报告(Chouchane等人,2026)。
2.5.4 接管性能
接管性能使用系统识别反应时间(SRRT)指标进行评估,该指标定义为接管请求(TOR)开始与驾驶员首次输入超过自动化解除阈值之间的时间间隔。自动化解除定义为驾驶员输入超过大约10%的油门行程、5%的刹车行程或5牛顿米的转向扭矩,这标志着有效地重新接入手动控制。这些阈值对所有参与者一致应用,以确保SRRT值的可比性。
2.6 程序
每次会话都遵循一个标准化的80分钟协议,旨在捕捉自动化体验所有阶段的行为、生理和自我报告数据,同时确保参与者的舒适度。图6展示了包括教育干预、模拟器熟悉、练习驾驶、主要自动驾驶和关键接管事件在内的完整80分钟会话序列的时间线(T1至T4)。在关键阶段之前和之后分别进行了信任度调查(T1至T4),并在会话结束时完成了回顾性思维奔驰问卷。该程序确保了参与者之间的时间一致性,同时保持了真实感和舒适度。参与者到达模拟器设施后,提供了书面知情同意书并完成了人口统计问卷。然后会话按以下顺序进行:
T1(基线信任度测量):参与者在收到任何详细系统信息之前,首先评估他们对自动化的初始信任程度。
教育干预和T2(教育后信任度):参与者被随机分配到三种教学条件之一(基础型、能力聚焦型或限制聚焦型;见第2.3节)。实验者在参与者坐在 briefing 室内时进行了讲解。讲解结束后,参与者立即给出了第二次信任度评分(T2),以评估教育内容的即时效果。
模拟器熟悉:参与者随后移动到驾驶模拟器,并完成了一段简短的手动驾驶,以适应模拟器的转向和踏板动态,减少新奇感的影响。
练习驾驶和T3(练习后信任度):参与者在一段简短的、非关键的直线高速公路路段上进行了二级自动化操作。这一阶段提供了系统操作和人机界面的实际体验,之后立即收集了第三次信任度评分(T3)。
眼球追踪校准:在主要驾驶之前,使用NAC EMR-9系统对每位参与者进行了9点校准,以确保数据收集期间的准确性。
主要自动驾驶:参与者在模拟的高速公路上监督二级自动化系统约15分钟,交通情况适中。其中嵌入了几次非关键的交通互动,以保持生态学上的有效性,并记录了连续的眼球追踪和车辆控制数据。参与者被指示监控系统并随时准备重新接管控制。
关键接管场景:在自动驾驶时段结束时,前方车辆突然制动,触发了一个视觉和听觉接管请求,提示驾驶员重新接管。接管反应时间由模拟器自动记录。
T4(驾驶后信任度和思维奔驰评估):在接管事件发生后,参与者完成了最终的信任度问卷(T4)和回顾性思维奔驰测量。随后进行了结构化访谈,以收集关于自动化体验的定性反馈。
2.7 统计分析
所有分析都根据数据特征采用了标准参数和非参数方法。在假设检验之前对异常值进行了筛选,并对数据的正态性、球形性和方差同质性进行了假设检验。当Mauchly的检验表明球形性不成立时,应用了Greenhouse-Geisser校正,并报告了调整后的自由度和epsilon(ε)值。Levene的检验验证了这些组间比较满足了方差相等的假设。
2.7.1 信任发展
信任度评分使用双向重复测量ANOVA进行分析,时间(T1至T4)作为被试内因素,教育条件(基础型、能力聚焦型或限制聚焦型)作为被试间因素。在需要时应用了Greenhouse-Geisser校正,效应量以偏eta平方(η2pηp2)的形式报告。
2.7.2 思维奔驰
使用单向ANOVA比较了不同教育组之间的自我报告的思维奔驰分数(MWS)。Pearson相关性用于评估思维奔驰、信任度变化(T4减去T1)、注视指数(RRC、SSI)和接管反应时间(SRRT)之间的关联。效应量以Pearson的r表示。
2.7.3 注视行为
监督性注视指标的分析中,教育条件作为被试间因素。由于数据非正态性,使用了Kruskal-Wallis检验来评估预先注册的扫描复合指标(RRC、SSI);当假设满足时,使用单向ANOVA分析HMI聚焦指标(TGT5、MGD5、MGR5),否则使用Kruskal-Wallis检验。事后比较采用了Benjamini-Hochberg错误发现率(FDR)控制(Benjamini和Hochberg,1995)。报告了未调整的p值和调整后的qBH值。Pearson(或适当时使用Spearman)相关性用于评估注视指标和思维奔驰之间的关联。
2.7.4 接管性能
接管性能使用系统识别反应时间(SRRT)指标进行评估,该指标定义为接管请求(TOR)开始与驾驶员首次输入超过自动化解除阈值之间的时间间隔。自动化解除定义为驾驶员输入超过大约10%的油门行程、5%的刹车行程或5牛顿米的转向扭矩,这标志着有效重新接入手动控制。这些阈值对所有参与者一致应用,以确保SRRT值的可比性。
2.6 程序
每次会话都遵循一个标准化的80分钟协议,旨在捕捉自动化体验所有阶段的行为、生理和自我报告数据,同时确保参与者的舒适度。图6展示了包括教育干预、模拟器熟悉、练习驾驶、主要自动驾驶和关键接管事件在内的完整80分钟会话序列的时间线。使用Spearman相关性检验了SRRT(系统识别反应时间)、心神游离和注视指标之间的关系。效应量以基于等级的epsilon-squared (ε2rankεrank2) 表示(用于Kruskal-Wallis检验)和Spearman的ρ表示(用于相关性)。所有检验均为双尾检验,α水平为0.05。效应量解释如下:ANOVA用η2p表示,非参数分析用ε2rankεrank2表示,相关性用r表示。
3 结果
3.1 不同时间和教育条件下的信任发展
本节讨论了RQ1(信任动态)并评估了H1.1-H1.2。
重复测量ANOVA(表3)的结果支持H1.1(时间的主效应)和H1.2(时间×组),这两个都涉及被试内因素时间。被试间检验的结果(表4)涉及H1.2的组间成分(组的主效应)。Levene检验验证了这些组间比较满足方差相等的假设。
表3
情况 球形性校正 平方和 自由度 均方 F p η2p ε2rankεrank2
时间 Greenhouse-Geisser 71 31 1.028 1.694 4.209 9.356 <0.001 0.092
时间×组 Greenhouse-Geisser 54 0.780 3.388 15.960 0.802 0.509 0.007
残差 Greenhouse-Geisser 16 51 6.190 8.301 19.865 –––
表4
重复测量ANOVA的结果,显示了被试内因素对时间信任的影响,自由度经过Greenhouse-Geisser校正。
3.1.1 时间的主效应(H1.1)
以时间为被试内因素、教育组为被试间因素的重复测量ANOVA显示,时间对信任评分有显著的主效应,F(1.694, 83.010) = 21.156,p < 0.001,部分η2 = 0.092(经过Greenhouse-Geisser校正)(表3)。描述性分析表明,从初始时间点(T1)到最终评估(T4),所有教育组的信任评分都呈持续上升趋势(见图7)。基础组的信任评分从T1的M = 58.50(SD = 19.54)上升到T4的M = 68.00(SD = 16.73)。方法1组的信任评分从M = 50.67(SD = 19.81)上升到M = 64.00(SD = 22.30),而方法2组的信任评分从M = 52.25(SD = 18.39)上升到M = 71.75(SD = 13.70)。各组和时间的描述性统计数据见表5。这些发现支持H1.1的假设,即随着参与者对自动化系统的熟悉度增加,信任会在基线(T1)到接管阶段(T4)期间上升。
图7
各教育组(基础组,M1组,M2组)的信任轨迹(T1至T4)。
表5
信任评分的时间点统计:T1、T2、T3、T4
基本组 20 58.5 0.75 2.36 0.05 6.05 7.56 8.56 8.07 0.36 8.06 4.07 1.8
标准误差 4.37 5.1 4.1 3.9 5.5 3.5 4.4 3.4 5.7 3.0 6
标准差 19.5 19.8 18.4 17.8 1.7 5.9 19.8 19.0 15.4 6.7 2.3 3.7
3.1.2 教育组效应(H1.2)
总体而言,不同教育组的信任没有显著差异,F(2,49) = 0.621,p = 0.541,η2p=0.015(表4)。时间×组的交互作用也不显著,F(3.388,83.010) = 0.802,p = 0.509,η2 = 0.007(表3),这表明教育框架并未导致信任随时间的演变有显著差异。这些结果不支持H1.2的假设,即教育框架会影响信任随时间的发展(T1至T4)。
3.2 驾驶员教育和心神游离
本节讨论了RQ2(心神游离)并评估了H2,随后讨论了H5.1(关系)。
在确定了信任发展的总体模式后,我们进一步探讨了教育干预是否会影响自动化监控期间的心神游离。
3.2.1 教育组对心神游离的影响(H2)
单向ANOVA检验了T4时刻自我报告的心神游离评分(MWS)的差异。分析显示,各组之间没有显著差异,F(2,52) = 1.571,p = 0.218,η2 = 0.057(表6)。描述性数据显示,方法2组的参与者报告的心神游离程度(M = 38.75,SD = 23.39)高于基础组(M = 27.50,SD = 17.43)和方法1组(M = 28.67,SD = 24.46;见表7和图8)。这一模式与预期相反,即以限制为中心的教育应该有助于减少心神游离。这些结果不支持H2的假设,即以限制为中心的教育会减少心神游离。
表6
来源 平方和 自由度 均方 F p η2p ε2p
组 14 82.46 22 74 1.23 11.57 0.218 0.057 0.020
残差 24 54 2.08 35 24 71 1.96 3 –––
表7
按教育组划分的心神游离评分的单向ANOVA结果。
图8
不同教育组在T4时刻的心神游离评分。
3.2.2 信任发展与心神游离的关系(H5.1)
进行皮尔逊相关系数分析,以检验信任变化(T4减去T1)与心神游离评分之间的关系。分析显示,两者之间存在显著的正相关,r = 0.296,p = 0.028,95%置信区间[0.034, 0.521](表8)。尽管相关系数较弱(r = 0.296),但发现了统计学上显著的正面关联,表明信任增加较多的参与者也报告了更频繁的心神游离。
3.3 注视行为和表现结果
本节讨论了RQ3(视觉扫描)并评估了H3,随后讨论了H5.2,最后讨论了RQ4(接管性能)。
3.3.1 教育组对注视指标的影响(预注册指标)(H3)
主要注视指标的描述性统计数据显示在表9中。为了检验教育框架是否影响监控注视,对预注册的关键因变量(KDVs)进行了综合Kruskal-Wallis检验:恢复到道路中心(RRC)和结构化扫描指数(SSI)。如表10所示,这些指标在各组之间没有显著差异(RRC: H(2) = 1.37,p =.505;SSI: H(2) = 3.10,p =.212)。这些结果不支持H3的假设。
表10
指标 B(均值 ± 标准差)
M1 27.50 17.43 3.90 0.63
M2 28.67 24.46 6.32 0.85
表11
在静态视野内(AOI)指标中,经过Benjamini–Hochberg校正后,两个与HMI相关的指标显示出显著的组间差异:HMI总注视时间(TGT5),H(2) = 11.02,p =.004,qBH =.036;HMI平均注视持续时间(MGD5),H(2) = 11.28,p =.0036,qBH =.032。事后Dunn检验表明方法1组的值高于基础组和方法2组(成对q值 = 0.006–0.015)。HMI注视率(MGR5)也表现出类似趋势,但在FDR校正后不再显著(p =.006,qBH =.057)。
表12
探索性转换分析显示了一些名义趋势(例如,右外缘 → HMI p = 0.051),但这些趋势在FDR校正后均不显著。总体而言,预注册的扫描指标没有显示出教育效应,尽管探索性HMI测量表明在某些场景中方法1组的监控更多。
表13
结构化扫描与心神游离之间的关系(H5.2)
更结构化的扫描与较低的心神游离相关。具有较高恢复到道路中心(RRC)评分的参与者报告较少的心神游离(表13;皮尔逊r = ?0.329,p =.024,95%置信区间[?0.563, ?0.046];Spearman ρ = ?0.367,p =.011)。结构化扫描指数(SSI)也显示出类似的趋势(皮尔逊r = ?0.364,p =.012,95%置信区间[?0.590, ?0.086];Spearman ρ = ?0.367,p =.011)。尽管这些相关性的强度较弱,但两者均表明结构化扫描与自我报告的心神游离存在一致的负相关。总体而言,结构化扫描解释了大约11–13%的心神游离方差(r2),支持H5.2的假设。
表14
系统识别反应时间(SRRT)在不同教育组间存在显著差异,H(2) = 7.898,p =.019,ε2rank=.152,εrank2=.152,95%置信区间[0.024, 0.381](表14)。方法1组的中位SRRT最短(Mdn = 2.142秒),其次是方法2组(Mdn = 2.770秒),基础组次之(Mdn = 2.715秒;见表15和图9)。事后Dunn检验与Holm校正确认方法1组与方法2组之间存在显著差异(pHolm =.015),其他组合均未达到显著性(表16)。
4 讨论
本研究调查了教育干预是否能够调整在第一级驾驶自动化期间信任和维持监控注意力。结果表明存在不对称性:信任的形成主要与直接接触自动化性能有关,而教育框架与HMI监控和接管准备情况的差异有关,而更广泛的扫描结构则不受影响。接触是塑造信任轨迹的主导因素(H1.1–H1.2),而以能力为中心的教育与HMI监控和接管准备情况的差异有关(H4)。信任增长也与心神游离的增加有关(H5.1),并且心神游离与较少结构化的扫描相关(H5.2),这将主观和行为的监控脱离标志联系起来。总之,这些发现有助于明确驾驶前教育的局限性和潜在的、有针对性的好处,以支持安全的人机交互(表17)。
表17
假设 预测 结果 支持
H1.1 第一级自动化期间信任从T1到T4增加。 时间的主效应显著;各组的信任一致增加。 □
H1.2 教育框架影响信任轨迹随时间的变化。 没有组或时间与组的效应;轨迹可比较。 ×
H2 以限制为中心的教育减少了心神游离。 各组的心神游离没有显著差异。 ×
H3 教育框架影响结构化扫描(RRC, SSI)。 预注册扫描指标没有组间差异。 ×
H4 以限制为中心的教育产生了最快的接管反应。 组间存在差异,但方法1(以能力为中心)比方法2(以限制为中心)更快。 ×
H5.1 更大的信任增加与更多的心神游离相关。 弱但显著的正相关(r = 0.296,p = 0.028)。 □
H5.2 更结构化的扫描与较少的心神游离相关。 RRC和SSI之间的相关性与弱到中等的负相关(r = ?0.329,p =.024;r = ?0.364,p =.012)。 □
4.1 信任发展主要由接触驱动
随着参与者接触到第二级自动化,信任在所有教育条件下都有所增加,支持H1.1的假设。这种模式与早期证据一致,即与自动化的直接互动逐渐使信任与系统实际性能对齐,即使用户最初的了解不同(Beggiato和Krems,2013;Lee和See,2004;Hoff和Bashir,2015)。以能力为中心或以限制为中心的教育框架似乎都没有改变这一轨迹(H1.2),表明直接接触系统的行为比预先指导更为重要。这种模式与CAUSE模型(Rowan,1991)一致,该模型将有效沟通描述为一个顺序过程:建立可信度、提高意识、促进理解、实现满足和支持实施。本研究中的简要指导框架不太可能完成这一过程;相反,参与者似乎通过直接观察系统的可靠性来调整信任。信任增长与心神游离之间的正相关表明,系统信心与监控参与度之间存在潜在的矛盾。表现出更大信任增加的参与者在监控相关指标上也显示出较低的值,这与信任相关性的监控参与度降低一致。这种模式与Malleable Attentional Resources Theory(MART)(Young和Stanton,2002;Warm等人,2008)一致,该理论认为在任务需求较低时,注意力投入会减少。这种关系在各种教育条件下都存在,表明随着驾驶员对稳定自动化的经验增加,监控可能会减少。
4.2 以能力为中心的教育和监控优先级
尽管以能力为中心的教育并没有显著改变信任轨迹,但它似乎产生了两个小好处(H8):对HMI的更多关注以及在接管期间更短的系统识别反应时间。收到基于知识(能力聚焦)指导的参与者更频繁地监控自动化状态显示,并在需要手动控制时更快地作出反应。这些发现表明,对系统操作的概念性理解可能提高了监控的 Selectivity(选择性)和授权转移的准备度。在 Endsley 的情境意识框架(Endsley, 1995b)中,这些改进可能反映了对自动化反馈信号所表示的系统状态的解释能力增强。能力聚焦的指导可能使人机界面(HMI)的提示更具意义和诊断性,使参与者能够更高效地解读这些提示,而不会影响对道路的监控。更快的应急响应时间(SRRT)进一步表明在手动恢复过程中协调更加顺畅。因此,尽管这种短暂的概念性指导似乎不会减轻与信任相关的警觉性下降,但它可以通过明确监控优先级和准备度来提供有针对性的好处。这些效应说明了教育和接触如何影响监督的各个方面:接触影响信任和感知到的监控需求,而教育则微调特定的监控行为。
基于规则(限制导向)的教育对信任、注意力或接管性能的影响几乎没有可测量的结果。有几个因素可以解释这一结果。一种可能的解释是,在稳定情况下,强调系统限制并没有转化为可操作的监控策略,这可能限制了可观察的行为效应。指导中列出了诸如恶劣天气或车道标记变差等边界条件,但几乎没有提供关于如何检测或应对这些条件的操作指南。在稳定的高速公路情境下,参与者几乎没有机会应用这些规则。此外,指导的语气也可能起到了作用。强调系统的局限性可能导致驾驶员认为故障只会在特定条件下发生,例如恶劣天气或车道标记不清。由于模拟驾驶中没有提供这样的提示,参与者可能较少关注持续监控,而更多地等待故障的可见迹象。这种条件性的监督形式与随着信任增长而出现的普遍警觉性下降不同,但它可以被视为信任误判的另一种表现,即对系统可能发生故障的预期比其实际脆弱性范围要狭隘(Parasuraman 和 Riley, 1997)。此外,驾驶始终在自动化的操作范围内进行,因此限制信息并不特别相关。在这些条件下,参与者可能认为基于限制的简报意义不大,这也可能限制了其行为效应。
Skills-Rules-Knowledge (SRK) 框架(Rasmussen, 1983)为理解这些差异提供了一个有用的视角。基于限制的指导依赖于存储的“如果-那么”程序,这些程序只有在匹配的提示出现时才会被触发。在这项研究中,这样的提示并不存在,因此所学的规则也不太可能被激活。相比之下,能力聚焦的教育培养了可以在多种条件下应用的思维模型。了解自动化如何感知和行动可能提高了人机界面信息的感知相关性,并促进了控制转换的更快识别。在 Rasmussen 的框架中,当操作者面对没有存储规则的陌生或意外情况时,需要能力聚焦的处理。这种情况类似于自动化接管,驾驶员必须解释系统行为并重新建立手动控制。
这些发现可以在先前的工作中引入的情境意识差异模型 δ = α?α′ 中进行解释(Chouchane 等人, 2022)。在该模型中,信任可能会影响感知到的监控需求(α)。随着信任的增加,驾驶员可能认为需要较少的主动监督。这种变化反映了对自动化可靠性的信心提高,而不是实际监控需求的减少。观察到的高信任与心猿意马之间的关联支持了这种解释,表明较低的感知需求可能导致注意力分散和较弱的监督参与。相比之下,教育干预可能通过部分独立的途径影响实际的监控(α′)。能力聚焦的教育似乎增强了某些监控成分,如对人机界面的注意力和接管准备度。这些效应代表了 α′ 的局部提升,但没有抵消整体感知需求的下降。因此,简短的指导可能会强化特定的监控习惯,但不太可能对抗与信任增加相关的整体警觉性收缩。
Malleable Attentional Resources Theory (MART)(Young 和 Stanton, 2002; Warm 等人, 2008)为这种收缩提供了补充解释。在稳定且需求较低的自动化情况下,注意力资源趋于狭窄,导致关键视觉区域之间的扫描不够系统和频繁。观察到的心猿意马与减少的扫描组织(较低的 SSI 和 RRC)之间的相关性与此机制一致。CAUSE 模型(Rowan, 1991)进一步阐明了为什么指导信息效果有限:有效的风险沟通依赖于可信和有序的参与,而不是孤立的个人简报。最后,基于性能的信任模型(Lee 和 See, 2004; Hoff 和 Bashir, 2015)有助于解释为什么直接接触自动化性能主导了信任的发展。綜合这些框架可以看出,信任最有可能影响感知到的监控需求,而教育可以微调特定的监控行为。因此,信任的上升和系统性能的稳定创造了驾驶员监控活动减少的条件,即使客观的监督要求保持不变。
结果表明,简短的驾驶前教育对信任轨迹的影响有限,信任主要通过直接接触自动化性能来发展。尽管口头或书面指导对于设定初始期望很有价值,但似乎不足以影响实际使用中的信任演变。尽管如此,这样的教育可以提高理解能力和促进更专注的监控。能力聚焦指导的适度好处表明,更广泛、基于场景的培训可能会产生更广泛的效果。结合概念解释和引导练习的程序可能帮助驾驶员在各种条件下接触自动化,并接近其操作极限,从而更好地校准信任和监控策略。来自教师的实时反馈可以强化何时以及如何进行干预,支持平衡的监督。能力聚焦指导后人机界面监控的改进也突显了界面透明性的重要性。提供有意义的提示(如传感器覆盖范围或自动化信心)的显示可以增强监控效果,前提是信息易于理解且不会令人不知所措。因此,教育和界面设计最好一起开发。最后,扫描结构与心猿意马之间的联系强调了驾驶员监控系统的机会。除了跟踪注视在道路上的时间外,系统还可以评估扫描模式随时间的组织方式是否保持一致。识别镜子到道路的转换减少或随机性增加可以在性能下降之前发出早期警报。
有几个因素限制了这些结果的解读和普遍性。首先,各组样本量较小(每种教育条件下 n = 15–20 人),这限制了检测小效应和交互作用的统计功效;因此,应该谨慎解释组间差异的零发现。其次,教育干预是简短的且只进行了一次;重复或交互式的培训可能会产生更强且更持久的效果。第三,模拟驾驶在自动化运行 15 分钟后只涉及一次接管事件。实际驾驶中道路、交通和天气条件的变化更大,这可能会影响信任和注意力。第四,参与者没有实际使用二级自动化的经验,因此这些发现反映了早期接触的情况,而不是长期适应;未来的研究应检查教育收益或信任-注意力动态是否会在长期使用中持续。第五,心猿意马是回顾性测量的,这可能低估了瞬间的波动;结合同时进行的生理测量将加强未来的评估。最后,指导材料代表了能力聚焦和限制聚焦框架的一种实现方式。尽管简报在重点上有所不同,但我们没有进行直接的操作检验来验证参与者是否如预期那样内化了这些框架。由于简报中的信息内容相似,组间信任和注视指标的差异可能被重叠所减弱,因此应该谨慎解释这些结果。内容、传递方式或真实性的变化,以及简报后的能力与边界理解测试,将加强未来对基于框架的干预措施的有效性验证。
未来的研究应探讨教育和接触因素如何随时间和环境变化而相互作用。纵向研究可以跟踪在实际驾驶中的长时间内信任和监控行为。基于场景的培训可以确定概念理解和实践接触如何有效校准信任和注意力。在包括城市和恶劣天气条件在内的不同驾驶环境中的研究将明确基于限制的教育在何时最为相关。最后,将教育干预与自适应人机界面和监控系统相结合可以帮助维持驾驶员的参与度。
简短的驾驶前教育调整了特定的监控行为,但没有影响二级自动化期间信任形成的轨迹。随着时间的推移,所有组的信任都有所增加,并且不受指导框架的影响,这与根据系统性能的经验调整一致。与基于限制的教育相比,能力聚焦的教育与对自动化反馈的更大关注和更快的接管反应相关,表明概念信息可能改进了驾驶员监控系统状态的方式,而不改变整体信任的发展。在参与者中,信任的增加伴随着结构化监控减少的模式,这表明在常规自动化过程中,信心增长与持续的监督参与之间存在潜在的权衡。更有结构的注视组织与较低的自我报告的心猿意马相关,支持将注视指标视为注意力分配的行为代理而非直接测量的观点。这些发现表明,结合扩展的经验培训、透明的界面设计和基于注视的监控系统的综合方法具有潜在价值,可以支持部分自动化驾驶中的持续监督参与。