面向动态环境的运行时本体演化方法论框架

《Applied Sciences》:A Methodological Framework for Runtime Ontology Evolution in Dynamic Environments Valeria Seidita, Lucrezia Mosca and Antonio Chella

【字体: 时间:2026年04月04日 来源:Applied Sciences 2.5

编辑推荐:

  在口译员训练中,自动质量评估(AQA)的一个关键组成部分是检测不自然的停顿,因为停顿模式直接反映了口译员的认知负荷和流利度。传统的停顿检测方法依赖于静态的时间阈值(例如1.0秒),这常常无法解释特定语段的语速差异和个体说话风格。本研究提出了一种上下文自适应的停

  
在口译员训练中,自动质量评估(AQA)的一个关键组成部分是检测不自然的停顿,因为停顿模式直接反映了口译员的认知负荷和流利度。传统的停顿检测方法依赖于静态的时间阈值(例如1.0秒),这常常无法解释特定语段的语速差异和个体说话风格。本研究提出了一种上下文自适应的停顿检测框架,该框架整合了使用孤立森林(iForest)的无监督异常检测与滑动窗口技术。为了增强教学有效性,研究人员特别关注了句内停顿(intra-sentential pauses),并通过一个专门的语句分割模型界定了句子边界。所提出的模型通过专业口译专家标注的真值标签进行了评估。结果表明,基于滑动窗口的上下文异常检测模型在召回率(Recall)和Cohen‘s Kappa系数方面显著优于传统的静态基线模型。此外,通过应用加权F3分数和“识别优于召回”原则,研究人员确认所提模型通过将教师的工作从全新的标注创建转移到更高效的纠正式修剪,大幅减轻了教师的总体操作负担。这些发现表明,语音自适应建模为自动口译评估和反馈提供了更可靠且更省力的框架。具体而言,本研究有三个主要贡献:(1)提出了一个使用异常检测的上下文自适应停顿检测框架;(2)整合了基于滑动窗口的局部上下文建模,以实现对语速的感知分析;(3)引入了基于“识别优于召回”原则的评估策略,以减少口译训练中教师的工作量。
在口译训练与评估领域,停顿被广泛认为是衡量流利度的核心指标,是反映口译员能力水平、认知负荷及整体口译质量的关键变量。随着技术进步,对口译停顿的研究也经历了从描述性分析到定量建模,再到基于认知理论的演进。尽管如此,大多数现有方法仍依赖于静态的时长阈值,这无法充分捕捉由语速、句法结构及个体说话风格带来的变异性。为克服这些局限,本研究在口译训练反馈系统TalkTrack平台内,提出了一种语音自适应的停顿检测框架。该框架将孤立森林(Isolation Forest, iForest)算法与基于滑动窗口的上下文异常检测技术相结合,用上下文敏感的建模替代了僵硬的基于阈值的分类。TalkTrack是一个基于学习管理系统(LMS)的平台,旨在满足计算机辅助口译训练(Computer-Assisted Interpreter Training, CAIT)的教学需求,整合了任务创建、执行与反馈流程。该平台通过集成语音转文本(Speech-to-Text, STT)技术和自动标注功能,实现了性能数据的自动化收集与流利度反馈的系统化。本研究使用的数据集包括通过TalkTrack平台收集的日韩同声传译数据,由7名翻译专业研究生参与,并由4名专业口译员对口译输出质量进行评估。为精确提取句内停顿,研究人员移除了STT输出中的所有标点,并使用专门的句子分割模型KIWI来界定句子边界,从而专注于句内静默段的分析。
研究结果表明,口译中的停顿感知本质上是上下文相关的,而非绝对的。听众是根据周围的语音节奏和认知流来评估流利度的,所提出的框架通过建模局部统计停顿特征反映了这一机制。在所有模型的整体比较中,基于滑动窗口的上下文异常检测模型(IF-sliding)相较于传统的固定1秒阈值基线模型,在关键指标上取得了显著提升。具体而言,IF-sliding模型的召回率从基线的0.3684大幅提升至0.5500,这显著减少了教师需手动创建的缺失标注数量。更重要的是,在考虑了“识别优于召回”原则(即纠正错误标注比从头创建新标注的认知负担更低)后,用于评估的F3分数(强调召回的加权F1分数)从基线的0.3910提升至0.5486,Cohen‘s Kappa系数也从0.4933提升至0.5263,表明模型输出与专家标注的一致性增强,能更有效地降低教师的总体修正工作量。在基于单个数据源的精细分析中,固定阈值法(基线)因对语速变化不敏感,在部分数据源上表现出高精度但低召回的特点,迫使教师进行大量手动标注创建。基于统计分布的自适应阈值法虽然在理论上可行,但其最优参数(i值)因数据源而异,在实际部署中难以确定统一的适用值。基础的孤立森林模型在仅使用停顿时长作为特征时,未能全面反映语流特性,其整体性能提升有限。相比之下,引入滑动窗口技术后,模型能够评估某个停顿相对于其局部上下文的异常性,显著改善了对真实停顿的识别能力。特别是在数据源12上,IF-sliding模型实现了100%的召回率,意味着所有真实停顿都被检测到,虽然这伴随了一些误报,但根据Keystroke-Level Model(KLM)等交互模型的研究,识别并删除错误标注的成本远低于从头创建正确标注。研究还发现,模型对停顿密度敏感,暗示可根据学习者水平(新手停顿多,老手停顿少)动态调整模型中的污染参数(contamination parameter),使其成为一个能随学习者能力发展而演进的适应性教学支架工具。
讨论部分总结了本研究的意义与局限。研究证实了上下文异常检测对于识别不自然的句内停顿的有效性,并强调了语音自适应流利度评估的教学价值。所提出的框架通过提供更准确、可操作的反馈,促进了计算机辅助口译训练的发展。然而,该框架目前仅使用了停顿时长和窗口级统计描述符(如均值和标准差)等有限特征集,未充分利用音高轮廓、重音模式、句法边界信息等韵律和语言学特征,也可能无法区分功能性和非流利性停顿。此外,研究的跨语言普遍性(仅限日韩语对)和实时部署延迟尚未得到验证。误差分析也揭示了模型在区分从句边界的语法性短停顿和短语内微停顿时的特定不足。论文结论部分指出,本研究提出的语音自适应停顿检测框架,通过上下文建模提升了与专家标注的一致性,增强了自动流利度评估的可靠性。发现证明停顿感知是上下文相关的,模型通过建模局部统计特征反映了这一机制。召回率的提升在教育场景中尤为重要,因为它能确保对真实不流利点的检测,从而提高反馈的有效性。总体而言,本研究确认了上下文异常检测在识别不自然句内停顿方面的效果,并突显了语音自适应流利度评估的教学价值,为口译训练及更广泛的时间不流利上下文感知建模任务提供了贡献。未来工作可包括数据驱动的窗口大小优化、引入个体自适应参数调整、整合更多韵律与多模态特征以提升模型鲁棒性,并进行跨语言验证及实时部署研究。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号