道路安全新视角:基于两阶段代理学习与正交化异质性框架的iRAP ViDA风险引擎审计研究

《Infrastructures》:Auditing iRAP’s ViDA Risk Engine: A Two-Stage Surrogate Learning and Orthogonalized Heterogeneity Framework for Modelled Road Safety Amirhossein Hassani, Borna Abramovi?, Muhammad Shahid and Marko ?evrovi?

【字体: 时间:2026年04月06日 来源:Infrastructures 2.9

编辑推荐:

  道路安全研究常用机器学习预测事故或估算基于事故的处置效果。本项研究则对iRAP ViDA风险引擎生成的模型化致死与重伤(FSI)风险进行审计。研究人员分析了来自欧洲12个调查项目、总计147,466个路段的数据,通过两阶段框架:第一阶段使用梯度提升树在按道路分组的交叉验证下再现引擎风险面(R2≈0.92),并基于SHAP归因识别高风险路段的关键驱动属性;第二阶段采用因果森林-双机器学习估计器,在调整38个协变量后,评估了六种可改造处置措施与模型化风险在路段层面的条件对比关联。研究最终将关联转化为基于明确阈值的处置建议,并与iRAP原有的更安全道路投资计划(SRIP)进行了对比验证。这项研究为确定性风险引擎提供了一种统计审计与处置效果异质性分析的新方法,有助于提升道路安全投资的精准性。

  
道路交通事故是全球性的公共卫生危机,每年导致约119万人死亡,对中低收入国家造成的经济损失可达GDP的3%至10.5%。尽管全球已开展首个“道路安全行动十年”,但在基础设施安全、事故数据质量和本地评估能力方面仍存在显著差距。与此同时,大量资金正投入到道路升级中,其决策通常依赖于以基础设施为重点的安全评估工具和通用的碰撞修正系数(CMFs)。然而,越来越多的证据表明,特定处置措施的安全效果强烈依赖于具体环境,单一的全局CMF可能掩盖重要的地点差异,无法有效指导干预措施的实施。
在此背景下,国际道路评估计划(iRAP)及其ViDA平台等先进工具被广泛用于从标准化基础设施调查中生成星级评级和投资计划。这些工具虽然有助于统一实践和建立关于基础设施风险的共同语言,但其本质上仍是基于规则的,尚未充分利用现有的统计和机器学习方法。另一方面,机器学习在事故预测中的应用已很普遍,但大多止步于风险预测和热点识别,很少量化特定处置措施在具体地点的效果变化。
这项发表在《Infrastructures》上的研究,旨在填补上述空白。它没有从头构建事故预测模型,而是创新性地将iRAP ViDA引擎生成的模型化致死与重伤(FSI)风险值作为审计对象。研究核心是提出一个两阶段审计框架,用于分析这个经过校准的、确定性的风险引擎。
研究人员为开展此项研究,主要运用了以下关键技术方法:首先,数据来源于iRAP的ViDA平台,涵盖了12个欧洲调查项目、总计147,466个100米路段的标准化编码数据。其次,在方法学上,研究采用了两阶段框架:第一阶段是“仿真与热点识别”,使用梯度提升树(Gradient Boosted Trees)这一机器学习模型,在“按道路分组”的交叉验证设置下,试图从导出的路段属性中复现ViDA引擎的FSI风险面,并利用SHapley Additive exPlanations(SHAP)进行归因分析;第二阶段是“处置关联的异质性估计”,针对一组可改造的处置措施,采用基于因果森林(Causal Forest)的双机器学习(Double Machine Learning, DML)估计器,在控制了大量协变量后,估计处置与模型化风险之间的条件平均处理效应(CATE)。最后,通过设定绝对和相对的风险降低阈值,将估计出的关联转化为具体的处置建议,并与ViDA引擎自带的规则化建议系统——更安全道路投资计划(SRIP)进行对比。
研究结果
1. 仿真保真度与热点检索
研究表明,梯度提升树模型能够高度精确地复现ViDA的模型化FSI风险面。在包含交通流量和调查标识符的模型下,决定系数R2达到约0.92。通过按道路分组的交叉验证得到的样本外预测,能够以较高的准确率检索出引擎定义的Top-K高风险路段(即热点),证明了代理模型在识别风险模式上的一致性。
2. 热点驱动属性分析
研究人员对识别出的热点路段进行了SHAP归因分析,揭示了驱动这些路段模型化高风险的关键编码属性。这有助于理解ViDA风险引擎在特定地理和道路环境下的决策逻辑和敏感性。
3. 可改造处置的条件对比
研究针对六种可实际改造的处置措施(如路侧屏障、肩宽升级等),估计了从较低等级升级到相邻较高等级所带来的、在模型化FSI风险面上的条件对数尺度对比(即处置关联)。因果森林方法揭示了这种关联存在显著的异质性,即同一处置在不同道路环境(由38个协变量定义)下,与模型化风险的关联程度不同。这挑战了使用单一全局CMF的假设。
4. 与SRIP的基准对比
研究人员将基于第二阶段估计结果生成的处置建议(通过设定明确阈值)与ViDA引擎原生的SRIP建议,在共同的热点路段上进行了对比。在321个重叠的热点上,两种方法产生的建议显示出中等程度的一致性(召回率=0.77,精确率=0.66,科恩κ系数=0.40)。分析还按处置类型总结了不一致的情况,为理解两种推荐系统的差异提供了洞见。
研究结论与讨论
本研究的核心结论是,成功开发并验证了一个用于审计确定性基础设施风险引擎的两阶段框架。该框架结合了分组验证下的代理建模和基于因果推理的处置关联异质性分析。研究证实,现代机器学习方法能够有效地复现并解释iRAP ViDA这类复杂引擎的风险输出,并能估计可操作处置措施在模型化风险面上的条件性效果。
其重要意义体现在多个层面:在方法论上,它将因果机器学习引入到既有的基础设施风险模型评估中,推动了从单纯的风险预测向“何种处置在何处有效”的异质性处置效应估计的转变。在实践上,研究提供了一套透明的、可重复的审计流程,包括预测保真度评估、热点检索和基于模型的处方生成,使决策者能够理解风险模型的内部逻辑,并对比不同推荐系统的结果。这对于依赖iRAP等工具进行资金规划和优先级排序的机构尤为重要,有助于提高有限安全投资的目标性和效率。最后,研究者强调,所有发现均应被解释为针对“经过校准的模型化风险面”的条件关联,而非对实际观测到的事故的因果效应。这为未来将此类审计框架与外部事故数据进行验证性研究奠定了基础,指明了方向。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号