从本地到全球再到机制层面:一个以iERF为中心的统一框架,用于解释视觉模型
《IEEE Transactions on Pattern Analysis and Machine Intelligence》:From Local to Global to Mechanistic: An iERF-Centered Unified Framework for Interpreting Vision Models
【字体:
大
中
小
】
时间:2026年04月30日
来源:IEEE Transactions on Pattern Analysis and Machine Intelligence 18.6
编辑推荐:
摘要:现代视觉模型取得了显著的准确性,但解释证据来源、模型编码的内容以及内部计算如何组合这些证据仍然存在碎片化的问题。我们提出了一个以iERF(有效接收场)为中心的框架,该框架将局部、全局和机械性的可解释性统一在一个分析单元上:即点特征向量(PFV)及其特定于实例的有效接收场(
摘要:
现代视觉模型取得了显著的准确性,但解释证据来源、模型编码的内容以及内部计算如何组合这些证据仍然存在碎片化的问题。我们提出了一个以iERF(有效接收场)为中心的框架,该框架将局部、全局和机械性的可解释性统一在一个分析单元上:即点特征向量(PFV)及其特定于实例的有效接收场(iERF)。在局部层面,共享比率分解(SRD)通过共享比率将每个PFV表示为上游PFV的混合,并传播iERF来构建具有类别区分能力的显著性图。SRD能够生成高分辨率、忠实于激活值的解释结果,对有针对性的操纵和噪声具有鲁棒性,并且在常见的非线性变换下仍然保持对激活值的无关性。对于全局视角,我们引入了概念锚定特征解释(CAFE),它利用iERF作为语义标签,将抽象的潜在向量与可验证的像素级证据联系起来。通过CAFE,我们解决了非局部化稀疏自编码器潜在表示的问题——特别是在Transformer中,早期自注意力会混合远距离的上下文。为了解释表示是如何通过层次结构构建的,我们提出了层间概念图与层间概念归属(ICAT),该框架可以量化概念之间的影响同时隔离层对;层间插入/删除协议确定了集成梯度作为最忠实的实现方式。实证研究表明,在ResNet50、VGG16和ViTs上,我们的框架在准确性和鲁棒性方面均优于基线模型,能够成功解释分散的SAE特征,并在正确分类、错误分类和对抗性情况下揭示出主导的概念路径。基于iERF的方法提供了一种从像素到概念再到决策的连贯、有证据支持的映射。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号