从本地到全球再到机制层面：一个以iERF为中心的统一框架，用于解释视觉模型

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《IEEE Transactions on Pattern Analysis and Machine Intelligence》：From Local to Global to Mechanistic: An iERF-Centered Unified Framework for Interpreting Vision Models

【字体：大中小】 时间：2026年04月30日 来源：IEEE Transactions on Pattern Analysis and Machine Intelligence 18.6

编辑推荐：

　　摘要：现代视觉模型取得了显著的准确性，但解释证据来源、模型编码的内容以及内部计算如何组合这些证据仍然存在碎片化的问题。我们提出了一个以iERF（有效接收场）为中心的框架，该框架将局部、全局和机械性的可解释性统一在一个分析单元上：即点特征向量（PFV）及其特定于实例的有效接收场（

摘要：

现代视觉模型取得了显著的准确性，但解释证据来源、模型编码的内容以及内部计算如何组合这些证据仍然存在碎片化的问题。我们提出了一个以iERF（有效接收场）为中心的框架，该框架将局部、全局和机械性的可解释性统一在一个分析单元上：即点特征向量（PFV）及其特定于实例的有效接收场（iERF）。在局部层面，共享比率分解（SRD）通过共享比率将每个PFV表示为上游PFV的混合，并传播iERF来构建具有类别区分能力的显著性图。SRD能够生成高分辨率、忠实于激活值的解释结果，对有针对性的操纵和噪声具有鲁棒性，并且在常见的非线性变换下仍然保持对激活值的无关性。对于全局视角，我们引入了概念锚定特征解释（CAFE），它利用iERF作为语义标签，将抽象的潜在向量与可验证的像素级证据联系起来。通过CAFE，我们解决了非局部化稀疏自编码器潜在表示的问题——特别是在Transformer中，早期自注意力会混合远距离的上下文。为了解释表示是如何通过层次结构构建的，我们提出了层间概念图与层间概念归属（ICAT），该框架可以量化概念之间的影响同时隔离层对；层间插入/删除协议确定了集成梯度作为最忠实的实现方式。实证研究表明，在ResNet50、VGG16和ViTs上，我们的框架在准确性和鲁棒性方面均优于基线模型，能够成功解释分散的SAE特征，并在正确分类、错误分类和对抗性情况下揭示出主导的概念路径。基于iERF的方法提供了一种从像素到概念再到决策的连贯、有证据支持的映射。

联系信箱：

粤ICP备09063491号

摘要：

热点排行