论文笔记:Interpretability Beyond Feature Attribution: Quantitative Testing with Concept Activation Ve...

1. Interpretability Beyond Feature Attribution: Quantitative Testing with Concept Activation Vectors (TCAV)

[TOC]

1.1. 前言

这是一篇使用概念向量对模型进行解释的方法,并且提供了度量的标准。

在普通的Saliency Maps解释中是为了探究输入中像素的改变会产生多少影响来确定像素的重要性。在这篇文章中使用了概念向量,将一个概念定义为一个向量,比如条纹的概念,就可以探究当输入在这个概念的方向上进行了改变,模型会产生什么样的变化,并定量评估了模型在这个概念方向上的敏感度。

1.2. Abstract

现行的分类器只能运行在低级别的特征上而不是高等级的概念上,为了解决这个问题,这片文章提出了一个Concept Activation Vectors(CAVs),提供一个人类可以理解的概念解释。并且使用方向导数来量化CAV在模型进行预测的过程中是否重要,比如模型在预测斑马的时候是否对条纹的概念敏感。

1.3. Introduction

使用输入数据中的一些样本来作为用户定义的高级概念,比如‘curly’就可以用一些发型和纹理的图像来定义。这些样本不一定受限于输入的特征和训练数据,也可以使用用户提供的一些数据,并且这种方法也是有效的。CAV可以简单的理解为概念样本集的values的方向向量。

获得过程: 在概念样本集和随机的反例上训练一个线性分类器,CAV即这个线性函数的正交向量。

fig1.png

Fig1: (a)一个用户定义的概集样本集和随机反例样本。(b)带标签的测试样本。(c)一个训练好的分类器,m是中间层的结果。(d)获得CAV的过程,两个样本集分界面的正交向量。(e)使用方向导数来测试模型对于概念的敏感度,实质上是看模型的分界面是否和CAV的相同,即用户提供一个自定义的概念,TCAV可以衡量这个概念对于预测的影响有多少。

1.4. Method

1.4.1. 获得CAV

数据集的选择: 在样本中选择可以表达概念的集合或者从别的地方选择一个独立的数据集。接着在概念样本集和反例之间训练一个线性分类器,并将其正交向量作为CAV。(如何保证两个数据集线性可分?)

1.4.2. 方向导数和概念敏感性

计算模型在CAV方向上的导数来确定模型的概念敏感度。(这篇文章没有什么数学公式,我就不贴了,有兴趣的可以直接看原文)。在CAV方向上的敏感测试是统计方向导数大于0的个数,非常简单粗暴了。

1.5. 结果

1.5.1. 检验CAV的有效性

fig2.png

使用从高级概念(CEO)中学到的CAV(Striped或者Necktie)进行排序,图上显示了前排序结果最好的三张图片。但是没说这些CAV是从哪些数据集中得到的。

fig3.png

在Empirical Deep Dream中展示了三个不同的概念向量得到的结果,第一个是针织质地,第二个是一个狗,一个是西伯利亚雪橇犬。(这种概念的显示比较好了)

1.5.2. 正式的实验

模型对于一个概念的敏感程度: 即在模型的预测中,这些概念起到了多少作用,如果作用大的话,可以理解为模型更多的关注于这个概念。

fig4.png

上表中每一个图是一个类别,每一个类别中有不同的概念,不同的颜色代表的网络中不同的层。数值越大影响程度越高。比如第二张Zebra斑马的图,条纹起到的作用就非常高。

接下来的实验证明了复杂的概念会在模型更高的层中表现的更好,简单的概念会在低层中学习到。同时与Saliency Maps进行比较。如果人为的为图像增加标签,那么Saliency Maps能不能解释模型更关注与增加的标签?

fig5.png

(这个实验图标错了)第一行应该是没有标签的,第二行的标签是全部正确的,第三行的标签30%的错误,第四层的标签完全错误。第二行中只有SmoothGrad表现的较好,其余三种其实并没有学习到模型真正关注的区域。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,980评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,178评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,868评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,498评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,492评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,521评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,910评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,569评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,793评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,559评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,639评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,342评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,931评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,904评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,144评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,833评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,350评论 2 342

推荐阅读更多精彩内容

  • 机器学习术语表 本术语表中列出了一般的机器学习术语和 TensorFlow 专用术语的定义。 A A/B 测试 (...
    yalesaleng阅读 1,957评论 0 11
  • 深度学习(花书) 第一章 前言 本章节描述了深度学习的发展历史,应用前景,发展趋势,粗略的介绍机器学习如何有别于软...
    迷途的Go阅读 596评论 0 1
  • 概述及标签体系搭建 1 概述 随着信息技术的迅速发展和信息内容的日益增长,“信息过载”问题愈来愈严重,愈发带来很大...
    JinkeyAI阅读 22,747评论 10 241
  • 本文编译自谷歌开发者机器学习术语表项目,介绍了该项目所有的术语与基本解释。 A 准确率(accuracy) 分类模...
    630d0109dd74阅读 1,980评论 0 1
  • 1 文本分类 文本分类是自然语言处理领域最活跃的研究方向之一,目前文本分类在工业界的应用场景非常普遍,从新闻的分类...
    高永峰_GYF阅读 27,945评论 4 21