TensorFlow的Debugger调试实例

之前有翻译整理过关于TensofFlow的Debugger的简单教程，具体内容见这里。这次用自己实际的例子，来简要的做个使用介绍。
首先是代码遇到了问题，训练过程中的loss不是为nan，就是为负数，让我觉得很奇怪，但是自己去检查代码又找不到问题出在哪里，这时候就想到了TensorFlow自带的Debugger。之前也有使用过，如果在没出问题的情况下，Debugger还是比较给力的。

用Debugger封装需要调试的Session

首先在代码的开头需要import对应的debugger模块(官方教程喜欢import debug as tf_debug，我这里就简写了，为了省事，看个人习惯吧)
from tensorflow.python import debug as tfdbg
然后在创建完Session的对象后，用调试器的Session进行封装

# 没有调试器之前的写法
with tf.Session(config=config) as sess:
    # 加入调试器需要加入以下这行
    sess = tfdbg.LocalCLIDebugWrapperSession(sess)
    #　需要调试nan值，因此加上nan的过滤器
    sess.add_tensor_filter("has_inf_or_nan", tfdbg.has_nan_or_inf)

调试过程

在用调试器封装好Session对象之后，就可以启动代码，运行后会看到如下界面：

图1 启动调试器

这是可以输入运行的指令（如果不清楚TensorFlow Debugger的指令，可以查看之前的教程）
r -f has_inf_or_nan
这样运行就会在有过滤器的情况下运行，并会捕获出现了过滤器指定数值的Tensor，我们这里指定的是出现了inf或者nan值的Tensor。运行后，结果如下图所示：

图2 捕获inf或nan值的Tensor

按照图中顺序，出现nan值的第一个Tensor是d_loss/Log:0，那么这个时候可以用下列指令直接查看这个Tensor的值
pt d_loss/Log:0 -a
很显然，你会在打印的数值中找到nan或者inf值，但是调试的本意并不是查看这些nan值，而是需要知道来源，因此，我们需要知道这个Tensor数据的来源，可以使用下列指令:
ni d_loss/Log:0
上述指令运行后如下图：

图3 找到nan值的来源Tensor

从结果中可以看到，这个张量有一个输入的张量Discrim/add_2,这个时候用指令pt查看下Discrim/add_2的数值，发现在调用tf.log计算前(就是输入到d_loss/Log:0节点前)的数值为-1.11897061e-05，然后调用tf.log就出现了nan，因为log计算定义域为正数。
查看数值只会知道原因，要查找来源，需要使用指令定位这个来源的数据在源码中的位置：
ni -t Discrim/add_2
命令输出的结果是一个堆栈的内容，最终可以定位到代码"D_output3 = tf.matmul(D_output2, dWeights3) + dbiases3"这行，于是发现由于输出D_output3的时候，是直接输出的，没有加sigmoid激活函数，导致输出值为负，然后在输出之前添加sigmoid激活函数，将数值映射到(0,1)区间，代码即可正确运行了。

总结

使用TensorFlow的Debugger并不困难，大致总结起来有这么几个流程：
1.import要使用的TensorFlow的调试模块

from tensorflow.python import debug as tfdbg

2.使用调试模块的会话对象包装原有的Session对象

with tf.Session(config=config) as sess:
    sess = tfdbg.LocalCLIDebugWrapperSession(sess)

3.加入异常值对应的过滤器

sess.add_tensor_filter("has_inf_or_nan", tfdbg.has_nan_or_inf)

4.运行代码，并在带过滤器的情况下运行

r -f has_inf_or_nan

5.跟踪异常值产生的节点，并找到异常值来源在源码中的位置（这个比较灵活，有些可能需要回溯几个节点，有些直接可查）

ni -t Discrim/add_2

最后编辑于：2020.09.18 19:23:22

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,056评论 5赞 474
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 84,842评论 2赞 378
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 148,938评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,296评论 1赞 272
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,292评论 5赞 363
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,413评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,824评论 3赞 393
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,493评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,686评论 1赞 295
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,502评论 2赞 318
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,553评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,281评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,820评论 3赞 305
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,873评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,109评论 1赞 258
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,699评论 2赞 348
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,257评论 2赞 341

TensorFlow的Debugger调试实例

用Debugger封装需要调试的Session

调试过程

总结

推荐阅读更多精彩内容