FCN重写笔记

此文只是重写时的笔记，正式发布的感想请看相关阅读

tf.squeeze 和 tf.expand_dims

参考tf.expand_dims和tf.squeeze函数
另外，当指定了squeeze_dims时，对应维度大小必须为1

glob

collections.namedtuples

不准确地说，它相当于一个只有属性的class
示例: Examples = collections.namedtuple("Examples", "paths, inputs, targets, count, steps_per_epoch")

examples = Examples(
        paths=paths_batch,
        inputs=inputs_batch,
        targets=targets_batch,
        count=len(input_paths),
        steps_per_epoch=steps_per_epoch,
    )

scipy.misc.imread

scipy.misc.imread官方教程

scipy.misc.imresize

scipy.misc.imresize官方教程
不知道inter='nearest'的作用，之后要补齐。

resize_image = misc.imresize(image,
                                         [resize_size, resize_size], interp='nearest')

而且它会改变图像的数值，标准归一化到0-255的区间

arr = np.array([[[100, 2, 220], [3, 4, 5]], [[1, 2, 3], [3, 4, 5]]])

print(type(arr))
print(arr.shape)

resize_size = 4
arr = misc.imresize(arr, [resize_size, resize_size], interp='nearest')
print(type(arr))
print(arr.shape)
print(arr)

输出

<class 'numpy.ndarray'>
(2, 2, 3)
<class 'numpy.ndarray'>
(4, 4, 3)
[[[115   1 255]
  [115   1 255]
  [  2   3   5]
  [  2   3   5]]

 [[115   1 255]
  [115   1 255]
  [  2   3   5]
  [  2   3   5]]

 [[  0   1   2]
  [  0   1   2]
  [  2   3   5]
  [  2   3   5]]

 [[  0   1   2]
  [  0   1   2]
  [  2   3   5]
  [  2   3   5]]]

输出，矩阵数值被改变了

查了一下原因，没仔细看，记录一下：
scipy.misc.imresize changes image range
噢原因是这个:

改用skimage.transform.resize吧

BatchDatsetReader._read_images

self.__channels = True
self.images = np.array([self._transform(filename['image']) for filename in self.files])
self.__channels = False
self.annotations = np.array(
    [np.expand_dims(self._transform(filename['annotation']), axis=3) for filename in self.files])

print ("self.images.shape:", self.images.shape)
print ("self.annotations.shape:", self.annotations.shape)

tf.train.saver

原代码:

saver.save(sess, FLAGS.logs_dir + "model.ckpt", itr)

官方文档
用法:

saver.save(sess, 'my-model', global_step=0) ==> filename: 'my-model-0'
...
saver.save(sess, 'my-model', global_step=1000) ==> filename: 'my-model-1000'

结果:

tf.nn.sparse_softmax_cross_entropy_with_logits

transposed convolution/deconvolution(转置卷积/逆卷积)

通过转置矩阵的方式说明转置卷积: Up-sampling with Transposed Convolution
动画演示: Convolution arithmetic

tf.nn.conv2d_transpose

tensorflow学习笔记(三十二):conv2d_transpose ("解卷积")

conv2d_transpose 中会计算 output_shape 能否通过给定的参数计算出 inputs的维度，如果不能，则报错

1. 数据集情况分析：

image数据大部分是三维的(h, w, 3)，但有少部分是灰度图，也就是二维的(h, w)
annotation数据则都是二维的(h, w)

因此处理image数据时，如果遇到二维的图片，要先转为三维且有3个通道的图片。

2. 遇到的问题

2.1 问题1 scipy.misc.imresize is deprecated

问题描述
原作者的代码中，图片的变形使用的是scipy.misc.imresize函数。
但我发现这个函数除了对图片变形，还会自行做一些多余的动作。它会把数组里的值标准归一化到[0, 255]的区间内，破坏图片原本的信息。

arr = np.array([[[100, 2, 220], [3, 4, 5]], [[1, 2, 3], [3, 4, 5]]])

print(type(arr))
print(arr.shape)

resize_size = 4
arr = misc.imresize(arr, [resize_size, resize_size], interp='nearest')
print(type(arr))
print(arr.shape)
print(arr)

输出

<class 'numpy.ndarray'>
(2, 2, 3)
<class 'numpy.ndarray'>
(4, 4, 3)
[[[115   1 255]
  [115   1 255]
  [  2   3   5]
  [  2   3   5]]

 [[115   1 255]
  [115   1 255]
  [  2   3   5]
  [  2   3   5]]

 [[  0   1   2]
  [  0   1   2]
  [  2   3   5]
  [  2   3   5]]

 [[  0   1   2]
  [  0   1   2]
  [  2   3   5]
  [  2   3   5]]]

解决方法
最后查阅官方文档才知道这个函数已经被废止。
于是我将对图片的操作都改用skimage库实现了。而对图片的变形则使用skimage.transform.resize函数。

2.2 问题2 ValueError: could not broadcast input array from shape (224,224,3) into shape (224,224)

问题描述

Traceback (most recent call last):
  File "test.py", line 8, in <module>
    reader = ImageReader("train")
  File "/root/Desktop/FCN/ImageReader.py", line 58, in __init__
    self.image_list = np.array([self.readImage(record["image"]) for record in self.records])
ValueError: could not broadcast input array from shape (224,224,3) into shape (224,224)

在改用skimage库操作图片后，出现了无法把元素合并到一个数组的问题。对image里的图片的操作失败了。
查阅stackoverflow的问题发现原来是元素的维度并不统一。我原以为所有image里的图片都是三通道的，也就是(h, w, 3)的。这样如果我要得到固定尺寸的图片(比如224 * 224)，只需调用skimage.transform.resize，就能把图片转为(224, 224, 3)。理应所有图片都会被转换成(224, 224, 3)的维度。可是既然图片们无法共容在一个数组里，说明有的图片没有转换成这种维度。
问题原因
原来，image里并不是所有图片都是(h, w, 3)形式的，有的图片是灰度图(在20210张图片中有4张是灰度图)，也就是(h, w)形式。而我的代码没有考虑到这一点，导致这几张灰度图被转换后的维度错误。
解决方法
对于这几张灰度图，需要将其转换为三通道的形式。只需要把单通道上的值重复三次作为三个通道的值即可。

2.3 问题3 图片转换后内容被破坏

问题描述

在给skimage.transform.resize添加reserve_range = True设置后，发现转换后的图片内容完全被破坏。似乎维持值的范围会破坏图片的可见性。
问题原因
查阅了stackoverflow
原来pyplot.imshow只能显示[0.0, 1.0]范围的图片，而reserve_range = True会使图片仍然在[0, 255]范围内，且数据类型为float64，被以[0.0, 1.0]的范围来看待，这就无法正确显示了。

另外，查阅官方文档的reserve_range参数

preserve_range : bool, optional
Whether to keep the original range of values. Otherwise, the input image is converted according to the conventions of img_as_float.
确实如果不设置reserve_range = True，函数会把值的范围标准归一化到[0.0, 1.0]内，也就是img_as_float.
问题解决
显示图片时先使用image = np.copy(old_image).astype('uint8')，把类型从float64转换为uint8即可。

2.4 查看源代码的卷积核维度

通过在源代码中添加如下代码可输出各层卷积核的维度

输出：

仅截取部分输出

根据输出，我发现源代码使用的是VGG-19，而论文中使用的是VGG-16。两者的效果应该差不多，为了保持一致，我依旧按照VGG-19来叠加。

2.5 tf.layers.conv2d_transpose的放大倍数

tf.layers.conv2d_transpose只能指定strides来调整输出图片的尺寸。
strides = [2, 2]时放大两倍，strides = [8, 8]时放大8倍

最后编辑于：2018.06.20 20:03:05

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 201,924评论 5赞 474
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 84,781评论 2赞 378
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 148,813评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,264评论 1赞 272
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,273评论 5赞 363
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,383评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,800评论 3赞 393
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,482评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,673评论 1赞 295
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,497评论 2赞 318
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,545评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,240评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,802评论 3赞 304
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,866评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,101评论 1赞 258
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,673评论 2赞 348
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,245评论 2赞 341