使用Tensorflow实现可视化中间层和卷积层

时间：2020-12-24 11:45:38|栏目：Python代码|点击：次

为了查看网络训练的效果或者便于调参、更改结构等，我们常常将训练网络过程中的loss、accurcy等参数。

除此之外，有时我们也想要查看训练好的网络中间层输出和卷积核上面表达了什么内容，这可以帮助我们思考CNN的内在机制、调整网络结构或者把这些可视化内容贴在论文当中辅助说明训练的效果等。

中间层和卷积核的可视化有多种方法，整理如下：

1. 以矩阵（matrix）格式手动输出图像：

用简单的LeNet网络训练MNIST数据集作为示例：

x = tf.placeholder(tf.float32, [None, 784]) 

x_image = tf.reshape(x, [-1,28,28,1])    
W_conv1 = weight_variable([5, 5, 1, 32]) # 第一个卷积层的32个卷积核  
b_conv1 = bias_variable([32])  
# 第一个卷积层：  
h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1)
h_pool1 = max_pool(h_conv1)  # 第一个池化层

训练结束后，第一个卷积层共有32个5*5大小的卷积核：W_conv1，要可视化第10个卷积核：

from PIL import Image
import numpy as np
#from mnist_try001 import W_conv1

img1 = (W_conv1.eval()) # 将张量转换为numpy数组
W_conv1_10 = img1[:,:,:,9] 

W_conv1_10 = np.asmatrix(W_conv1_10) # 将数组转换为矩阵格式
W_conv1_10_visual = Image.fromarray(W_conv1_10 * 255.0 / W_conv1_10.max()) # 像素值归一化，Image.fromarray方法的输入范围是[0~255]
W_conv1_10_visual.show()

2. 通过反卷积方式输出中间层和卷积核图像：

import matplotlib.pyplot as plt
from tensorflow.examples.tutorials.mnist import input_data

x = tf.placeholder(tf.float32, [None, 784])
mnist = input_data.read_data_sets('/TensorflowCode/MNIST_data', one_hot=True)

h_conv2 = tf.nn.relu(tf.nn.conv2d(h_pool1, W_conv2, strides=[1, 1, 1, 1], padding='SAME') + b_conv2) #14*14*64
# 可视化第二层输出的图像
input_image = mnist.train.images[100] # 输入一幅指定图像，mnist.train.images[100]尺寸为[784,],即1维：[1,784]
conv2 = sess.run(h_conv2, feed_dict={x:input_image}) # [64, 14, 14 ,1] 若前面网络中加入了dropout,这里的feed_dict中不要忘记加上keep_prob: 0.5
conv2 = sess.run(tf.reshape(conv2 , [64, 1, 14, 14]))
conv2 = np.sum(conv2,axis = 0) # 对中间层图像各通道求和，作为输出图像
h_conv1 = np.asmatrix(h_conv1) # 将conv2数组转换成矩阵格式
h_conv1 = Image.fromarray(h_conv1 * 255.0 / h_conv1.max()) # 矩阵数值归一化
h_conv1.show() # 输出14*14的灰度图像

可视化卷积核和上面的方法完全一样，把h_conv2改成卷积核就可以了（如W_conv1_10），可以同是输出多个卷积核。

中间层图像如下：（已经完全看不出是数字了）

或者用 matplotlib.pyplot代替上面的Image方法，可以直接输出彩色图像：

# 输出第一层的32个卷积核（5×5*32）
import matplotlib.pyplot as plt

input_image = mnist.train.images[100]
W_conv1 = sess.run(W_conv1, feed_dict={x:input_image})   
W_conv1 = sess.run(tf.reshape(conv1_16, [32, 1, 5, 5]))
fig1,ax1 = plt.subplots(nrows=1, ncols=32, figsize = (32,1))
for i in range(32):
  ax1[i].imshow( W_conv1[i][0])           
plt.title('W_conv1 32×5×5')
plt.show()

上一篇：python 多进程通信模块的简单实现

栏目：Python代码

下一篇：Python3 hashlib密码散列算法原理详解

本文标题：使用Tensorflow实现可视化中间层和卷积层

本文地址：http://www.codeinn.net/misctech/36102.html

更多Python代码

Python代码

使用Tensorflow实现可视化中间层和卷积层

阅读排行

推荐教程