TensotFlow 应用实例:05- activation function激活函数
本文是我在学习TensotFlow 的时候所记录的笔记,共享出来希望能够帮助一些需要的人。
activation function激活函数,是相对于线性函数的概念,目的就是把线性函数的线“掰弯”的,代码如下:
import tensorflow as tf
import numpy as np
# Linear Nonlinear
# 线性 非线性
# y = Wx 线性函数
# y = AF(Wx) 激励函数
# AF()
# relu sigmoid tanh
# 可以创造自己的激励函数,但是要求激励函数必须是可以微分的
# 因为在误差反向传播的时候,只有可以微分的函数才能够将误差传递回去
# 切记在多层网络的时候不能随便选择激励函数, 因为如果选择不对会造成梯度爆炸和梯度消失的问题
# CNN(Convolutional Neural Network)
# 卷积神经网络推荐使用 relu
# RNN (Recurrent Neural Network)
# 循环神经网络推荐使用 relu or tanh
# 激励函数 activation function 应该放在layer将要输出的时候
# https://www.tensorflow.org/versions/r0.10/api_docs/python/nn/activation_functions_
# relu: 当x<0时候,y=0, 当x>0 时候 y = Wx + b
# softplus 用作分类器
# 每一个activation function 都有自己的适用之处
# 添加神经层
def add_layer(inputs, in_size, out_size, activation_function=None):
# Weights define
# 权重,尽量要是一个随机变量
# 随机变量在生成初始变量的时候比全部为零效果要好的很多
Weights = tf.Variable(tf.random_normal([in_size, out_size]))
# biases define
# 偏值项,是一个列表,不是矩阵,默认设置为0 + 0.1
biases = tf.Variable(tf.zeros([1, out_size]) + 0.1)
# W * x + b
Wx_plus_b = tf.matmul(inputs, Weights) + biases
# 如果activation_function是空的时候就表示是一个线性关系直接放回即可
if activation_function is None:
outputs = Wx_plus_b
else:
outputs = activation_function(Wx_plus_b)
return outputs
# x_data 从-1到1的区间有300个单位
# [:, np.newaxis] 加上一个维度,有300行,有300个例子
x_data = np.linspace(-1, 1, 300)[:, np.newaxis]
# noise is a [0, 0.05]之间的一个随机数
# 加上一个noise使得更像真实的数据
noise = np.random.normal(0, 0.05, x_data.shape)
# y_data = x_data^2 -0.5 + noise
y_data = np.square(x_data) - 0.5 + noise
# define xs ys
# placeholder
# 这里的None表示无论输入多少个sample都可以
# 是一个多行单列的矩阵,或者说是一个列表
xs = tf.placeholder(tf.float32, [None, 1])
ys = tf.placeholder(tf.float32, [None, 1])
# 定义隐藏层 define hidden layer
l1 = add_layer(xs, 1, 10, activation_function=tf.nn.relu)
# 定义输出层 define output layer
# prediction layer
prediction = add_layer(l1, 10, 1, activation_function=None)
# loss function
# 损失函数 axis is new reduction_indices
loss = tf.reduce_mean(tf.reduce_sum(tf.square(ys - prediction),
axis=[1]))
# 进行训练
# 设置学习速率为0.1 通常设置为小于1的数字
train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)
# 对所有的变量进行初始化
# this a very important step
# 如果不进行初始化后续将无法运行
# initialize_all_variables deprecated("2017-03-02", "Use `tf.global_variables_initializer` instead.")
init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)
for i in range(1000):
# train_step 训练
# 其中的feed_dict is input data
sess.run(train_step, feed_dict={xs: x_data, ys: y_data})
if i % 50 is 0:
# run loss, 只要是使用了placeholder的地方都要使用feed_dict传入
print(sess.run(loss, feed_dict={xs: x_data, ys: y_data}))
本文代码GitHub地址 tensorflow_learning_notes