在看这本书,把第3章看完了,第4章快了,具体知道代码是怎么回事了
import tensorflow as tf
# Nnumpy是一个科学计算的工具包,这里通过工具包生成模拟数据集
from numpy.random import RandomState
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
#定义训练数据batch的大小
batch_size = 8
# 定义神经网络的参数
w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))
# 在shape的一个维度上使用None可以方便使用不同的batch大小。
# 在训练时需要把数据分成较小的batch,但是在测试时,可以一次性使用全部的数据
# 当数据集比较小时这样比较好测试 但数据集比较大师,将大量的数据放入一个batch可能会导致内存的益处
x = tf.placeholder(tf.float32, shape=(None, 2), name='x_input')
y_ = tf.placeholder(tf.float32, shape=(None, 1), name='y_input')
# 定义神经网络前向传播i的过程
a = tf.matmul(x, w1)
y = tf.matmul(a, w2)
# 定义损失函数和反向传播的算法
y = tf.sigmoid(y)
cross_entropy = -tf.reduce_mean(
y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0))
+(1-y) * tf.log(tf.clip_by_value(1-y, 1e-10, 1.0)))
train_step = tf.train.AdamOptimizer(0.001).minimize((cross_entropy))
# 通过随机数生成一个模拟书记
rdm = RandomState(1)
dataset_size = 128
X = rdm.rand(dataset_size, 2)
# 定义规则来给出样本的标签。在这里所有x1 + x2<1的样例都被人为是正样本(比如零件合格)
# 而其他为负样本(比如零件不合格)。和TensorFlow游乐场中的表示法不大一样的地方是,
# 在这里使用0来表示负样本,1来表示正样本。大部分解决分类问题的神经网络都会使用
# 0 和1 的表示方法
Y = [[int(x1+x2 < 1)] for (x1, x2) in X]
# 创建一个会话来进行TensorFlow程序
with tf.Session() as sess:
init_op = tf.global_variables_initializer()
# 初始化变量
sess.run(init_op)
# 在训练之前神经网络参数的值
print(sess.run(w1))
print(sess.run(w2))
# 设定训练的轮数
STEPS = 5000
for i in range(STEPS):
# 每次选取batch_size个样本进行训练
start = (i * batch_size) % dataset_size
end = min(start + batch_size, dataset_size)
#通过选取的样本训练神经网络并更新参数
sess.run(train_step,
feed_dict={x: X[start:end], y_: Y[start:end]})
# 交叉熵是逐渐变小,越下说明预测的结果和真实的结果差距越小
if i % 1000 == 0:
#每隔一段时间计算在所有数据上的交叉熵并输出
total_cross_entropy = sess.run(
cross_entropy, feed_dict={x:X, y_:Y})
print("After %d trainning step(s),cross entrop on all data is %g" % (i, total_cross_entropy))
print(sess.run(w1))
print(sess.run(w2))
'''
定义神经网络的结构和前向传播的输出结果。
2. 定义损失函数以及选择反向传播优化的算法
3. 生成会话( tf.session )并且在训练、数据上反复运行反向传播优化算法
'''
训练的部分还没有看懂