zoukankan      html  css  js  c++  java
  • 多层神经网络与应用—MNIST手写数字识别(一)

    一、单隐藏层神经网络构建与应用

    主要内容:

      1.1载入数据

      1.2建立模型

      1.3训练模型

      1.4评估模型

      1.5应用模型

    1.1载入数据

     1.2建立模型

    1.2.1构建输入层

    #定义标签数据占位符
    x= tf.placeholder(tf.float32, [None, 784], name='X') #图片大小28*28
    y= tf.placeholder(tf.float32, [None, 10], name='Y')

    1.2.2构建隐藏层

    H1_NN=256  #自定义隐藏层神经元数量
    W1 = tf.Variable(tf.random_normal([784,H1_NN])) #全连接x1,x2...
    b1 = tf.Variable(tf.zeros([H1_NN]))    #偏置项
    Y1 = tf.nn.relu(tf.matmul(x,W1)+b1)

    1.2.3构建输出层

    W2 = tf.Variable(tf.random_normal([H1_NN,10]))
    b2 = tf.Variable(tf.zeros([10]))
    forward = tf.matmul(Y1, W2) + b2
    pred=tf.nn.softmax(forward)  #多分类预测结果

    1.3训练模型

    1.3.1定义损失函数、设置训练参数、选择优化器、定义准确率

    loss_function = tf.reduce_mean(-tf.reduce_sum(y*tf.log(pred),reduction_indices=1))   #定义交叉熵损失函数
    
    #设置训练参数
    train_epochs = 40   #训练轮数
    batch_size=50      #单次训练样本数(批次大小)
    total_batch= int(mnist.train.num_examples/batch_size)#一轮训练有多少批次
    display_step=1     #显示粒度
    learning_rate=0.01   #学习率
    
    #选择优化器
    optimizer = tf.train.AdamOptimizer(learning_rate).minimize(loss_function)
    
    #定义准确率
    correct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(pred,1))
    accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))#准确率,将布尔值转化为浮点数,并计算平均值

    1.3.2训练过程

    #记录训练开始时间
    startTime = time()
    
    sess = tf.Session()
    sess.run(tf.global_variables_initializer())
    
    for epoch in range(train_epochs):
        for batch in range(total_batch):
              xs, ys = mnist.train.next_batch(batch_size)  # 读取批次数据
              sess.run(optimizer,feed_dict={x:xs,y:ys})   # 执行批次训练
        #total_batch个批次训练完成后,使用验证数据计算课差与准确率;验证集没有分批
        loss,acc = sess.run([loss_function,accuracy],feed_dict={x:mnist.validation.images,y:mnist.validation.labels})
        #打印训练过程中的详细信息
        if (epoch+1) % display_step == 0:
            print("Train Epoch:",'%02d' %(epoch+1),"Loss=","{:.9f}".format(loss),"Accuracy=","{:.4f}".format(acc))
    
    duration = time()-startTime  #显示运行总时间
    print("Train Finished takes:","{:.2f}".format(duration))
    View Code

    运行结果为:

     分析原因,定义交叉熵损失函数时,有一个log项,log(0)引起的数据不稳定

    # loss_function = tf.reduce_mean(-tf.reduce_sum(y*tf.log(pred),reduction_indices=1))   #定义交叉熵损失函数
    #TensorFlow提供了softmax_cross_entropy_with_logits函数,用于避免因为log(0)值为NaN造成的数据不稳定
    loss_function = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=forward,labels=y))  #注意第一个参数是不做Softmax的前向计算结果

    修改后,运行结果为:

    从上述打印结果可以看出包含256个神经元的单隐层神经网络的分类性能比仅包含一个网络更优。

    1.4评估模型

    #使用测试集评估模型
    accu_test = sess.run(accuracy,feed_dict={x:mnist.test.images,y:mnist.test.labels})
    print("Test Accuracy:",accu_test)

    1.5应用模型

    1.5.1进行预测

    #由于pred预测结果是one-hot编码格式,所以需要转换为0-9数字
    prediction_result = sess.run(tf.argmax(pred,1),feed_dict={x:mnist.test.images})
    print(prediction_result[0:10])  #查看预测结果中的前10项

     1.5.2找出预测错误

    compare_lists = prediction_result==np.argmax(mnist.test.labels,1)
    print(compare_lists)
    
    err_lists=[i for i in range(len(compare_lists)) if compare_lists[i]==False]
    print(err_lists, len(err_lists))  #最后一项即为多少个预测错了

         ........... 

     可见一共有279个预测错误,但这样返回预测错误的下标不够直观,接下来进行修改。

    修改一:

    #定义一个输出错误分类的函数
    def print_predict_errs(labels, prediction):   #标签列表,预测值列表
        count = 0
        compare_lists =(prediction==np.argmax(labels,1))
        err_lists = [i for i in range(len(compare_lists)) if compare_lists [i]==False]
        for x in err_lists:
            print("index="+str(x) + "标签值=",np.argmax(labels[x]),"预测值=",prediction[x])
            count += 1
        print("总计:"+str(count))
    
    print_predict_errs(labels=mnist.test.labels,prediction=prediction_result)

    运行结果:

     以文本显示,仍然不够直观,进一步修改。

    修改二(+可视化):

    https://www.cnblogs.com/HuangYJ/p/11642475.html中6.1节可视化函数修改,以便只显示预测错误的样本

    #可视化
    def plot_images_labels_prediction(images,labels,prediction,num=10):   #图像列表,标签列表,预测值列表,从第index个开始显示 , 缺省一次显示10幅
        j = 0
        fig = plt.gcf() #获取当前图表,get current figure
        fig.set_size_inches(10,12)  #1英寸等于2.54cm
    
        compare_lists = prediction_result == np.argmax(mnist.test.labels, 1)
        err_lists = [i for i in range(len(compare_lists)) if compare_lists[i] == False]
    
        if num > 25:
            num = 25  #最多显示25个子图
    
        for i in range(0, num):
            ax = plt.subplot(5,5,i+1)  #获取当前要处理的子图
            ax.imshow(np.reshape(images[err_lists[j]], (28, 28)),cmap='binary')  # 显示第index个图像
            title = "label=" + str(np.argmax(labels[err_lists[j]]))# 构建该图上要显示的
            if len(prediction)>0:
                title += ",predict="+ str(prediction[err_lists[j]])
            ax.set_title(title, fontsize=10)  #显示图上title信息
            ax.set_xticks([])  #不显示坐标轴
            ax.set_yticks([])
            j += 1
        plt.show()
    
    plot_images_labels_prediction(mnist.test.images,mnist.test.labels,prediction_result,25)  #最多显示25张
    View Code

    显示前25个预测错误的样本,预测结果为:

    全部代码为:

    #Created by:Huang
    #Time:2019/10/15 0015.
    
    import tensorflow as tf
    import tensorflow.examples.tutorials.mnist.input_data as input_data
    import matplotlib.pyplot as plt
    import numpy as np
    from time import time
    
    mnist = input_data.read_data_sets("MNIST_data/",one_hot=True)
    
    #定义标签数据占位符
    x= tf.placeholder(tf.float32, [None, 784], name='X') #图片大小28*28
    y= tf.placeholder(tf.float32, [None, 10], name='Y')
    
    #隐藏层
    H1_NN=256  #自定义隐藏层神经元数量
    W1 = tf.Variable(tf.random_normal([784,H1_NN])) #全连接x1,x2...
    b1 = tf.Variable(tf.zeros([H1_NN]))    #偏置项
    Y1 = tf.nn.relu(tf.matmul(x,W1)+b1)
    
    #输出层
    W2 = tf.Variable(tf.random_normal([H1_NN,10]))
    b2 = tf.Variable(tf.zeros([10]))
    forward = tf.matmul(Y1, W2) + b2
    pred=tf.nn.softmax(forward)  #多分类预测结果
    
    
    # loss_function = tf.reduce_mean(-tf.reduce_sum(y*tf.log(pred),reduction_indices=1))   #定义交叉熵损失函数
    #TensorFlow提供了softmax_cross_entropy_with_logits函数,用于避免因为log(0)值为NaN造成的数据不稳定
    loss_function = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=forward,labels=y))  #注意第一个参数是不做Softmax的前向计算结果
    
    
    #设置训练参数
    train_epochs = 40   #训练轮数
    batch_size=50      #单次训练样本数(批次大小)
    total_batch= int(mnist.train.num_examples/batch_size)#一轮训练有多少批次
    display_step=1     #显示粒度
    learning_rate=0.01   #学习率
    
    #选择优化器
    optimizer = tf.train.AdamOptimizer(learning_rate).minimize(loss_function)
    
    #定义准确率
    correct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(pred,1))
    accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))#准确率,将布尔值转化为浮点数,并计算平均值
    
    #记录训练开始时间
    startTime = time()
    
    sess = tf.Session()
    sess.run(tf.global_variables_initializer())
    
    for epoch in range(train_epochs):
        for batch in range(total_batch):
              xs, ys = mnist.train.next_batch(batch_size)  # 读取批次数据
              sess.run(optimizer,feed_dict={x:xs,y:ys})   # 执行批次训练
        #total_batch个批次训练完成后,使用验证数据计算课差与准确率;验证集没有分批
        loss,acc = sess.run([loss_function,accuracy],feed_dict={x:mnist.validation.images,y:mnist.validation.labels})
        #打印训练过程中的详细信息
        if (epoch+1) % display_step == 0:
            print("Train Epoch:",'%02d' %(epoch+1),"Loss=","{:.9f}".format(loss),"Accuracy=","{:.4f}".format(acc))
    
    duration = time()-startTime  #显示运行总时间
    print("Train Finished takes:","{:.2f}".format(duration))
    
    #使用测试集评估模型
    accu_test = sess.run(accuracy,feed_dict={x:mnist.test.images,y:mnist.test.labels})
    print("Test Accuracy:",accu_test)
    
    #模型预测
    #由于pred预测结果是one-hot编码格式,所以需要转换为0-9数字
    prediction_result = sess.run(tf.argmax(pred,1),feed_dict={x:mnist.test.images})
    print(prediction_result[0:10])  #查看预测结果中的前10项
    
    # #找出预测错误
    # compare_lists = prediction_result==np.argmax(mnist.test.labels,1)
    # print(compare_lists)
    #
    # err_lists=[i for i in range(len(compare_lists)) if compare_lists[i]==False]
    # print(err_lists, len(err_lists))  #最后一项即为多少个预测错了
    
    #定义一个输出错误分类的函数
    # def print_predict_errs(labels, prediction):   #标签列表,预测值列表
    #     count = 0
    #     compare_lists =(prediction==np.argmax(labels,1))
    #     err_lists = [i for i in range(len(compare_lists)) if compare_lists [i]==False]
    #     for x in err_lists:
    #         print("index="+str(x) + "标签值=",np.argmax(labels[x]),"预测值=",prediction[x])
    #         count += 1
    #     print("总计:"+str(count))
    
    # print_predict_errs(labels=mnist.test.labels,prediction=prediction_result)
    
    
    #可视化
    def plot_images_labels_prediction(images,labels,prediction,num=10):   #图像列表,标签列表,预测值列表,从第index个开始显示 , 缺省一次显示10幅
        j = 0
        fig = plt.gcf() #获取当前图表,get current figure
        fig.set_size_inches(10,12)  #1英寸等于2.54cm
    
        compare_lists = prediction_result == np.argmax(mnist.test.labels, 1)
        err_lists = [i for i in range(len(compare_lists)) if compare_lists[i] == False]
    
        if num > 25:
            num = 25  #最多显示25个子图
    
        for i in range(0, num):
            ax = plt.subplot(5,5,i+1)  #获取当前要处理的子图
            ax.imshow(np.reshape(images[err_lists[j]], (28, 28)),cmap='binary')  # 显示第index个图像
            title = "label=" + str(np.argmax(labels[err_lists[j]]))# 构建该图上要显示的
            if len(prediction)>0:
                title += ",predict="+ str(prediction[err_lists[j]])
            ax.set_title(title, fontsize=10)  #显示图上title信息
            ax.set_xticks([])  #不显示坐标轴
            ax.set_yticks([])
            j += 1
        plt.show()
    
    plot_images_labels_prediction(mnist.test.images,mnist.test.labels,prediction_result,25)  #最多显示25张
    MNIST_NN8.1 Code
  • 相关阅读:
    无符号数和有符号数之间赋值和大小比较
    (转)关于Linux核心转储文件 core dump
    mysql忘记root密码解决办法
    CentOS7安装iptables防火墙
    CENTOS7下安装REDIS
    iptables命令(备忘)
    ps 命令详解
    virtualenv
    How to Baskup and Restore a MySQL database
    linux 用户/用户组添加修改删除(ubuntu/centos)
  • 原文地址:https://www.cnblogs.com/HuangYJ/p/11675779.html
Copyright © 2011-2022 走看看