zoukankan      html  css  js  c++  java
  • tensorFlow(五)深层神经网络

    TensorFlow基础见前博客

    上实例:

    MNIST 数据集介绍

    MNIST 是一个手写阿拉伯数字的数据集。
    其中包含有 60000 个已经标注了的训练集,还有 10000 个用于测试的测试集。
    本次实验的任务就是通过手写数字的图片,识别出具体写的是 0-9 之中的哪个数字。
     
    理论知识回顾
    一个两层的深层神经网络结构如下:
    image
    1. 上图所示的是一个具有两层隐藏层的深层神经网络
    2. 第一个隐藏层有 4 个节点,对应的激活函数为 ReLu 函数
    3. 第一个隐藏层有 2 个节点,对应的激活函数也是 Relu 函数
    4. 最后,输出层使用 softmax 函数作为激活函数

    激活函数定义(activation function):

    模型设计

    上一个教程类似:
    1. MNIST 数据一共有 784 个输入,所以我们需要一个有 784 个节点的输入层。
    2. MNIST 数据使用 One-Hot 格式输出,有 0-9 10 个 label,分别对应是否为数字 0-9,所以我们在输出层有 10 个节点,由于 0-9 的概率是互斥的,我们使用 Softmax 函数作为该层的激活函数。
    不一样的是我们可以通过调整深度神经网络的层次来看看能不能达到不一样的效果。
     

    训练模型

    • 数据准备
      首先我们需要先下载 MNIST 的数据集。使用以下的命令进行下载:
       

    wget https://devlab-1251520893.cos.ap-guangzhou.myqcloud.com/t10k-images-idx3-ubyte.gz
    wget https://devlab-1251520893.cos.ap-guangzhou.myqcloud.com/t10k-labels-idx1-ubyte.gz
    wget https://devlab-1251520893.cos.ap-guangzhou.myqcloud.com/train-images-idx3-ubyte.gz
    wget https://devlab-1251520893.cos.ap-guangzhou.myqcloud.com/train-labels-idx1-ubyte.gz

    实例代码:

    #-*- encoding:utf-8 -*-
    #!/usr/local/env python
    
    import numpy as np
    import tensorflow as tf
    from tensorflow.examples.tutorials.mnist import input_data
    
    def add_layer(inputs, in_size, out_size, activation_function=None):
        W = tf.Variable(tf.random_normal([in_size, out_size]))
        b = tf.Variable(tf.zeros([1, out_size]) + 0.01)
    
        Z = tf.matmul(inputs, W) + b
        if activation_function is None:
            outputs = Z
        else:
            outputs = activation_function(Z)
    
        return outputs
    
    
    if __name__ == "__main__":
    
        MNIST = input_data.read_data_sets("mnist", one_hot=True)
    
        learning_rate = 0.01
        batch_size = 128
        n_epochs = 70
    
        X = tf.placeholder(tf.float32, [batch_size, 784])
        Y = tf.placeholder(tf.float32, [batch_size, 10])
    
        layer_dims = [784, 500, 500, 10]
        layer_count = len(layer_dims)-1 # 不算输入层
        layer_iter = X
    
        for l in range(1, layer_count): # layer [1,layer_count-1] is hidden layer
            layer_iter = add_layer(layer_iter, layer_dims[l-1], layer_dims[l], activation_function=tf.nn.relu)
        prediction = add_layer(layer_iter, layer_dims[layer_count-1], layer_dims[layer_count], activation_function=None)
    
        entropy = tf.nn.softmax_cross_entropy_with_logits(labels=Y, logits=prediction)
        loss = tf.reduce_mean(entropy)
    
        optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss)
    
        init = tf.initialize_all_variables()
    
        with tf.Session() as sess:
            sess.run(init)
    
            n_batches = int(MNIST.test.num_examples/batch_size)
            for i in range(n_epochs):
                for j in range(n_batches):
                    X_batch, Y_batch = MNIST.train.next_batch(batch_size)
                    _, loss_ = sess.run([optimizer, loss], feed_dict={X: X_batch, Y: Y_batch})
                    if i % 10 == 5 and j == 0:
                        print "Loss of epochs[{0}]: {1}".format(i, loss_)
    
            # test the model
            n_batches = int(MNIST.test.num_examples/batch_size)
            total_correct_preds = 0
            for i in range(n_batches):
                X_batch, Y_batch = MNIST.test.next_batch(batch_size)
                preds = sess.run(prediction, feed_dict={X: X_batch, Y: Y_batch})
                correct_preds = tf.equal(tf.argmax(preds, 1), tf.argmax(Y_batch, 1))
                accuracy = tf.reduce_sum(tf.cast(correct_preds, tf.float32)) 
    
                total_correct_preds += sess.run(accuracy)
    
            print "Accuracy {0}".format(total_correct_preds/MNIST.test.num_examples)

    代码讲解

    add_layer 函数

    允许用户指定上一层的输出节点的个数作为 input_size,本层的节点个数作为 output_size,并指定激活函数 activation_function可以看到我们调用的时候位神经网络添加了两个隐藏层输出层
     
    for l in range(1, layer_count): # layer [1,layer_count-1] is hidden layer
        layer_iter = add_layer(layer_iter, layer_dims[l-1], layer_dims[l], activation_function=tf.nn.relu)
    prediction = add_layer(layer_iter, layer_dims[layer_count-1], layer_dims[layer_count], activation_function=None)
    
    entropy = tf.nn.softmax_cross_entropy_with_logits(labels=Y, logits=prediction)
    loss = tf.reduce_mean(entropy)

    神经网络配置

    注意这一行,我们配置了一个深度的神经网络,它包含两个隐藏层,一个输入层和一个输出层 隐藏层的节点数为 500
     
    layer_dims = [784, 500, 500, 10]

    执行结果:

    Loss of epochs[5]: 19.5915279388
    Loss of epochs[15]: 7.20698690414
    ...
    Loss of epochs[65]: 0.24952724576
    Accuracy 0.939
    View Code

    可以看到经过 70 轮的训练,准确度大约在 94% 左右

    探索(play around)

    你可以通过修改下面的这个代码片段来修改整个神经网络。
        layer_dims = [784, 500, 500, 10]

    比如你可以去掉一层隐藏层,并将隐藏层的节点数改为 600

        layer_dims = [784, 600, 10]

    训练完的结果大概是这样:

    Loss of epochs[5]: 13.1280488968
    Loss of epochs[15]: 9.14239501953
    Loss of epochs[25]: 3.60039186478
    ...
    Loss of epochs[65]: 3.32054066658
    Accuracy 0.9161
    View Code

    准确度大概 92% 的样子。have fun!

  • 相关阅读:
    RabbitMQ指南之一:"Hello World!"
    Java8新特性之五:Optional
    Java8新特性之四:接口默认方法和静态方法
    Java8新特性之三:Stream API
    Java8新特性之二:方法引用
    Notepad++编辑器——Verilog代码片段和语法检查
    数电(5):半导体存储电路
    数电(4):组合逻辑电路
    DDR3_新版(1):IP核调取和官方例程仿真
    数电(2):逻辑代数的基本定理
  • 原文地址:https://www.cnblogs.com/fclbky/p/9626514.html
Copyright © 2011-2022 走看看