zoukankan      html  css  js  c++  java
  • tensorFlow入门实践(三)初识AlexNet实现结构

    参考黄文坚《TensorFlow实战》一书,完成AlexNet的整体实现并展望其训练和预测过程。

    import tensorflow as tf
    
    batch_size = 32
    num_batches = 100
    
    
    # 显示网络每一层结构,展示每一个卷积层或池化层输出tensor的尺寸,接受一个tensor作为输入
    def print_activations(t):
        print(t.op.name, ' ', t.get_shape().as_list())
    
    
    # 接受images作为输入,返回最后一层pool5(第五个池化层)
    # 及parameters(AlexNet中所有需要训练的模型参数)'''
    def inference(images):
        parameters = []
    
        with tf.name_scope('conv1') as scope:
            # 用截断的正态分布函数(标准差为0.1)初始化卷积核的参数kernel。卷积核尺寸为11*11,颜色通道为3,卷积核数量为64
            kernel = tf.Variable(tf.truncated_normal([11, 11, 3, 64],
                        dtype=tf.float32, stddev=1e-1), name='weights')
            # 使用tf.nn.conv2d对输入images完成卷积操作
            conv = tf.nn.conv2d(images, kernel, [1, 4, 4, 1], padding='SAME')
            biases = tf.Variable(tf.constant(0.0, shape=[64], dtype=tf.float32),
                                 trainable=True, name='biases')
            bias = tf.nn.bias_add(conv, biases)
            conv1 = tf.nn.relu(bias, name=scope)
            print_activations(conv1)
            parameters += [kernel, biases]
        # LRN处理和最大池化处理
        lrn1 = tf.nn.lrn(conv1, 4, bias=1.0, alpha=0.001/9, beta=0.75, name='lrn1')
        pool1 = tf.nn.max_pool(lrn1, ksize=[1, 3, 3, 1], strides=[1, 2, 2, 1],
                               padding='VALID', name='pool1')
        print_activations(pool1) # 打印输出结果pool1的结构
    
        # 设计第二个卷积层 卷积核尺寸5*5 输入通道数64 卷积核数量192
        with tf.name_scope('conv2') as scope:
            kernel = tf.Variable(tf.truncated_normal([5, 5, 64, 192],
                                                     dthpe=tf.float32, stddev=1e-1), name='weights')
            # 卷积步长全部设为1,即扫描全图像素
            conv = tf.nn.conv2d(pool1, kernel, [1, 1, 1, 1], padding='SAME')
            biases = tf.Variable(tf.constant(0.0, shape=[192], dtype=tf.float32),
                                 trainable=True, name='biases')
            bias = tf.nn.bias_add(conv, biases)
            conv2 = tf.nn.relu(bias, name=scope)
            parameters += [kernel, biases]
            print_activations(conv2)
    
        lrn2 = tf.nn.lrn(conv2, 4, bias=1.0, alpha=0.001/9, beta=0.75, name='lrn2')
        pool2 = tf.nn.max_pool(lrn2, ksize=[1, 3, 3, 1], strides=[1, 2, 2, 1],
                               padding='VALID', name='pool2')
        print_activations(pool2)
    
        # 创建第三个卷积层 卷积核尺寸3*3 输入通道数192 卷积核数量384 步长全为1
        with tf.name_scope('conv3') as scope:
            kernel = tf.Variable(tf.truncated_normal([3, 3, 192, 384],
                                                     dthpe=tf.float32, stddev=1e-1), name='weights')
            # 卷积步长全部设为1,即扫描全图像素
            conv = tf.nn.conv2d(pool2, kernel, [1, 1, 1, 1], padding='SAME')
            biases = tf.Variable(tf.constant(0.0, shape=[384], dtype=tf.float32),
                                 trainable=True, name='biases')
            bias = tf.nn.bias_add(conv, biases)
            conv3 = tf.nn.relu(bias, name=scope)
            parameters += [kernel, biases]
            print_activations(conv3)
    
        # 创建第四个卷积层 卷积核尺寸3*3 输入通道数384 卷积核数量降为256
        with tf.name_scope('conv4') as scope:
            kernel = tf.Variable(tf.truncated_normal([3, 3, 384, 256],
                                                     dthpe=tf.float32, stddev=1e-1), name='weights')
            # 卷积步长全部设为1,即扫描全图像素
            conv = tf.nn.conv2d(conv3, kernel, [1, 1, 1, 1], padding='SAME')
            biases = tf.Variable(tf.constant(0.0, shape=[256], dtype=tf.float32),
                                 trainable=True, name='biases')
            bias = tf.nn.bias_add(conv, biases)
            conv4 = tf.nn.relu(bias, name=scope)
            parameters += [kernel, biases]
            print_activations(conv4)
    
            # 最后的第五个卷积层 卷积核尺寸3*3 输入通道数256 卷积核数量为256
            with tf.name_scope('conv5') as scope:
                kernel = tf.Variable(tf.truncated_normal([3, 3, 256, 256],
                                                         dthpe=tf.float32, stddev=1e-1), name='weights')
                # 卷积步长全部设为1,即扫描全图像素
                conv = tf.nn.conv2d(conv4, kernel, [1, 1, 1, 1], padding='SAME')
                biases = tf.Variable(tf.constant(0.0, shape=[256], dtype=tf.float32),
                                     trainable=True, name='biases')
                bias = tf.nn.bias_add(conv, biases)
                conv5 = tf.nn.relu(bias, name=scope)
                parameters += [kernel, biases]
                print_activations(conv5)
    
            # 在5个卷积层之后,还有一个最大池化层,这个池化层和前两个卷积层后的池化层一致
            pool5 = tf.nn.max_pool(conv5, ksize=[1, 3, 3, 1], strides=[1, 2, 2, 1],
                                   padding='VALID', name='pool5')
            print_activations(pool5)
    
            return pool5, parameters
            # 在正式使用AlexNet来训练或预测时,还需要添加3个全连接层,隐含节点数分别为4096、4096、1000

     后续形成实现卷积神经网络构建、训练、测试的代码架构,会将Alexnet实现结构重新组织完整和优化。

  • 相关阅读:
    ssh 私匙登录, 文件rswrst权限
    从内存使用的角度来理解.Net底层架构
    (转)C#为什么要使用Invoke,它和BeginInvoke有什么区别
    如何通过微信自定义菜单跳转到自己的网站
    (转)HubbleDotNet+Mongodb 构建高性能搜索引擎--概述
    (转)HubbleDotNet 和 Lucene.net 性能对比测试
    C#异步提示和技巧
    关于System.Windows.Forms.DateTimePicker的一个Bug
    关于frameset中指定区域回退的实现
    java.lang.NoClassDefFoundError Adding a jar to an RCP application
  • 原文地址:https://www.cnblogs.com/veraLin/p/10296242.html
Copyright © 2011-2022 走看看