zoukankan      html  css  js  c++  java
  • tensorflow max_pool(最大池化)应用

    1、最大池化

    max pooling是CNN当中的最大值池化操作,其实用法和卷积很类似。

    tf.nn.max_pool(value, ksize, strides, padding, name=None)

    参数是四个,和卷积很类似:

    第一个参数value:需要池化的输入,一般池化层接在卷积层后面,所以输入通常是feature map,依然是[batch, height, width, channels]这样的shape

    第二个参数ksize:池化窗口的大小,取一个四维向量,一般是[1, height, width, 1],因为我们不想在batch和channels上做池化,所以这两个维度设为了1

    第三个参数strides:和卷积类似,窗口在每一个维度上滑动的步长,一般也是[1, stride,stride, 1]

    第四个参数padding:和卷积类似,可以取'VALID' 或者'SAME'

      VALID:边缘不用0填充

      SAME:边缘用0填充

    返回一个Tensor,类型不变,shape仍然是[batch, height, width, channels]这种形式

    2、实现

    示例源码:

    假设有这样一张图,双通道

    第一个通道:

    第二个通道:

    用程序去做最大值池化:

    import tensorflow as tf  
      
    a=tf.constant([  
            [[1.0,2.0,3.0,4.0],  
            [5.0,6.0,7.0,8.0],  
            [8.0,7.0,6.0,5.0],  
            [4.0,3.0,2.0,1.0]],  
            [[4.0,3.0,2.0,1.0],  
             [8.0,7.0,6.0,5.0],  
             [1.0,2.0,3.0,4.0],  
             [5.0,6.0,7.0,8.0]]  
        ])  
      
    a=tf.reshape(a,[1,4,4,2])  
      
    pooling=tf.nn.max_pool(a,[1,2,2,1],[1,1,1,1],padding='VALID')  
    with tf.Session() as sess:  
        print("image:")  
        image=sess.run(a)  
        print (image)  
        print("reslut:")  
        result=sess.run(pooling)  
        print (result)  

    输出结果:

    image:  

    [[[[ 1.  2.]  

       [ 3.  4.]  

       [ 5.  6.]  

       [ 7.  8.]]  

      [[ 8.  7.]  

       [ 6.  5.]  

       [ 4.  3.]  

       [ 2.  1.]]  

      [[ 4.  3.]  

       [ 2.  1.]  

       [ 8.  7.]  

       [ 6.  5.]]  

      [[ 1.  2.]  

       [ 3.  4.]  

       [ 5.  6.]  

       [ 7.  8.]]]]  

    reslut:  

    [[[[ 8.  7.]  

       [ 6.  6.]  

       [ 7.  8.]]  

      [[ 8.  7.]  

       [ 8.  7.]  

       [ 8.  7.]]  

      [[ 4.  4.]  

       [ 8.  7.]  

       [ 8.  8.]]]]

    import tensorflow as tf
    
    a = tf.constant([
        [[1.0, 2.0, 3.0, 4.0],
         [5.0, 6.0, 7.0, 8.0],
         [8.0, 7.0, 6.0, 5.0],
         [4.0, 3.0, 2.0, 1.0]],
        [[4.0, 3.0, 2.0, 1.0],
         [8.0, 7.0, 6.0, 5.0],
         [1.0, 2.0, 3.0, 4.0],
         [5.0, 6.0, 7.0, 8.0]]
    ])
    
    a = tf.reshape(a, [1, 4, 4, 2])
    
    pooling = tf.nn.max_pool(a, [1, 2, 2, 1], [1, 1, 1, 1], padding='SAME')
    with tf.Session() as sess:
        print("image:")
        image = sess.run(a)
        print(image)
        print("reslut:")
        result = sess.run(pooling)
        print(result)

    输出结果:

    image:
    [[[[ 1. 2.]
    [ 3. 4.]
    [ 5. 6.]
    [ 7. 8.]]

    [[ 8. 7.]
    [ 6. 5.]
    [ 4. 3.]
    [ 2. 1.]]

    [[ 4. 3.]
    [ 2. 1.]
    [ 8. 7.]
    [ 6. 5.]]

    [[ 1. 2.]
    [ 3. 4.]
    [ 5. 6.]
    [ 7. 8.]]]]
    reslut:
    [[[[ 8. 7.]
    [ 6. 6.]
    [ 7. 8.]
    [ 7. 8.]]

    [[ 8. 7.]
    [ 8. 7.]
    [ 8. 7.]
    [ 6. 5.]]

    [[ 4. 4.]
    [ 8. 7.]
    [ 8. 8.]
    [ 7. 8.]]

    [[ 3. 4.]
    [ 5. 6.]
    [ 7. 8.]
    [ 7. 8.]]]]

    平均池化avg_pool 用法与max_pool一致

  • 相关阅读:
    c++0.9-----c++ primer之noexcept解读
    c++0.8-----快速定位c++源码位置的小技巧
    c++0.7-----源码分析:iostate及badbit/failbit/eofbit/goodbit以及io文件的包含关系<原创>
    c++0.6-----如何在自己搭建的c++环境中使用extern变量
    c++0.5-----如何在widows下面搭建最简洁的c++环境
    c++0.4-----面向对象的三种关系(继承/复合/委托)
    c++0.3----this指针/static/namespace
    c++0.2-----基于对象的类(包含指针)
    3、静态代理模式
    2、工厂方法模式
  • 原文地址:https://www.cnblogs.com/lovephysics/p/7219302.html
Copyright © 2011-2022 走看看