zoukankan      html  css  js  c++  java
  • TensorFlow学习笔记(一):数据操作指南

    扩充 TensorFlow tf.tile

    对数据进行扩充操作

    import tensorflow as tf
    temp = tf.tile([1,2,3],[2])
    temp2 = tf.tile([[1,2],[3,4],[5,6]],[2,3])
    with tf.Session() as sess:
        print(sess.run(temp))
        print(sess.run(temp2))
    [1 2 3 1 2 3]
    
    [[1 2 1 2 1 2] 
    [3 4 3 4 3 4] 
    [5 6 5 6 5 6] 
    [1 2 1 2 1 2] 
    [3 4 3 4 3 4] 
    [5 6 5 6 5 6]]

    拼接  tf.concat(values, axis, name='concat')  tf.stack(values, axis=0, name='stack')

     

    TensorFlow提供两种类型的拼接:

    • tf.concat(values, axis, name='concat'):按照指定的已经存在的轴进行拼接

    • tf.stack(values, axis=0, name='stack'):按照指定的新建的轴进行拼接

    t1 = [[1, 2, 3], [4, 5, 6]]
    t2 = [[7, 8, 9], [10, 11, 12]]
    tf.concat([t1, t2], 0) ==> [[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]]
    tf.concat([t1, t2], 1) ==> [[1, 2, 3, 7, 8, 9], [4, 5, 6, 10, 11, 12]]
    tf.stack([t1, t2], 0)  ==> [[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]]
    tf.stack([t1, t2], 1)  ==> [[[1, 2, 3], [7, 8, 9]], [[4, 5, 6], [10, 11, 12]]]
    tf.stack([t1, t2], 2)  ==> [[[1, 7], [2, 8], [3, 9]], [[4, 10], [5, 11], [6, 12]]]
    t1 = [[1, 2, 3], [4, 5, 6]]
    t2 = [[7, 8, 9], [10, 11, 12]]
    tf.concat([t1, t2], 0)  # [2,3] + [2,3] ==> [4, 3]
    tf.concat([t1, t2], 1)  # [2,3] + [2,3] ==> [2, 6]
    tf.stack([t1, t2], 0)   # [2,3] + [2,3] ==> [2*,2,3]
    tf.stack([t1, t2], 1)   # [2,3] + [2,3] ==> [2,2*,3]
    tf.stack([t1, t2], 2)   # [2,3] + [2,3] ==> [2,3,2*]

     

    抽取 tf.slice()  tf.gater()

    • tf.slice(input_, begin, size, name=None):按照指定的下标范围抽取连续区域的子集

    • tf.gather(params, indices, validate_indices=None, name=None):按照指定的下标集合从axis=0中抽取子集,适合抽取不连续区域的子集

    input = [[[1, 1, 1], [2, 2, 2]],
             [[3, 3, 3], [4, 4, 4]],
             [[5, 5, 5], [6, 6, 6]]]
    tf.slice(input, [1, 0, 0], [1, 1, 3]) ==> [[[3, 3, 3]]]
    tf.slice(input, [1, 0, 0], [1, 2, 3]) ==> [[[3, 3, 3],
                                                [4, 4, 4]]]
    tf.slice(input, [1, 0, 0], [2, 1, 3]) ==> [[[3, 3, 3]],
                                               [[5, 5, 5]]]
                                               
    tf.gather(input, [0, 2]) ==> [[[1, 1, 1], [2, 2, 2]],
                                  [[5, 5, 5], [6, 6, 6]]]

    假设我们要从input中抽取[[[3, 3, 3]]],这个输出在inputaxis=0的下标是1,axis=1的下标是0,axis=2的下标是0-2,所以begin=[1,0,0]size=[1,1,3]

    假设我们要从input中抽取[[[3, 3, 3], [4, 4, 4]]],这个输出在inputaxis=0的下标是1,axis=1的下标是0-1,axis=2的下标是0-2,所以begin=[1,0,0]size=[1,2,3]

    假设我们要从input中抽取[[[3, 3, 3], [5, 5, 5]]],这个输出在inputaxis=0的下标是1-2,axis=1的下标是0,axis=2的下标是0-2,所以begin=[1,0,0]size=[2,1,3]

    假设我们要从input中抽取[[[1, 1, 1], [2, 2, 2]],[[5, 5, 5], [6, 6, 6]]],这个输出在input的axis=0的下标是[0, 2],不连续,可以用tf.gather抽取。

    类型转化 tf.cast()

    tf.cast(x, dtype, name=None):转化为dtype指定的类型
    tf.to_double(x, name='ToDouble'):转化为tf.float64
    tf.to_float(x, name='ToFloat'):转化为tf.float32
    tf.to_int32(x, name='ToInt32'):转化为tf.int32
    tf.to_int64(x, name='ToInt64'):转化为tf.int64

    形状转化 tf.reshape()

    tf.reshape(tensor, shape, name=None)

    自定义 op tf.py_func()

    通过tf.py_func(func, inp, Tout, stateful=True, name=None)可以将任意的python函数func转变为TensorFlow op。

    func接收的输入必须是numpy array,可以接受多个输入参数;输出也是numpy array,也可以有多个输出。inp传入输入值,Tout指定输出的基本数据类型。

    先看一个解析json的例子,输入是一个json array,输出是一个特征矩阵。

    import tensorflow as tf
    import numpy as np
    import json
    
    json_str_1 = '''
    {"name": "shuiping.chen",
    "score": 95,
    "department": "industrial engineering",
    "rank": 2
    }
    '''
    json_str_2 = '''
    {"name": "zhuibing.dan",
    "score": 87,
    "department": "production engineering",
    "rank": 4
    }
    '''
    
    input_array = np.array([json_str_1, json_str_2])
    
    def parse_json(json_str_array):
        fea_dict_array = [ json.loads(item) for item in json_str_array ]
        ret_feature = []
        for fea_dict in fea_dict_array:
            feature = [fea_dict["score"], fea_dict["rank"]]
            ret_feature.append(feature)
        return np.array(ret_feature, dtype=np.float32)
    
    parse_json_op = tf.py_func(parse_json, [input_array], tf.float32)
    sess = tf.Session()
    print sess.run(parse_json_op)

    再看一个多输入多输出的例子,输入两个numpy array,输出三个array,分别是和、差、乘积

    array1 = np.array([[1, 2], [3, 4]], dtype=np.float32)
    array2 = np.array([[5, 6], [7, 8]], dtype=np.float32)
    
    def add_minus_dot(array1, array2):
        return array1 + array2, array1 - array2, np.dot(array1, array2)
    
    add_minus_dot_op = tf.py_func(add_minus_dot, [array1, array2], [tf.float32, tf.float32, tf.float32])
    print sess.run(add_minus_dot_op)
     
  • 相关阅读:
    配置webstorm使用supervisor时出现 /usr/bin/env: node: 没有那个文件或目录 解决方法
    解决Ubuntu不能挂载ntfs格式硬盘
    git远程操作
    git重写历史记录
    git撤销命令
    git查看历史命令
    git分支管理和stash
    git的忽略文件和删除文件操作
    homebrew学习(四)之取消homebrew自动更新
    homebrew学习(三)之homebrew命令
  • 原文地址:https://www.cnblogs.com/DLlearning/p/7885734.html
Copyright © 2011-2022 走看看