TF2基础知识

zoukankan html css js c++ java

TF2基础知识
一：TF2

1. Eager Execution（即时执行模式）

TensorFlow 2 带来的最大改变之一是将 1.x 的 Graph Execution（图与会话机制）更改为 Eager Execution（即时执行模式，也称动态图机制）。

在 1.x 版本中，低级别 TensorFlow API 首先需要定义数据流图，然后再创建 TensorFlow 会话，这一点在 2.0 中被完全舍弃。TensorFlow 2 中的 Eager Execution 是一种命令式编程环境，可立即评估操作，无需构建图。

如果想要在1.X版本中，可以调 tf.enable_eager_execution() 函数开启即时执行模式。

TensorFlow 2 中，即时执行模式将成为默认模式（不过若要关闭即时执行模式，则需调用 tf.compat.v1.disable_eager_execution() 函数）。

1.x 版本的 TensorFlow：

一个加法运算过程十分复杂。我们需要初始化全局变量 → 建立会话 → 执行计算，最终才能打印出张量的运算结果。
```
init_op = tf.global_variables_initializer()  # 初始化全局变量
with tf.Session() as sess:  # 启动会话
    sess.run(init_op)
    print(sess.run(c + c))  # 执行计算
```
Eager Execution 带来的好处显而易见，其进一步降低了 TensorFlow 的入门门槛。之前的 Graph Execution 模式，实际上让很多人在入门时都很郁闷，因为完全不符合正常思维习惯

2. 自动求导机制

2.1 微分概念：

微分是对局部变化率的一种线性描述。虽然微分和导数是两种不同的概念。

但是对一元函数来说，可微与可导是完全等价的。

如果你熟悉神经网络的搭建过程，应该明白梯度的重要性。而对于复杂函数的微分过程是及其麻烦的，为了提高应用效率，大部分深度学习框架都有自动微分机制。

TensorFlow 中，你可以使用 tf.GradientTape 跟踪全部运算过程，以便在必要的时候计算梯度。

二：Tensorflow基础

1. 张量(Tensor)

1.1 概念

一维数组称之为向量，二维数组称之为矩阵。

张量可以看作N 维数组，变量名为Tensor

如果现在重新描述向量和矩阵，就是：一阶张量为向量，二阶张量为矩阵。当然，零阶张量也就是标量，而更重要的是 N 阶张量，也就是 N 维数组。

1.2 张量的定义

每一个 Tensor 都具备两个基础属性：数据类型（默认：float32）和形状。

TensorFlow 通过三种符号约定来描述张量维度：阶，形状，维数

阶形状维度

0 [] 0-D

1 [D0] 1-D

2 [D0, D1] 2-D

1.3 创建张量
1. 常用数据类型
  
  tf.int： tf.int 64
  
  tf.float ： tf.float 32、tf.float 64
  
  tf.bool： [true]
  
  tf.string： "Hello word"
2. 创建张量
  
  # 定义一个np数组 import numpy as np array1 = np.arange(15).reshape(3, 5) array1
  
  tf.constant ()
  
  Tensor常量，需要指定初始值，定义不变化的张量
  
  # tf.constant(value, dtype=None, shape=None, name='Const') tf.constant([1, 5], dtype=tf.int32)
  
  tf.Variable()
  
  Tensor变量，需要指定初始值，常用于定义可变参数。会将变量标记为"可训练"，被标记的变量会在反向传播中记录梯度信息，例如神经网络的权重训练。
  
  # tf.Variable(value, dtype=None, shape=None, name='Const') tf.Variable([1, 5], dtype=tf.int32)
  
  tf.convert_to_tensor()
  
  将numpy格式的数据转换成Tensor。（tf.constant也可实现）
  
  # tf.convert_to_tensor(value, dtype=None, dtype_hint=None, name=None) Tensor31 = tf.convert_to_tensor(ndarray1, dtype=tf.int64) print(Tensor31) # 等价于下面这句 Tensor32 = tf.constant(ndarray1, dtype=tf.int64) print(Tensor32)
3. Tensor的属性
  
  形状 shape：
  
  Tensor31.shape
  
  数据类型 dtype：
  
  Tensor31.dtype
  
  对应的 NumPy 数组：
  
  Tensor31.numpy()
4. 新建特殊常量张量的方法
  
  tf.zeros ：新建指定形状且全为 0 的常量 Tensor
  
  tf.zeros_like ：参考某个Tensor的形状，新建全为 0 的常量 Tensor
  
  tf.ones ：新建指定形状且全为 1 的常量 Tensor
  
  tf.ones_like ：参考某种形状，新建全为 1 的常量 Tensor
  
  tf.fill ：新建一个指定形状且全为某个标量值的常量 Tensor
  
  # tf.zeros(shape, dtype=tf.float32, name=None) Tensor21 = tf.zeros([3, 3]) # tf.zeros_like(input, dtype=None, name=None) Tensor22 = tf.zeros_like(Tensor21) # 输入为Tensor，意为与Tensor形状一致，且值全为0的常量Tensor # tf.fill(dims, value, name=None) Tensor23 = tf.fill([3, 3], 2) print(Tensor21) print(Tensor22) print(Tensor23)
5. 生成随机张量：
  
  均匀分布的随机数
  
  # 均匀分布在区间[minval, maxval]的随机数 tf.random.uniform(shape=[2,3], minval=0, maxval=10)
  
  生成正态分布的随机数
  
  # 生成正态分布的随机数。默认均值为0、标准差为1 tf.random.normal(shape=[2,3], mean=10, stddev=1)
  
  生成截断式正态分布的随机数
  
  # 生成截断式正态分布的随机数 tf.random.truncated_normal(shape=[2,3], mean=10, stddev=1) # 如果生成的数据在(μ-2δ, μ+2δ)之外，则重新进行生成，保证生成值在均值附近。 # δ：均值，δ：标准差
6. 常用方法
  
  强制类型转换并不会改变原来的类型，而是返回一个新的张量
  
  # tf.cast(x, dtype, name=None) print(Tensor41.dtype) ts1 = tf.cast(Tensor41, dtype=tf.int32) print(Tensor41.dtype) print(ts1.dtype)
  
  求张量维度上元素的最大/小值
  
  # tf.reduce_min(input_tensor, axis=None, keepdims=False, name=None) print(Tensor41) print(tf.reduce_min(Tensor41)) # tf.reduce_max(input_tensor, axis=None, keepdims=False, name=None) print(tf.reduce_max(Tensor41))
7. 其他方法
  
  tf.linspace()
  
  创建一个等间隔序列。
  
  tf.range()
  
  创建一个数字序列。
  
  # tf.linspace(start, stop, num, name=None) tf.linspace(2.0, 6.0, 3)
可以看到返回类型为浮点型

注意：TensorFlow 的大多数 API 函数会根据输入的值自动推断张量中元素的类型（一般默认为 tf.float32 ）。不过你也可以通过加入 dtype 参数来自行指定类型

2. 操作(operation)

TensorFlow 里有大量的操作（Operation），使得我们可以将已有的张量进行运算后得到新的张量。

定义如下Tensor
```
Tensor41 = tf.constant(tf.linspace(1.0, 6.0, 6), shape=(2,3))
Tensor42 = tf.constant(tf.linspace(1.0, 9.0, 9), shape=(3,3))
Tensor43 = tf.constant(tf.linspace(7.0, 12.0, 6), shape=(2,3))
print(Tensor41)
print(Tensor42)
print(Tensor43)
```
2.1 四则运算
```
# add
print(tf.add(Tensor43, Tensor41))
```
两个矩阵中对应元素各自相乘时，要求两个张量维度相同。
```
# subtract
print(tf.subtract(Tensor43, Tensor41))
# multiply
print("数值 x 矩阵
", tf.multiply(10, Tensor41))
print("矩阵 x 矩阵
", tf.multiply(Tensor43, Tensor41))
```
2.2 平方、次方、开方
```
# 定义张量
Tensor5 = tf.fill([3,3], 3)
```
- 平方
  
  # 平方。tf.square(x, name=None) print(tf.square(Tensor5)) # 等价于 print(tf.multiply(Tensor5, Tensor5)) print(tf.pow(Tensor5, 2))
- n次方
  
  # n次方。tf.pow(x, y, name=None) print(tf.pow(Tensor5, 2))
- 开平方
  
  # 开平方。tf.sqrt(x, name=None) Tensor51 = tf.fill([3,3], 9.0) print(Tensor51) print(tf.sqrt(Tensor51))
2.3 点乘
```
# matmul
Tensor4_mat = tf.matmul(Tensor41, Tensor42)
print(Tensor4_mul)
```
2.4 矩阵转置
```
Tensor41 = tf.constant(line[0:5], dtype=float, shape=[1, 5])
# Tensor42 = tf.linalg.matrix_transpose(Tensor41) # 报错
Tensor42 = tf.transpose(Tensor41)
print("矩阵转置
")
print(Tensor41)
print(Tensor42)
```
这些常用 API 都能在 NumPy 中找到对应的方法，这也就是课程需要你预先熟悉 NumPy 的原因。所以说，你可以把 TensorFlow 理解成为 TensorFlow 式的 NumPy + 为搭建神经网络而生的 API。

3. 常用函数

3.1 特征--标签配对

神经网络在训练时，是把输入特征和标签配对后，再喂入网络的。我们可以用tf.data.Dataset.from_tensor_slices 进行配对。

参数除了传入Tensor之外，还可以传入numpy数组。
```
# tf.data.Dataset.from_tensor_slices( (tensor_label, tensor_feature) )。

X = tf.constant([12,21,22,34])
y = tf.constant([0,1,1,0])
dataset = tf.data.Dataset.from_tensor_slices((X, y))
print(dataset)
```
```
for e in dataset:
    print(e)
```
3.2 自动求导
1. 微分概念：
微分是对局部变化率的一种线性描述。虽然微分和导数是两种不同的概念。

但是对一元函数来说，可微与可导是完全等价的。

如果你熟悉神经网络的搭建过程，应该明白梯度的重要性。而对于复杂函数的微分过程是及其麻烦的，为了提高应用效率，大部分深度学习框架都有自动微分机制。

TensorFlow 中，你可以使用 tf.GradientTape 跟踪全部运算过程，以便在必要的时候计算梯度。然后用tf.GradientTape().gradient 进行求导计算。
```
with tf.GradientTape() as tape: # 追踪梯度
    w = tf.Variable([2.0])
    loss = tf.pow(w, 3)

# loss 对 w 求导
grad = tape.gradient(loss, w) 
# 求导结果为：3*w*w => 12
grad
# 输出grap，与我们计算的值一致。
```
3.3 枚举函数

enumerate 函数可将一个可遍历的数据对象(如列表、元组或字符串)

组合为索引序列，同时列出数据和数据下标，一般用在 for 循环当中。
```
lst = ['aa', 'bb', 'cc']
for index, value in enumerate(lst):
    print("%s : %s" %(index,value))
```
3.4 独热编码
```
# 如鸢尾花数据，三分类。
y = tf.constant([1,1,0,2])
classes = 3
y_one_hot = tf.one_hot(y, classes)
print(y_one_hot)
```
前后对比：

0 ==> 1 0 0

1 ==> 0 1 0

2 ==> 0 0 1

可知，独热编码转换过程是：

以[0, x-1]区间内的数字n为例子（x为分类的数量）：
- 将每一个数转换成长度为x位、值全为 0 的二进制数
- 将第n位的 0 转换成1。(位数从0到x-1)
3.5 归一化指数函数

正向传播：https://www.bilibili.com/video/BV1bx411M7Zx

softmax函数可以使n分类的n个输出y0,y1...中，各个输出的概率值。

且这些概率值的和为1。

3.6 自减函数
- 赋值操作，更新参数的值并返回。
- 调用assign_sub前，先用 tf.Variable 定义变量w为可训练（可自更新）。
w.assign_sub(delta, use_locking=None, name=None, read_value=True)
```
w = tf.Variable(tf.constant(4.0))
w.assign_sub(1)
# 相当于： w -= 1
w.numpy()
```
3.7 最大值索引

返回张量沿指定轴方向，最大值的索引

tf.argmax(张量名, axis=操作轴)

4. 常用模块
- tf.：包含了张量定义，变换等常用函数和类。
- tf.data：输入数据处理模块，提供了像 tf.data.Dataset 等类用于封装输入数据，指定批量大小等。
- tf.image：图像处理模块，提供了像图像裁剪，变换，编码，解码等类。
- tf.keras：原 Keras 框架高阶 API。包含原 tf.layers 中高阶神经网络层。
- tf.linalg：线性代数模块，提供了大量线性代数计算方法和类。
- tf.losses：损失函数模块，用于方便神经网络定义损失函数。
- tf.math：数学计算模块，提供了大量数学计算函数。
- tf.saved_model：模型保存模块，可用于模型的保存和恢复。
- tf.train：提供用于训练的组件，例如优化器，学习率衰减策略等。
- tf.nn：提供用于构建神经网络的底层函数，以帮助实现深度神经网络各类功能层。
- tf.estimator：高阶 API，提供了预创建的 Estimator 或自定义组件。
查看全文

相关阅读:
从一个线上服务器警告谈谈backlog
聊聊服务器的负载
 Apache 配置说明
 Apache 服务器性能评估
 php之apc浅探
 Linux 服务器监控命令
 小白学习mysql 之 innodb locks
小白学习mysql之存储过程的优劣分析以及接入控制
 小白学习mysql之索引初步
 小白学习mysql之优化基础（EXPLAIN的连接类型）