zoukankan html css js c++ java
tensorflow和python操作中的笔记

　　前一段时间做了一些项目，把一些笔记放在了txt中，现分享出来，自己也能够时长预习。
1） 读取文件时，将固定的文件地址，采用数组或者字符串的形式，提前表示出来，后期使用时候采用拼接操作
2）    # 得到该目录下的文件
    file_list = os.listdir(base_path + '/data/cnn_train/')
    file_list
    Out[6]: ['finance', 'it', 'sports']
3） 打开一个文件
    f = open(base_path + '/data/cnn_train/' + c + '/' + files, 'r', encoding='gbk', errors='ignore')
4） 使用re.sub(pattern, repl, string),进行特定字符的替换，中间参数是要替换的字符，返回需要的字符串
5） 用list()将分词后的数据变成列表的形式，便于后期处理
6） 对于数据来说，数据集是一个列表，数据的标记也是一个列表，用于后期处理
    post_list(data)
    lebel_list(label)
7) .append()方法，在后面追加数据的时候是保持原来数据的形状的情况下实现的
    a = ['d', 'e', 'w', 'o', 'uo']
    b = b = ['d', 'e', 'w', 'o', 'uo']
    a.append(b)
    ['d', 'e', 'w', 'o', 'uo', ['d', 'e', 'w', 'o', 'uo']]
8)    itertools,python的内置模块
    一个重要的方法：chain(),给他一个list,tuple,iterables，将他们链接在一起;返回iterables对象
    a = ['deng', 'ye', 'xun']
    itertools.chain(a)
9）    Counter是实现的dict的一个子类，用来方便计数。from collections import Counter
    统计元素出现的个数：Counter(可迭代对象），返回是一个字典，放回字符的个数。例如：
    a = 'abcasddejioahnfus'
    Counter(a)
    Out[27]: 
Counter({'a': 3,
         'b': 1,
         'c': 1,
         'd': 2,
         'e': 1,
         'f': 1,
         'h': 1,
         'i': 1,
         'j': 1,
         'n': 1,
         'o': 1,
         's': 2,
         'u': 1})
    

10）存到字典里面：{x:i for i,x in enumerate(XXX)}
    存到数组里面：[x for x in XXX]
    
    x = [ '的', '在', '了', '是', '和']
    d = {x:i for i,x in enumerate(x)}
    d:{'了': 2, '和': 4, '在': 1, '是': 3, '的': 0}
11) numpy.random.permutation      随机排列一个序列,返回一个排列的序列;
    函数shuffle与permutation都是对原来的数组进行重新洗牌（即随机打乱原来的元素顺序）；
    区别在于shuffle直接在原来的数组上进行操作，改变原来数组的顺序，无返回值。而permutation不直接在原来的数组上进行操作，而是返回一个新的打乱顺序的数组，并不改变原来的数组
    np.random.permutation(np.arange(10))
    Out[48]: array([3, 8, 1, 2, 9, 4, 0, 7, 5, 6])
    
12) range()返回的是range object，而np.nrange()返回的是numpy.ndarray()  range尽可用于迭代，而np.nrange作用远不止于此，它是一个序列，可被当做向量使用。
    np.arange(10)
    Out[47]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
13) yield就是 return 返回一个值，并且记住这个返回的位置，下次迭代就从这个位置后开始
14)tf.truncated_normal(shape,mean,stdev):shape表示生成张量的维度，mean是均值，stddev是均值。用来生成随机数，随机数与均值的差距不会超过两倍的标准差，而其它的函数则会
15)loss,计算输出值和实际值的损失，这个损失通常采用交叉熵损失。
    tf.nn.softmax_cross_entropy_with_logits()函数是求交叉熵损失函数。功能：计算labels和logits之间的交叉熵。
    # API 说明
    tf.nn.softmax_cross_entropy_with_logits(
    _sentinel=None,
    labels=None,
    logits=None,
    dim=-1,
    name=None
    )
    解释：第一个参数基本不用；第二个参数是一个分类标签，不同的是这个分类标签labels是分类的概率，比如说[0.2,0.3,0.5],所以每一行必须为一个概率分布值
            对于第三个函数，logit本身是一个函数，他把每一个概率p从[0,1]映射到正负无穷区间，形式话表示为logit=ln(p/(1-p))。理解为：原生态的，未经缩放的，视为一种未归一化的log概率。所以softmax的作用是将其归一化到0-1之间，累积和为1，经过softmax加工过的数据可以当做概率来使用。也就是说logits作为softmax的输入。



16)机器学习的任务就是最小化损失，在损失已经确定的情况下，剩下的事情就交给优化器了。本质：梯度下降算法的优化
    常用的优化器：
    1）tf.train.GradientDescentOptimizer(learning_rate, use_looking=False, name='GradientDescent')
        功能：实现梯度下降算法的优化器，此处给一个学习速率就可以了
    2）tf.train.AdagradOptimizer()
        功能：实现Adagrad算法的优化器，此处给一个学习速率就可以了
    3) tf.train.AdamOptimizer()
        功能：实现Adam算法的优化器，默认有参数

17）np.linespace(开始，结束， 间隔),从matlab中学习得到的，构建一个等差数据
18）python 中的zip操作，可以理解成一个拉链，将两个list拉到一起来，组合后合并成一个list
    例子：
    x = zip(['a','b','c'],[1,2,3])
    list(x)
    Out[65]: [('a', 1), ('b', 2), ('c', 3)]
19）在python中，使用.dot()进行矩阵相乘
20）np.array()的强大功能已经体现出来了,切记一定要将数据转化成numpy array
        shuffle_index = np.random.permutation(np.arange(len(y)))
        y:[[0],
         [1],
         [2],
         [3],
         [4],
         [5],
         [6],
         [7],
         [8],
         [9],
         [10],
         [11],
         [12],
         [13],
         [14],
         [15],
         [16],
         [17],
         [18],
         [19]]
        如果不用np.array()就会出错，y[shuffle_index]
        必须使用：np.array(y)[shuffle_index]

21）# tf.reshape(tensor, shape, name=None)的使用.功能：张量变形。和原始张量具有相同的值，但是形状改变。如果shape的一个分量是特殊值-1，则计算该维度的大小，以使总大小保持不变。特别地情况为，一个[-1]维的shape变平成1维。
    # tf.random_normal()必须配合variable使用
    # tf.get_variable(name, shape, initializer) 创建变量。name：变量的名称；shape变量的维度；initializer：变量初始化的方式
    tf.constant_initializer：常量初始化函数

    tf.random_normal_initializer：正态分布

    tf.truncated_normal_initializer：截取的正态分布

    tf.random_uniform_initializer：均匀分布

    tf.zeros_initializer：全部是0

    tf.ones_initializer：全是1

    tf.uniform_unit_scaling_initializer：满足均匀分布，但不影响输出数量级的随机值
    
    
22）tf.Graph()函数非常重要
    1.可以通过Tensorboard图形化界面展示出流程结构
    2.整合一段代码为一个整体存在于图中
    声明情况有三种：1）通过张量本身直接给出Graph;2)通过声明一个默认的，然后定义张量内容，在后面可以调用或保存;3)通过多个声明，在后面通过变量名来分别调用
    对graph的操作主要有三种：1）保存；2）从pb文件中读取；3）穿插调用
23）tf.train.write_graph(一个图，保存路径，文件名， False),写一个图到一个文件中
24）加载图，tf.import_graph_def(graph_def, name='')
25）tf.nn.embedding_lookup：Looks up ids in a list of embedding tensors，在词嵌入张量中查找ids
    tf.nn.embedding_lookup(
    params,
    ids,
    partition_strategy='mod',
    name=None,
    validate_indices=True,
    max_norm=None
    )
26）tf.expand_dims(),在特定索引的位置上增加一个维度
    tf.expand_dims(
    input,
    axis=None,
    name=None,
    dim=None
    )
27）卷积操作：tf.nn.conv2d(input, filter, strides, padding)，给定一个4维输入和滤波器张量，计算2维卷积。输出，和输入具有相同的维度
    给定输入张量的形状：[batch, in_height, in_width, in_channels]，滤波器张量的形状：[filter_height, filter_width, in_channels, out_channels]
    对于strides=[1, stride, stride, 1], strides[0]=strides[3]=1,默认必须
28）tf.nn.bias_add(value, bias)，将偏差项bias加到value上。value是一个tensor，bias必须是1维的。value可以有不同的维度，bias要和values的最后1维度相同
29）tf.nn.max_pool(value, ksize, strides, padding, name=None);在输入张量上执行最大池化
    value:需要池化的输入数据，一般是接在卷积层后面，通常为feature，shape=[batch, height, width, channels],4维数据同输入数据一致
    ksize:池化窗口的大小，取一个4维向量，shape=[1, height, width, 1],不想在batch和channels做池化，这两个维度为1
    strides：窗口在每一个维度上滑动的步长，一般也是shape=[1, stride, stride, 1]
    padding:为'VALID''SAME'
30)tf.nn.relu(features):计算非线性值，即max(features, 0),features是卷积后加上偏置的值
31)tf.concat(values, axis):沿着一个维度拼接张量。axis=0,按照行，横着接，对接到后面。
32)tf.nn.dropout(x, keep_prob):防止过拟合。x:输入tensor；keep_prob:每个元素被保留下来的概率，float类型。根据给定的keep_prob,将tensor x按照比例输出
33)tf.contrib.layers.xavier_initializer():返回一个用于初始化权重的初始化程序Xavier，保持每一层的梯度大小都差不多相同。返回初始化权重矩阵
    tf.contrib.layers.xavier_initializer(
    uniform=True,
    seed=None,
    dtype=tf.float32
    )
34)tf.nn.l2_loss(tensor):利用L2范数计算张量的误差值，但是没有开方并且只取了L2范数的一半。output=sum(t**2)/2。在这里为什么要计算w的平方，这是一个正则化项，需要将这个损失添加到train_loss上，W的每一个数值都要计算机平方
35)tf.nn.xw_plus_b(x, weight, biases):计算机matmul(x, weight)+b
36)tf.reduce_mean(x, axis):根据输入张量的维度计算均值。axis=1是求行均值，axis=0是求列均值
    tf.reduce_mean(
    input_tensor,
    axis=None,
    keepdims=None,
    name=None,
    reduction_indices=None,
    keep_dims=None
    )
37)tf.argmax(input, axis):计算输入tensor的行或者列的最大值的索引。0表示按列，1表示按行。返回：一般是行或列的最大值下标向量
    tf.argmax(
        input,
        axis=None,
        name=None,
        dimension=None,
        output_type=tf.int64
    )
38)tf.equal(x,y):返回矩阵或者向量对应位置相等的元素真值。相等返回True，不等返回False
39)tf.cast(x, dtype):类型转换函数，将一个张量转换到其它类型。dtype目标类型
40)在整个session运行之前，图中的所有variable必须要被初始化。variable的值在sess.run(inti)之后就确定了，Tensor的值要在sess.run(x)之后确定
41)tf.summary.scalar(name, tensor) 对标量数据汇总和记录，一般在画loss和accuary时用到
42)global_step在优化器train的时候使用很方便，就是统计全局执行的步数，训练到多少轮了，类似于一个钟表。
    初始化：global_step = tf.Variable(0, trainalbe=False)
    train_op = optimizer.minimize(loss, global_step=global_step)

43)定义了词嵌入矩阵，将输入的词id转化成词向量，这里的词嵌入矩阵是可以训练的，最后将词向量结果增加了一个维度，为了匹配CNN的输入.然而研究证明，TextCnn在文本分类问题上有着更加卓越的表现

在工作用到TextCNN做query推荐，并结合先关的文献，谈几点经验： 
1、TextCNN是一个n-gram特征提取器，对于训练集中没有的n-gram不能很好的提取。对于有些n-gram，可能过于强烈，反而会干扰模型，造成误分类。 
2、TextCNN对词语的顺序不敏感，在query推荐中，我把正样本分词后得到的term做随机排序，正确率并没有降低太多，当然，其中一方面的原因短query本身对term的顺序要求不敏感。隔壁组有用textcnn做博彩网页识别，正确率接近95%，在对网页内容（长文本）做随机排序后，正确率大概是85%。 
3、TextCNN擅长长本文分类，在这一方面可以做到很高正确率。 
4、TextCNN在模型结构方面有很多参数可调，具体参看文末的文献。

44)tf.train.latest_checkpoint:发现最新保存的checkpoint文件
    tf.train.latest_checkpoint(
    checkpoint_dir,
    latest_filename=None
    )
45)tf.get_collection():使用默认图加载数据列表
    tf.get_collection(
    key,
    scope=None
)
46)当你使用tensorflow是你会定义一个图，然后给这个图feed数据和定义一些超参，注意当网络被保存时，placeholder()是不会被保存的
    在恢复网络的时候，不仅要恢复图好权重，也需要准备一个新的feed_dict，将新的训练数据喂给网络。我们可以使用graph.get_tensor_by_name('weights:0')获得已保存的operations和placeholder variables
47)np.load()和np.save()是numpy专用的二进制类型保存和加载数据，使用他读写数组很方便。
    np.save(filename, X)；第一个参数为存储的文件名，第二个参数为需要存储的数组(1维或者2维度)
    np.load(filename):将数据读出维array类型
48)含有yield函数不是一般的函数，他会把函数变成一个generator,调用此函数不会执行该函数，而是返回一个iterator对象。在for循环时，每次循环都会执行函数内部代码，执行到yield x时候，函数就返回一个迭代值，下次迭代时候就会从yield的下一条语句执行
    yield 的好处是显而易见的，把一个函数改写为一个 generator 就获得了迭代能力，比起用类的实例保存状态来计算下一个 next() 的值，不仅代码简洁，而且执行流程异常清晰。
49)tf.summary.FileWriter
    ...create a graph...
    # Launch the graph in a session.
    sess = tf.Session()
    # Create a summary writer, add the 'graph' to the event file.
    writer = tf.summary.FileWriter(<some-directory>, sess.graph)
50)shutil模块中的rmtree移除整个目录，无论是否为空。shutil.rmtree(目录路径)
51)tf.assign():通过给value值来更新ref
    tf.assign(
        ref,
        value,
        validate_shape=None,
        use_locking=None,
        name=None
    )
52)记住，在写tensorflow网络的时候，对于每一个部分都要使用tf.name_sacope('name')明确定义域，这样在tensorboard查看时比较清晰；还有，对于每一个变量，每一个常量都要有name，这一点非常重要
53)tensorboard的可视化是一个好东西，summary是概要，保存变量。
    tf.summary.scalar('name', var);
    tf.summary.histogram('name', var);
    writer = tf.summary.FileWriter(logdir, sess.graph)
    merged = tf.summary.merge_all()
    summary = sess.run(merged)
    writer.add_summary(summary, i)
54)深度神经网络代码
def nn_layer(input_tensor, input_dim, output_dim, layer_name, act=tf.nn.relu):
    # 定义大节点的名字
    with tf.name_scope(layer_name):
        with tf.name_scope('weight'):
            weights = tf.Variable(tf.truncated_normal([input_dim, output_dim]), dtype=tf.float32, name='weight')
            tf.summary.histogram('weights', weights)
        with tf.name_scope('bias'):
            biases = tf.Variable(tf.constant(0.1, dtype=tf.float32, shape=[output_dim]), name='bias')
            tf.summary.histogram('biases', biases)
        with tf.name_scope('wx_plus_b'):
            preactivate = tf.nn.bias_add(tf.matmul(input_tensor, weights), biases)
            tf.summary.histogram('preactivate', preactivate)
        activation = act(preactivate, name='activation')
        return activation
55)对于dropout和relu的两个操作，relu是包含在上一节点的操作中，是激活部分，不可缺少。所以，先relu之后再对结果dropout
    keep_prob是保留概率，即我们要保留的RELU的结果所占比例，tensorflow建议的语法是，让它作为一个placeholder，在run时传入
56)tf.placeholder(tf.float32, name='')
57)词频统计的最有效方式是：Counter()函数，和itertools组合使用时，必须要用*来指引
    sen = [['deng'],['ye','xun'],['meihao']]
    Counter(list(itertools.chain(*sen)))
58)tensorflow使用训练好的模型做测试。有两种方法，第一种方法：saver.save()和saver.restore()方法，不方便在于使用模型的时候必须把模型的结构重新定义一遍，然后载入对应名字的变量值，
    但是我们所希望的是能够读取一个文件然后就直接使用模型，而不是要把模型重新定义一遍；第二种方法，不需要重新定义网络结构，从文件中将保存的graph所有节点加载到当前的default中，并返回一个saver，这样在
    保存的时候除了将变量的值保存下来，还保存了对应graph中的各种节点，所以模型的结构同样被保存下来。
59)data = np.array([[1,2,3],[4,5,6]];data.shape结果:(2,3),那么data.shape[1]就是取出列数
60)模型越深越宽，就越复杂，也就很难训练。要有耐心，一定要等到收敛结束再看结果
61)tf.contrib.rnn.BasicRNNCell(num_units, forget_bias=1.0, stat_is_tuple=True)：最近本的RNN单元，num_units输入RNN单元的个数，隐含层神经元的个数;forget_bias=1.0不会遗忘，为0，就都忘记。stat_is_tuple默认是True，是说返回的状态用
一个元组表示，state=(c, h)。有一个状态初始化函数，zero_state(batch_size, dtype),batch_size是输入样本批次额数目.
    LSTM中有两个状态值，分别是c和h，对应想要的输出。其中h作为当前状态输出的同时，也是下一时间段的输入的一部分
62)例子，
    import tensorflow as tf
    
    batch_size = 4
    input = tf.random_normal(shape=[3, batch_size, 6], dtype=tf.float32)
    cell = tf.nn.rnn_cell.BasicaLSTMCell(10, forget_bias=1.0, state_is_tuple=True)
    init_state = cell.zero_state(batch_size, dtype=tf.float32)
    output, final_state = tf.nn.dynamic_rnn(cell, input, inittial_state=init_state, time_major=True)
    # time_major如果是True，就表示RNN的steps用第一个维度表示，建议用这个，运行速度块
    # 如果是True，output的维度是[steps, batch_size, depth], 反之就是[batch_size, max_time, depth],就是和输入一样的
    # final_state是整个LSTM输出的最终的状态，包含c和h，c和h的维度都是[batch_size, n_hidden]

63)搭建LSTM要点
# 把784个点的字符信息还原成 28 * 28 的图片
# 下面几个步骤是实现 RNN / LSTM 的关键
####################################################################
# **步骤1：RNN 的输入shape = (batch_size, timestep_size, input_size) 
X = tf.reshape(_X, [-1, 28, 28])
 
# **步骤2：定义一层 LSTM_cell，只需要说明 hidden_size, 它会自动匹配输入的 X 的维度
lstm_cell = rnn.BasicLSTMCell(num_units=hidden_size, forget_bias=1.0, state_is_tuple=True)
 
# **步骤3：添加 dropout layer, 一般只设置 output_keep_prob
lstm_cell = rnn.DropoutWrapper(cell=lstm_cell, input_keep_prob=1.0, output_keep_prob=keep_prob)
 
# **步骤4：调用 MultiRNNCell 来实现多层 LSTM
mlstm_cell = rnn.MultiRNNCell([lstm_cell] * layer_num, state_is_tuple=True)
 
# **步骤5：用全零来初始化state
init_state = mlstm_cell.zero_state(batch_size, dtype=tf.float32)
 
# **步骤6：方法一，调用 dynamic_rnn() 来让我们构建好的网络运行起来
# ** 当 time_major==False 时， outputs.shape = [batch_size, timestep_size, hidden_size] 
# ** 所以，可以取 h_state = outputs[:, -1, :] 作为最后输出
# ** state.shape = [layer_num, 2, batch_size, hidden_size], 
# ** 或者，可以取 h_state = state[-1][1] 作为最后输出
# ** 最后输出维度是 [batch_size, hidden_size]
# outputs, state = tf.nn.dynamic_rnn(mlstm_cell, inputs=X, initial_state=init_state, time_major=False)
# h_state = outputs[:, - 1, :]  # 或者 h_state = state[-1][1]
 
# *************** 为了更好的理解 LSTM 工作原理，我们把上面 步骤6 中的函数自己来实现 ***************
# 通过查看文档你会发现， RNNCell 都提供了一个 __call__()函数（见最后附），我们可以用它来展开实现LSTM按时间步迭代。
# **步骤6：方法二，按时间步展开计算
outputs = list()
state = init_state
with tf.variable_scope('RNN'):
    for timestep in range(timestep_size):
        if timestep > 0:
            tf.get_variable_scope().reuse_variables()
        # 这里的state保存了每一层 LSTM 的状态
        (cell_output, state) = mlstm_cell(X[:, timestep, :], state)
        outputs.append(cell_output)


64)tf.app.run()函数：用来处理flag解析，然后执行main函数。
    tf.app.flags.DEFINE_boolean('self_test', False, 'True is running a self test')
    tf.app.flags.DEFINE_boolean('use_fp16', False, 'whta is true')
    FLAGS = tf.flags.FALAGS
    执行过程：首先加载flags参数项，然后执行main()函数。参数是使用tf.app.flags.FLAGS中定义的
    例子：
    import tensorflow as tf
    
    FLAGS = tf.app.flags.FLAGS
    # 定义
    tf.app.flags.DEFINE_string('string', 'train', 'This is a string')
    tf.app.flags.DEFINE_float('learning_rate', 0.001, 'This is a learning_rate')
    tf.app.flags.DEFINE_boolean('boolean', True, 'This is a flag')
    
    def main():
        print('string', FLAGS.string)
        print('learning_rate', FLAGS.learning_rate)
        print('boolean', FLAGS.boolean)
        
    if __name__ == '__mian__':
        tf.app.run()
        
        
65)当网络达到收敛时，要懂得调参技巧，调整方法就是保持其它参数不变，只调整一个参数，需要调整的参数有：
    1)learning_rate
    2)minibatch size
    3)epoch
    4)filter size
    5)number of filter:奇数个
    网络调参的主方向：1.更深的网络，2.更加复杂的结构
    
66)os.listdir(str):获取字符串下目录下的所有子目录
67)os.path.join(str1, str2, str3):用于拼接文件路径，其中可以传入多个参数
68)codecs:读写中英文字符，编码转换。使用：codecs.open()
67)copy.copy(obj):属于浅拷贝
68)python数据存储于读取，pickle.dump(),pickel.load()
69)@property:为默认的属性生成getter和setter方法
70)numpy.squeeze(a, axis=None):删除数组中的单维度条目，shape=1的删除
71)numpy.argsort(a, axis=1):将矩阵a按照axis排序，axis=0，行固定，改变列；axis=1，列固定，改变行。返回排序后的下标值索引。
72)numpy.random.choice(a=x, size=3，p):随机等概率地从x中选取3个数据，p指定一个分布
73)tf.reset_default_graph:清除默认的图站，重置全局默认图
74)tf.one_hot(indices, depth)返回一个one_hot 张量，indices一维的索引，就是要存放one hot哪一个为1， depth表示one hot dimension.
75)tf.add_to_collection('list_name', element):将元素element添加到列表list_name中
76)tf.get_collection('list_name'):返回名称为list_name的列表。进行样本预测的时候使用。既然是list就可以通过下标索引的方式获取数值
77)tf.get_default_graph(),一个默认的图总是被注册了，就是会出现，调用该方法就是获得当前默认图
78)tf.Graph.get_operation_by_name(name):根据名称返回操作节点
79)tf.Graph.get_tensor_by_name(name):根据名称返回tensor数据
80)未登录词：没有被收录在分词词表中但必须切分出来的词，包括各类专有名词（人名，地名，企业名），缩写词、新增词汇等。
81)停用词：对预料建设没有作用的词，的，了，而且，等等
82)元组转化为数组形式，好东西：np.array()
83)Graph是一个就像一个大容器，OP,Tensor, Variable是这个大容器的组成部分
84)模型的使用，卡了很久的解决办法，现在贴出来
checkpoint_file=tf.train.latest_checkpoint(checkpoint_directory)
graph=tf.Graph()

 with graph.as_default():
     session_conf = tf.ConfigProto(allow_safe_placement=True, log_device_placement =False)
     sess = tf.Session(config = session_conf)
     with sess.as_default():
          saver =     tf.train.import_meta_graph("{}.meta".format(checkpoint_file))
          saver.restore(sess,checkpoint_file)
          input = graph.get_operation_by_name("input").outputs[0]
          prediction=graph.get_operation_by_name("prediction").outputs[0]
          #newdata=put your data here
          print sess.run(prediction,feed_dict={input:newdata})
85)收获：今早对新的样本进行了模型的结果预测。遇到的问题是，传递给feed_dict{}的x数据要和原始训练模型输入的数据维度保持一致。
    我们在查看一个矩阵的shape时候，显示的是矩阵的形状，如shape=[2,3],表示一个二维矩阵，第一个维度有2个元素，第二个维度有3个元素，只是代表形状，不代表具体矩阵
    当传递给feed里面的占位符时候，需要实际具体的矩阵而不是形状，如二维矩阵：x_data:[[1,2],[1,1]]，总之形状和具体矩阵不要混淆。
86)预测一个样本实例：
# 模型预测
with tf.Session() as sess:
    # 加载元数据,找到流程图
    new_saver = tf.train.import_meta_graph(model_path)
    # 加载ckpt
    new_saver.restore(sess, tf.train.latest_checkpoint(model_name))
    # 获取节点
    target = tf.get_collection('pred_network')[0]
    graph = tf.get_default_graph()
    # 获取placeholder,要注意，不同scope下的名字要一层一层的调用才能找到最终的操作.一定要使用获取该操作后的那个outputs的输出，然后取第一个
    # 必须要有outputs[0]，目前我还不知道这个是啥意思。
    input_x = graph.get_operation_by_name('inputs/inputs').outputs[0]
    keep_p = graph.get_operation_by_name('keep_prob/keep_prob').outputs[0]

    pred_result = sess.run(target, feed_dict={input_x: x1, keep_p: 1.0})
    print(pred_result)


87)tf.nn.conv1d();跟2维卷积相比，没有厚度的卷积。
tf.nn.conv1d(
    value,
    filters,
    stride,
    padding,
    use_cudnn_on_gpu=None,
    data_format=None,
    name=None
)

value: A 3D Tensor. Must be of type float16 or float32.
filters: A 3D Tensor. Must have the same type as value.
stride: An integer. The number of entries by which the filter is moved right at each step.
padding: 'SAME' or 'VALID'
use_cudnn_on_gpu: An optional bool. Defaults to True.
data_format: An optional string from "NWC", "NCW". Defaults to "NWC", the data is stored in the order of [batch, in_width, in_channels]. The "NCW" format stores data as [batch, in_channels, in_width].
name: A name for the operation (optional).

二维卷积：
tf.nn.conv2d():
tf.nn.conv2d(
    input,
    filter,
    strides,
    padding,
    use_cudnn_on_gpu=True,
    data_format='NHWC',
    dilations=[1, 1, 1, 1],
    name=None
)

input: A Tensor. Must be one of the following types: half, bfloat16, float32, float64. A 4-D tensor. The dimension order is interpreted according to the value of data_format, see below for details.
filter: A Tensor. Must have the same type as input. A 4-D tensor of shape [filter_height, filter_width, in_channels, out_channels]
strides: A list of ints. 1-D tensor of length 4. The stride of the sliding window for each dimension of input. The dimension order is determined by the value of data_format, see below for details.
padding: A string from: "SAME", "VALID". The type of padding algorithm to use.
use_cudnn_on_gpu: An optional bool. Defaults to True.
data_format: An optional string from: "NHWC", "NCHW". Defaults to "NHWC". Specify the data format of the input and output data. With the default format "NHWC", the data is stored in the order of: [batch, height, width, channels]. Alternatively, the format could be "NCHW", the data storage order of: [batch, channels, height, width].
dilations: An optional list of ints. Defaults to [1, 1, 1, 1]. 1-D tensor of length 4. The dilation factor for each dimension of input. If set to k > 1, there will be k-1 skipped cells between each filter element on that dimension. The dimension order is determined by the value of data_format, see above for details. Dilations in the batch and depth dimensions must be 1.
name: A name for the operation (optional).

88)当出现：
UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 11126: illegal multibyte sequence
解决：可以使用‘ignore’属性进行忽略，如：open(‘1.txt’,encoding=’gb18030’，errors=‘ignore’)
89)编码不正常：file_name = open('d:/a.txt', 'r', encoding='utf-8')。读取文件的时候要加上编码限制。
90)tf.ConfigProto()用来创建session的时候对session进行参数配置
    tf.ConfigProto(log_device_placement=True):记录设备指派情况，可以获取operations和Tensor被指派到哪个设备上运行，会在终端打印出任何操作
    tf.ConfigProto(allow_soft_placement=True):自动选择运行设备。在tf中，通过命令with tf.device('/cpu:0')，允许手动设置操作运行的设备，如果手动设置的设备不存在或者不可用，就会导致tf程序等待或异常，为了防止这种情况，可以设置tf.ConfigProto()中参数allow_soft_placement=True，允许tf自动选择一个存在并且可用的设备来运行操作。
    限制GPU资源的使用
    操作:session_conf = tf.ConfigProto(log_device_placement=True)
        sess = tf.Session(conf=session_conf)

91)采用枚举类型自动为list中的数据做索引，可以同时得到数据和索引        
    例子：
    filter_sizes = [1,2,3]
    for i, filter_size in enumerate(filter_sizes)

92) 建立一个时间戳，独一无二的数据。建立一个绝对路径目录，在该处您能够存储自己的数据
    timestamp = str(int(time.time()))
    out_dir = os.path.abspath(os.path.join(os.path.curdir, "runs", timestamp))
    print("Writing to {}
".format(out_dir))
93)检查目录是否存在。一般我们需要原来就有的目录进行数据操作，以下命令可以很好地服务于我们的工作
    if not os.path.exists(my_dir):
        os.makedirs(my_dir)
94)日期的快速格式：
    datetime.datetime.now().isocalendar()   格式：(2018, 31, 5)
    datetime.datetime.now().isoformat()        格式：'2018-08-03T15:43:30.793866'
    datetime.datetime.now().isoweekday()    格式： 5
95)自定义日期格式：
    datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')
    结果：'2018-08-03 15:51:15'
96)tf.train.global_step(sess, global_step):可以获取当前global_step的值
97)比较骚的一种关于存数据的方法：
    sessdict{}
    if not qid in sessdict:
        sessdict[qid] = []
    # 再往这个字典key=qid的值（为list）追加数据
    sessdict[qid].append(val_one, val_two)
98)遍历字典中的key和value
    d = {'a':1, 'b':2}
    d.items()
99)直接对列表进行排序：
    list.sort(func=None, key=None, reverse=False)
    当reverse=False时：为正向排序；当reverse=True时：为方向排序
    key:以什么来排序
    执行完后会改变原来的list，如果你不需要原来的list，这种效率稍微高点
100)operator.itmgetter()函数：operator模块提供的itemgetter函数用于获取对象的哪些维的数据，参数为一些序号。
    要注意，operator.itemgetter函数获取的不是值，而是定义了一个函数，通过该函数作用到对象上才能获取值。
    例如：a = [('john', 'A', 15), ('jane', 'B', 12), ('dave', 'B', 10)]，根据第2个域和第3个域进行排序
    v.sort(key=operator.itemgetter(1,2))
101)把数字变成字符串，在打印输出的时候使用最为方便：str(28)
102)对于一个字符串，我们要处理这个字符串里面的每一个字符，那么，可以先用特殊的分隔符如'	'或者' '，把他组成一个列表。如
    strings = 'I am very happy'
    words = strings.strip().split(' ')
103)读取文件，并进行操作的最佳方式
    for line in open('./folder/a.txt'):
        s = line.strip().split('	')
    写入文件的最佳方式
    of = open('./folder/a.txt', 'w'):
        of.write('a b c')
        of.write('this is end! + '
')
    of.close()

104)计算两句话的编辑距离，不用夹角余弦了。
    from nltk.metrics import distance
    distance.edit_distance('中国的首都', '中国的首都在哪')
105)SPARQL使用
from SPARQLWrapper import SPARQLWrapper, JSON


def QA():
    # 初始化，endpoint对外提供服务的链接，D2RQ默认的链接：http://localhost:2020/sparql
    sparql = SPARQLWrapper('http://localhost:2020/sparql')
    # 设置查询语句
    sparql.setQuery(
        """
            PREFIX : <http://www.kgdemo.com#>
            PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
            
            select ?n where{
                ?s rdf:type :Person.
                ?s :personName '巩俐'.
                ?s :hasActedIn ?o.
                ?o :movieTitle ?n.
                ?o :movieRating ?r.
            FILTER(?r >= 7)
            }
        """
    )
    # 设置返回个格式为JSON
    sparql.setReturnFormat(JSON)
    results = sparql.query().convert()

    # {'head': {'vars': ['n']},
    #  'results': {'bindings': [{'n': {'type': 'literal', 'value': '2046'}},
    #                           {'n': {'type': 'literal', 'value': 'Memoirs of a Geisha'}},
    #                           {'n': {'type': 'literal', 'value': '荆轲刺秦王'}},
    #                           {'n': {'type': 'literal', 'value': '大红灯笼高高挂'}},
    #                           {'n': {'type': 'literal', 'value': '霸王别姬'}},
    #                           {'n': {'type': 'literal', 'value': '活着'}},
    #                           {'n': {'type': 'literal', 'value': '唐伯虎点秋香'}},
    #                           {'n': {'type': 'literal', 'value': '秋菊打官司'}},
    #                           {'n': {'type': 'literal', 'value': '菊豆'}},
    #                           {'n': {'type': 'literal', 'value': 'Hong gao liang'}},
    #                           {'n': {'type': 'literal', 'value': '画魂'}},
    #                           {'n': {'type': 'literal', 'value': '风月'}},
    #                           {'n': {'type': 'literal', 'value': 'Piao Liang Ma Ma'}},
    #                           # {'n': {'type': 'literal', 'value': 'The Hand'}}]}}

    # 遍历找出value的值
    for result in results['results']['bindings']:
        print(result['n']['value'])
        
106)mysql免安装版设置步骤
    1.配置环境变量，把..in下的文件都放入到Path中
    2.初始化mysql，打开cmd，执行命令：mysqld --initialize；
    3.打开mysql服务，打开cmd，执行：mysqld --install；
    4.启动mysql
    5.是因为无法找到MySQL执行文件，需要我们配置注册表，Win+R运行输入regedit来启动注册表，找到HKEY_LOCAL_MECHINE---SYSTEM---CurrentControlSet---services: 
    6.设置root密码，先执行：mysqld --skip-grant-tables
    7.再开启一个命令提示符，执行：mysql。之后，更改root密码：update mysql.user set password=password(“root”) where user = “root”; 
    8.刷新权限：flush privileges;
    9.退出：quit
107)mysqldb是python便于同数据库连接的工具类，使用方便，是mysqldb的一个高级版本，兼容python2和python3
108)mysql数据库操作
    查看数据库的编码格式：show variables like 'character_set_database';
    查看表的的编码格式：show create table entity_relation_info;
    可以使用nvaicat数据库管理软件方便地编辑字符编码，也要不断探索其它的功能
109)mysqladmin -u root -p shutdown
再net start mysql就没有这个错误提示了~
110)使用python编写一个类，方便使用.在一个文件中可以建立一个类，使用一个类，也就是说这个类在哪个文件夹中都行，只要导入即可
    class DataSet(object):
        def __init__(self, data_size):
            self.a = 10
            self.b = 11
            self.c = 12
        def get_batch(self):
            x = self.a
            y = self.b
        
        def get_info(self):
            q = self.a
            z = self.b
    # 使用这个类,构建一个对象
    trainds = DataSet(100);
    one = trains.get_batch()
    
111)进行单元测试的总结
    1.导入unittest包
    2.定义一个Test类，继承自unittest.TestCase
    3.在类中定义各种测试方法，进行测试使用
    4.在主函数中使用:unittest.main()执行单元测试
112)数据库中存储的数据都是字符串
113)argpares是一个好东西，可以在执行训练函数的时候选择参数，
    如：python train.py --hiden_size=200 --num_step = 35
114)SDK软件工具开发包，由第三方服务商提供的实现软件产品某项功能的工具包。通常以集合KPI和文档、范例、工具的形式出现。
    SDK是专业性质的公司提供专业服务的集合。开发者不需要对产品每个功能进行开发，选择合适、稳定的SDK服务并花费很少的精力即可在
    产品中
115)这个数据结构用的比较好
    result = list['row_index'], list['start_index'], list['end_index']
    通过查找result的下标索引找到这3个数据
    result[0],result[1],result[2]
    其中，r是元组
116)repr(object):将对象转化为供解释器读取的形式，str是面向用户的，repr是面向程序员的
    返回：一个对象的string形式
117)插入对c++的学习：
    C++中会常用到.和::和:和->,在此整理一下常用函数的区别
    1.当出现A.B，那么A为结构体或者对象；
    2.当出现A->B，则A为指针，->为成员提取，A->B是提取A中的成员B，A只能是指向类、结构和联合的指针
    3.但出现::，那么为域运算符，A::B指作用域A中的名称B，A可以是命名空间、类、结构
    4.当出现:，一般表示继承
118)C++中的结构体：属于聚合数据类型的一类，它将不同的数据类型整合在一起构成一个新的类型，相当于数据库中的一条记录。和类具有相似的作用，类就是由结构体发展而来。
119)C++中，&引用的一个重要作用就是作为函数的参数
    如：void swap(int &p1, int &p2){}
    常引用，既要引用提高程序的执行效率，又要保护传递给函数的数据不在函数中被改变，就应该使用常引用
    声明格式：const 类型标识符 &引用名=目标变量名；
    不能够通过引用对目标变量的值进行修改，从而使引用的目标成为const，达到了引用的安全性
    例如：    
    int a;
    const int &ra = a;
    ra=1;// 错误
    a=1;// 正确
120)pandas将读取的数据转换为列表，方便操作，df.values.tolist()
查看全文
相关阅读:
MiniUI 在线示例(gridview)
数据库的事务处理和并发控制
 数据库大并发操作要考虑死锁和锁的性能问题
 c# 财务报表数字转大写的方法
 js 实现打印功能1
js 实现打印功能
 《C++ Primer 4th》读书笔记序
 谈谈Vim中实用又好记的一些命令
 《Unix网络编程》卷2 读书笔记第3章- System V IPC
《Unix网络编程》卷2 读书笔记第2章- Posix IPC
原文地址：https://www.cnblogs.com/demo-deng/p/9609215.html