zoukankan      html  css  js  c++  java
  • keras 修仙笔记一

    对于牛逼的程序员,人家都喜欢叫他大神;因为大神很牛逼,人家需要一个小时完成的技术问题,他就20分钟就搞定。Keras框架是一个高度集成的框架,学好它,就犹如掌握一个法宝,可以呼风唤雨。所以学keras 犹如在修仙,呵呵。请原谅我无厘头的逻辑。

    Kera是一个高度集成化的框架,面向高层的抽象,他是python语言写的,同时也可以运行在tensorflow或者cntk之上(即后台运行可以是tensorflow或者cntk),他可以快速的构建你的机器学习模型,但也因为高度封装的原因,也会失去一些改写的灵活性。

    首先来看看导入的类,可以有哪些:

    import numpy as np
    #import tensorflow as tf
    from keras import layers
    from keras.layers import Input, Dense, Activation, ZeroPadding2D, BatchNormalization, Flatten, Conv2D
    from keras.layers import AveragePooling2D, MaxPooling2D, Dropout, GlobalMaxPooling2D, GlobalAveragePooling2D
    from keras.models import Model
    from keras.preprocessing import image
    from keras.utils import layer_utils
    from keras.utils.data_utils import get_file
    from keras.applications.imagenet_utils import preprocess_input
    import pydot
    from IPython.display import SVG
    from keras.utils.vis_utils import model_to_dot
    from keras.utils import plot_model
    from kt_utils import *
    
    import keras.backend as K
    K.set_image_data_format('channels_last')
    import matplotlib.pyplot as plt
    from matplotlib.pyplot import imshow
    
    %matplotlib inline

    尤其是

    from keras.layers import Input, Dense, Activation, ZeroPadding2D, BatchNormalization, Flatten, Conv2D

    from keras.layers import AveragePooling2D, MaxPooling2D, Dropout, GlobalMaxPooling2D, GlobalAveragePooling2D

    这样的函数,顺手捏来就可以使用了。就像一些积木似的,可以用来快速成型。

    现在有一个例子:

    就是有人组织一场party,到场参加的必须是带着笑容了,因为门口有摄像头,通过摄像头会识别来的人是否是带着笑容的,如果是,则自动开门放行,如果不是则不会开门。

    第一步:参数的初始化(模拟数据)

    def mean_pred(y_true, y_pred):
        return K.mean(y_pred)
    
    def load_dataset():
        train_dataset = h5py.File('datasets/train_happy.h5', "r")  # h5py 是一种数据存储格式
        train_set_x_orig = np.array(train_dataset["train_set_x"][:]) # your train set features
        train_set_y_orig = np.array(train_dataset["train_set_y"][:]) # your train set labels
    
        test_dataset = h5py.File('datasets/test_happy.h5', "r")
        test_set_x_orig = np.array(test_dataset["test_set_x"][:]) # your test set features
        test_set_y_orig = np.array(test_dataset["test_set_y"][:]) # your test set labels
    
        classes = np.array(test_dataset["list_classes"][:]) # the list of classes
        
        train_set_y_orig = train_set_y_orig.reshape((1, train_set_y_orig.shape[0]))
        test_set_y_orig = test_set_y_orig.reshape((1, test_set_y_orig.shape[0]))
        
    return train_set_x_orig, train_set_y_orig, test_set_x_orig, test_set_y_orig, classes

    小测:

    X_train_orig, Y_train_orig, X_test_orig, Y_test_orig, classes = load_dataset()
    
    # Normalize image vectors
    X_train = X_train_orig/255.
    X_test = X_test_orig/255.
    
    # Reshape
    Y_train = Y_train_orig.T
    Y_test = Y_test_orig.T
    
    print ("number of training examples = " + str(X_train.shape[0]))
    print ("number of test examples = " + str(X_test.shape[0]))
    print ("X_train shape: " + str(X_train.shape))
    print ("Y_train shape: " + str(Y_train.shape))
    print ("X_test shape: " + str(X_test.shape))
    print ("Y_test shape: " + str(Y_test.shape))

    图片是(64,64,3)

    训练集 600张

    测试集 150张

    第二步:用keras建立模型

    根据keras的快速原型:这些方法都是在导入keras时候导入的
    def model(input_shape):
       X_input = Input(input_shape) # 底层是tensorflow ,其实是创建placeholder存放变量
       X=ZeroPadding2D((3,3))(X_input) # 建立padding画布,主要适配不同图片尺寸或者避免边缘特征磨损的情况
       X=Conv2D(32,(7,7)),strides=(1,1),name=’conv0’)(x)  ##32 是过滤核的数量;(7,7)是过滤核的宽度和高度,strides是卷积的部长,name是对其进行命名
       X = BatchNormalization(axis = 3, name = 'bn0')(X) #规范化,控制过拟合
       X=Activation(‘relu’)(x) #激活函数
       X=MaxPooling2D((2,2),name=’max_pool’)(x) #池化
    
       X = Flatten()(X) #全连接,多维转为一维 
       X=Dense(1,activation=’sigmoid’,name=’fc’)(x) #激活函数,和全连接
       model=Model(input=X_input,outputs=X,name=’HappyModel’)
    
       return model

    在上面给出的模型中,我们可以看到都一直都用X作为变量,其实这个无所谓了,因为底层已经根据给出的别名X,Z1,A1,Z2,A2等已经赋值并缓存起来了。而这些方法都是前面导入的函数:

    from keras.layers import Input, Dense, Activation, ZeroPadding2D, BatchNormalization, Flatten, Conv2D

    接下来,我们组装一个模型:

    def HappyModel(input_shape):
      X_input = Input(shape=input_shape)
      X = ZeroPadding2D(padding=(1,1))(X_input)
      X=Conv2D(8,kernel_size=(3,3),strides=(1,1))(x)
      X=BatchNormalization(axis=3)(x)
      X=Activation(‘relu’)(X)
      X=MaxPooling2D(pool_size=(2,2),strides=(2,2),padding=’valid’)(x)
    
     #FC
      X=Flatten()(X)
      Y=Dense(1,activation=’sigmoid’)(x)
      Model = Model(inputs=X_input,outputs=Y,name=’HappyModel’)
    
      Return model

    第三步:训练模型

    在下面训练模型的过程可分为

    1)  创建模型 (如上代码)

    2)  编译模型,使用到函数 model.compile(optimizer=”..”,loss=”..’’,metrics=[“accuracy”])

    3)  训练模型,通过调用model.fit(x=…,y=…,epochs=…,batch_size=…)

            Batch_size:批次数,就是每次有多少个样例参与训练,每次训练迭代epochs次

            Batch_Size 太小,算法在 200 epoches 内不收敛。

            •随着 Batch_Size 增大,处理相同数据量的速度越快。

           •随着 Batch_Size 增大,达到相同精度所需要的 epoch 数量越来越多。

           •由于上述两种因素的矛盾, Batch_Size 增大到某个时候,达到时间上的最优。

             由于最终收敛精度会陷入不同的局部极值,因此 Batch_Size 增大到某些时候,达到最终收敛精度上的最优。如果内存不足,需要把batch_size 设置小一点

    4)  测试模型的数据通过调用 model.evaluate(x=…,y=…)

    具体的使用可以参考中文keras手册:

    http://keras-cn.readthedocs.io/en/latest/layers/core_layer/

    1)  创建模型:

    happyModel = HappyModel((64, 64, 3))

    2)  编译模型:

    import keras
    
    happyModel.compile(optimizer=keras.optimizers.Adam(lr=0.001, beta_1=0.9, beta_2=0.999, epsilon=1e-08, decay=0.0), loss='binary_crossentropy', metrics=['accuracy'])

      # 优化器中Adam

      # lr:大或等于0的浮点数,学习率

     #beta_1/beta_2:浮点数, 0<beta<1,通常很接近1

     # epsilon:大或等于0的小浮点数,防止除0错误

    3)  训练模型:

    happyModel.fit(x=X_train, y=Y_train, batch_size=16, epochs=20)

    4)  测试模型:

    preds = happyModel.evaluate(x=X_test, y=Y_test)
    ### END CODE HERE ###
    print()
    print ("Loss = " + str(preds[0]))
    print ("Test Accuracy = " + str(preds[1]))

    happyModel.summary() :会详细打印出训练的过程

    第四步:实际运用

    预测结果:model.predict(x) 就会打印出匹配的结果 是true 还是flase

    mg_path = 'images/my_image.jpg'
    ### END CODE HERE ###
    img = image.load_img(img_path, target_size=(64, 64))
    imshow(img)
    
    x = image.img_to_array(img)
    x = np.expand_dims(x, axis=0)
    x = preprocess_input(x)
    result = happyModel.predict(x) ###预测结果
    print(result)

    总结:keras训练主要有4大步骤
    Create->Compile->Fit/Train->Evaluate/Test.
    创建-编译-训练-测试
    具体的keras函数可以查看:http://keras-cn.readthedocs.io/en/latest/other

    参考:基础原理http://www.jianshu.com/p/64172378a178

  • 相关阅读:
    Vertica的这些事(九)——-vertica存储统计信息
    Vertica的这些事(八)——-Vertica-管理
    Vertica的这些事(六)——-vertica中group-by-和join-语句的优化
    Vertica的这些事(五)——-谈谈vertica的flex-table
    Vertica的这些事(四)——-vertica加密数据
    Vertica的这些事(三)——Vertica中实现Oracle中的ws_concat功能
    Vertica的这些事(二)——SQL-Server、Oracle、MySQL和Vertica数据库常用函数对比
    Docker_安装和卸载(2)
    Docker_简介(1)
    Jenkins_创建git任务(3)
  • 原文地址:https://www.cnblogs.com/minsons/p/7884629.html
Copyright © 2011-2022 走看看