zoukankan      html  css  js  c++  java
  • Tensorflow学习笔记No.9

    模型的保存与恢复

    介绍一些常见的模型保存与恢复方法,以及如何使用回调函数保存模型。

    1.保存完整模型

    model.save()方法可以保存完整的模型,包括模型的架构、模型的权重以及优化器

    model.save()的参数为保存路径以及文件名。

    首先我们构建一个简单的Sequential模型,使用fishion_mnist数据集进行训练,得到一个训练后的模型。

     1 import tensorflow as tf
     2 import numpy as np
     3 
     4 (train_image, train_label), (test_image, test_label) = tf.keras.datasets.fashion_mnist.load_data()
     5 
     6 train_image = np.expand_dims(train_image, -1)
     7 test_image = np.expand_dims(test_image, -1)
     8 
     9 model = tf.keras.Sequential()
    10 model.add(tf.keras.layers.Conv2D(32, [3, 3], input_shape = (28, 28, 1), activation = 'relu'))
    11 model.add(tf.keras.layers.Conv2D(64, [3, 3], activation = 'relu'))
    12 model.add(tf.keras.layers.GlobalAveragePooling2D())
    13 model.add(tf.keras.layers.Dense(64, activation = 'relu'))
    14 model.add(tf.keras.layers.Dense(10, activation = 'softmax'))
    15 
    16 model.compile(optimizer = 'adam',
    17               loss = 'sparse_categorical_crossentropy',
    18               metrics = ['acc'])
    19 
    20 history = model.fit(train_image, train_label,
    21                     epochs = 10,
    22                     validation_data = (test_image, test_label))

    使用model.summary()查看当前模型结构:

    1 model.summary()

    训练完成后我们使用model.evaluate()方法对测试集进行评估。

    1 model.evaluate(test_image, test_label)

    正确率如下图所示:

     然后我们使用model.save()方法保存完整模型。

    1 model.save('model_1.h5')

    保存后我们会得到一个名为model_1.h5的文件,这个文件就是保存好的模型。

    保存好的模型会放到指定位置。

    我们可以使用tf.keras.models.load_model()方法来导入我们保存好的模型,参数为已保存模型的储存位置以及文件名。

    1 new_model = tf.keras.models.load_model('model_1.h5')

    我们使用.summary()方法查看一下模型结构是否与之前相同。

    1 new_model.summary()

    可以发现模型结构是完全一致的。

    然后我们使用.evaluate()方法对测试集进行评估,看一下模型权重是否被保存。

    1 new_model.evaluate(test_image, test_label)

    可以发现,loss值与之前完全相同。

    注意:这里acc值发生了很严重的变化,目前不知道我还是什么原因导致的,但这不代表我们保存的模型或者是权重出现了问题,使用.predict()方法依然可以正常对数据进行分类预测,这是我使用.predict()方法预测后与原数据一一比对后确认过的,可能是出现了一个小bug,知道原因的小伙伴可以评论区回复我。

    重申:模型是已经正常保存了的,是可以正常使用的,大家无需担心,loss值足够证明我们的模型是正常保存的。

    2.仅保存模型结构

    有时候我们可能不需要保存模型的权重,而只想保存模型的架构。

    这时可以使用model.to_jison()来获取模型架构。

    1 json = model.to_json()

    json中保存了模型架构的完整信息。

    我们可以使用python的文件操作方法将它写入到磁盘上,使用时再从磁盘上读入即可,这里不详细说明了,大家自行百度即可。

    使用tf.keras.models.model_from_jsom()来恢复模型,参数为我们之前保存模型信息的变量json。

    1 new_model = tf.keras.models.model_from_json(json)

    同样,我们查看模型结构并对模型进行评估。

    1 new_model.summary()

    1 new_model.compile(optimizer = 'adam',
    2               loss = 'sparse_categorical_crossentropy',
    3               metrics = ['acc'])
    4 
    5 new_model.evaluate(test_image, test_label)

    注意,由于我们没有保存优化器,所以要先对模型添加一个优化器再进行评估。

    可以发现loss值非常的大,也就说明的模型没有被训练过,模型中的参数都是随机产生的。

    3.仅保存模型权重

    同样的,我们也可以仅保存模型权重。

    权重的保存有两种方法,可以像上面保存模型结构一样使用model.get_weights()把模型结构读入到变量中再进行保存,也可以使用keras提供的方法直接保存到磁盘上。

    这里主要介绍第二种(主要是第一种用处不大)。

    使用model.save_weights()方法进行保存,参数为保存路径以及文件名。

    1 model.save_weights('weights_1.h5')

    同样,我们会得到一个对应的文件。

    然后使用.load_weigths()方法可以载入权重,参数为路径及文件名。

    1 new_model.load_weights('weights_1.h5')

    对测试集进行评估查看是否被正常载入。

    1 new_model.evaluate(test_image, test_label)

    loss值与之前相同,说明权重被正常载入了。

    注意,保存权重也不会保存优化器,这里不用重定义优化器是因为上面已经给new_model这个对象定义过优化器了。

    4.使用回调函数保存模型

    我觉得这是最实用也是最好的模型保存方法。

    首先定义一个回调函数监测训练过程并保存模型。

    使用tf.keras.callbacks.ModelCheckpoint()来定义这样一个回调函数。

    它的主要参数为:

      filepath:储存位置。

      moinitor = 'val_loss':监视的变量。

      verboss = 0:是否显示详细信息。

      save_best_only = False:为True则会保存loss最低的或者acc最高的。

      save_weihts_only = False:是否只保存权重,为False会保存整个模型。

    1 checkpoint = tf.keras.callbacks.ModelCheckpoint('modelcp', 
    2                                                 save_weights_only = True,
    3                                                 save_best_only = True,
    4                                                 verbose = 1)

    然后我们构建模型训练一下试试。

     1 new_model = tf.keras.models.model_from_json(json)
     2 
     3 new_model.compile(optimizer = 'adam',
     4               loss = 'sparse_categorical_crossentropy',
     5               metrics = ['acc'])
     6 
     7 history = new_model.fit(train_image, train_label,
     8                     epochs = 5,
     9                     validation_data = (test_image, test_label),
    10                     callbacks = [checkpoint])

    要在.fit()中加入callbacks参数调用回调函数。

    可以发现我们的模型信息被保存了,同时多出来三个保存好的文件。

    同样使用.load_weights()来载入权重,并进行评估。

    1 new_model = tf.keras.models.model_from_json(json)
    2 
    3 new_model.compile(optimizer = 'adam',
    4               loss = 'sparse_categorical_crossentropy',
    5               metrics = ['acc'])
    6 
    7 new_model.load_weights('modelcp')
    8 
    9 new_model.evaluate(test_image, test_label)

    得到结果:

    与训练时最后保存的结果相同。

    关于模型的保存方法就介绍到这里了,后续会更新更多内容哦!o(* ̄▽ ̄*)o

  • 相关阅读:
    深拷贝的终极探索(90%的人都不知道)
    VS Code:让你工作效率翻倍的23个插件和23个编辑技巧
    Git使用教程:最详细、最傻瓜、最浅显、真正手把手教!
    【译】使用 ndb 调试 node 应用
    nodejs的express使用介绍
    Koa 框架教程
    VSCode配置Git随记
    单页面路由原理及实现
    可能比文档还详细--VueRouter完全指北
    急速JavaScript全栈教程
  • 原文地址:https://www.cnblogs.com/VioletOrz/p/13890533.html
Copyright © 2011-2022 走看看