zoukankan      html  css  js  c++  java
  • Python机器学习(七十四)Keras 预处理数据

    首先需要调整数据集的形状,让其包含图像的位深信息。

    打印原始数据集的形状:

    >>> print (X_train.shape)
    (60000, 28, 28)

    可以看到并没有包含图像的位深信息。

    MNIST是灰度图像,位深为1,我们将数据集从形状(n,宽度,高度)转换为(n,位深,宽度,高度)。

    if K.image_data_format() == 'channels_first':
        X_train = X_train.reshape(X_train.shape[0], 1, 28, 28)
        X_test = X_test.reshape(X_test.shape[0], 1, 28, 28)
        input_shape = (1, 28, 28)
    else:
        X_train = X_train.reshape(X_train.shape[0], 28, 28, 1)
        X_test = X_test.reshape(X_test.shape[0], 28, 28, 1)
        input_shape = (28, 28, 1)

    Keras的底层实现库可能是TensorFlow或Theano,它们对数据集的形状要求是不一样的,TensorFlow要求通道在前channels_first,Theano相反。此处,我们使用TensorFlow的格式。

    重新打印X_train的形状:

    print (X_train.shape)
    # (60000, 1, 28, 28)

    可以看到,形状已经变化了,包含了图像的位深信息。

    接下来,输入数据预处理步骤是将数据类型转换为float32,并将数据值归一化到[0,1]范围内。

    X_train = X_train.astype('float32')
    X_test = X_test.astype('float32')
    X_train /= 255
    X_test /= 255
  • 相关阅读:
    Java异常面试题
    Quickhit快速击键
    多态and接口
    Java面向对象编程概述
    学生管理系统--分层开发
    类型转换
    文件上传
    ongl(示例3-6 多值类型的数据处理)
    ongl(原始类型和包装类型)
    Interceptor
  • 原文地址:https://www.cnblogs.com/huanghanyu/p/13173917.html
Copyright © 2011-2022 走看看