zoukankan      html  css  js  c++  java
  • (转载)如何将数据输入到神经网络中?

    https://blog.csdn.net/jxessoft/article/details/108051688

    我们需要弄懂的第一步就是如何将数据输入到神经网络中。例如,在语音识别、人脸识别这些应用中,是如何将语音、人脸信息输入到神经网络中的呢?

    下面我拿识别明星的例子来给大家介绍如何将明星的图片数据输入到神经网络中。
    在这里插入图片描述
    此例中,待输入的数据是一张图像。为了存储图像,计算机要存储三个独立的矩阵(矩阵可以理解成二维数组,后面的教程会给大家详细讲解),这三个矩阵分别与此图像的红色、绿色和蓝色相对应(世界上的所有颜色都可以通过红绿蓝三种颜色调配出来)。如果图像的大小是64 * 64个像素(一个像素就是一个颜色点,一个颜色点由红绿蓝三个值来表示,例如,红绿蓝为255,255,255,那么这个颜色点就是白色),所以3个64 * 64大小的矩阵在计算机中就代表了这张图像,矩阵里面的数值就对应于图像的红绿蓝强度值。上图中只画了个5 * 4的矩阵,而不是64 * 64,为什么呢?因为没有必要,搞复杂了反而不易于理解。

    为了更加方便后面的处理,我们一般把上面那3个矩阵转化成1个向量x(向量可以理解成1 * n或n * 1的数组,前者为行向量,后者为列向量,向量也会在后面的文章专门讲解)。那么这个向量x的总维数就是64 * 64 * 3,结果是12288。在人工智能领域中,每一个输入到神经网络的数据都被叫做一个特征,那么上面的这张图像中就有12288个特征。这个12288维的向量也被叫做特征向量。神经网络接收这个特征向量x作为输入,并进行预测,然后给出相应的结果。

    对于不同的应用,需要识别的对象不同,有些是语音有些是图像有些是传感器数据,但是它们在计算机中都有对应的数字表示形式,通常我们会把它们转化成一个特征向量,然后将其输入到神经网络中。

  • 相关阅读:
    iOS-布局-Masonry
    Xcode-打开代码折叠带
    Xcode-显示代码行数
    iOS-UITextField-通知
    iOS-UITextField-常用方法
    iOS-UIButton-文字位置,字体大小,边角样式,button种类,点击事件,内容位置
    iOS-UIView-设置背景图片4种方式
    windows8.1 plsql连接oracle
    win7_oracle11g_64位连接32位PLSQL_Developer
    oracle字符集的查看和修改
  • 原文地址:https://www.cnblogs.com/liweikuan/p/14226660.html
Copyright © 2011-2022 走看看