zoukankan      html  css  js  c++  java
  • 主成分分析法(PCA)答疑

    问:为什么要去均值?

    1、我认为归一化的表述并不太准确,按统计的一般说法,叫标准化。数据的标准化过程是减去均值并除以标准差。而归一化仅包含除以标准差的意思或者类似做法。
    2、做标准化的原因是:减去均值等同于坐标的移动,把原始数据点的重心移到和原点重合,这样利于很多表达,比如数据的协方差矩阵可以写成XX',若没有减去均值,则XX‘后面还要减去一些东西(还不明白可以参考多元统计分析的书)。除以标准差是为了统一并消除量纲。一个矩阵中有多个向量,有些可能表示了长度,有些表示了重量,除以标准差,才能让它们仅以“数”的概念一起比较运算。
    3、标准化的做法。举例,若你的矩阵A是5行3列,第一列表示长度,第二列表示时间,第三列表示质量,那么矩阵A等同于对这个三个量进行了5次测量,所以5*3.这样3个分量有各自的均值和标准差,对这个矩阵中15个元素均做标准化只要减去长度、时间、质量各自的均值并除以标准差即可。

    4、图像不需要除以标准差,因为他们都是像素值,同量纲同尺度。只减均值就行。

  • 相关阅读:
    数据库范式
    SQL基础
    JAVA流
    response.getWriter()和jsp中的out对象的区别
    JAVA排序(冒泡,直接选择,反转)
    Collections类常用方法
    JAVA集合
    JAVA面向对象(重载,重写 常用的 toString/equals)
    Java面向对象一(封装 继承 多态 类 对象 方法)
    JAVA基础
  • 原文地址:https://www.cnblogs.com/yyxayz/p/4150170.html
Copyright © 2011-2022 走看看