zoukankan      html  css  js  c++  java
  • python PCA

    主要的步骤:

    转载至:http://www.cnblogs.com/chenbjin/p/4200790.html?utm_source=tuicool&utm_medium=referral

    1.数据中心化,均值为0,方差为1(目的:协方差矩阵表示的为方差,方差为1,消除量纲影响(由于最大化方差,主要针对量纲不同的数据),即为标准化)

    2.求取xx的特征值和特征向量

    3.排序特征值,进行筛选,从而筛选出相应的特征向量

    4.标准化后数据乘以选出的特征向量(从而原始数据映射到低维度的空间)

    5.为了将原始数据与降维后的数据进行比较,所以将降维后数据乘以选取的特征向量的逆+均值(如果前期是标准化的则应该乘以方差+均值),从而得到可以与原始数据进行对比的降维后的数据(选取了部分的特征)

    特征向量表示映射的维度,特征值表示矩阵在特征向量方向下的拉伸大小,则可以理解为在该维度下的方差大小。或者按照力的分解的方式进行理解(自己理解的),特征值为在相应方向上(特征向量方向)力的大小。

    sklearn中的PCA的调用:

    http://blog.csdn.net/u012162613/article/details/42192293

  • 相关阅读:
    。。。
    __new__ 单例
    bokeh
    空间数据可视化
    关系网络图
    Pandas 50题练习
    seaborn
    数据输出及内容美化 简单介绍
    数据分析---项目总结
    数学建模
  • 原文地址:https://www.cnblogs.com/liuting1990/p/7783866.html
Copyright © 2011-2022 走看看