zoukankan      html  css  js  c++  java
  • PCA-主成分分析(Principal components analysis)

    来自:刘建平

      主成分分析(Principal components analysis,以下简称PCA)是最重要的降维方法之一。

    1. PCA的思想

      PCA顾名思义,就是找出数据里最主要的方面,用数据里最主要的方面来代替原始数据。

      我们降维的标准为:样本点到这个超平面的距离足够近,或者说样本点在这个超平面上的投影能尽可能的分开

      基于上面的两种标准,我们得到PCA的两种等价推导

    2. PCA的推导:基于最小投影距离

      第一种:样本点到这个超平面的距离足够近。

      假设m个n维数据 都已经进行了中心化,即 经过投影变换得到新坐标系为  ,其中w为标准正交基,即

      如果我们将数据从n维降到n'维,即丢弃新坐标系中的部分坐标,则新的坐标系为 ,样本点 x(i) 在 n' 维坐标系中的投影为: 其中,是x(i)在低维坐标系里第 j 维的坐标。

      如果我们用 z(i) 来恢复原始数据 x(i) ,则得到的恢复数据 ,其中,w为标准正交基组成的矩阵。

      现在考虑整个样本集,我们希望所有的样本到这个超平面的距离足够近,即最小化式:

      将这个式子整理:

  • 相关阅读:
    QTP自动化测试进阶
    疯狂Java实战演义
    软件开发之韵:和谐敏捷
    Android应用开发详解
    操作系统直接决定了计算机系统的整体性能
    iBATIS框架源码剖析
    PHP 5完全攻略
    天气地图系统
    OpenSolaris系统管理
    Asp.net MVC 3实例学习之ExtShop(三)——完成首页
  • 原文地址:https://www.cnblogs.com/keye/p/8819020.html
Copyright © 2011-2022 走看看