zoukankan      html  css  js  c++  java
  • PCA-主成分分析(Principal components analysis)

    来自:刘建平

      主成分分析(Principal components analysis,以下简称PCA)是最重要的降维方法之一。

    1. PCA的思想

      PCA顾名思义,就是找出数据里最主要的方面,用数据里最主要的方面来代替原始数据。

      我们降维的标准为:样本点到这个超平面的距离足够近,或者说样本点在这个超平面上的投影能尽可能的分开

      基于上面的两种标准,我们得到PCA的两种等价推导

    2. PCA的推导:基于最小投影距离

      第一种:样本点到这个超平面的距离足够近。

      假设m个n维数据 都已经进行了中心化,即 经过投影变换得到新坐标系为  ,其中w为标准正交基,即

      如果我们将数据从n维降到n'维,即丢弃新坐标系中的部分坐标,则新的坐标系为 ,样本点 x(i) 在 n' 维坐标系中的投影为: 其中,是x(i)在低维坐标系里第 j 维的坐标。

      如果我们用 z(i) 来恢复原始数据 x(i) ,则得到的恢复数据 ,其中,w为标准正交基组成的矩阵。

      现在考虑整个样本集,我们希望所有的样本到这个超平面的距离足够近,即最小化式:

      将这个式子整理:

  • 相关阅读:
    解决phpmailer可以在windows下面发送成功, 在linux下面失败的问题
    centos安装svn
    linux下面配置安装nodejs+npm
    排序与搜索
    链表
    栈和队列
    顺序表
    初识算法、数据结构
    Linux_02
    Linux_01
  • 原文地址:https://www.cnblogs.com/keye/p/8819020.html
Copyright © 2011-2022 走看看