zoukankan      html  css  js  c++  java
  • 2020.04.27 主成分分析

    一、用自己的话描述出其本身的含义:

    1、特征选择

    2、PCA

    二、并用自己的话阐述出两者的主要区别

    答:

    一、用自己的话描述出其本身的含义:

    1、特征选择:

    因为在有限的样本数目下,用大量的特征来设计分类器计算开销太大而且分类性能差,所以就产生了特征选择。

    特征选择是指:从全部特征中选出对结果集有影响的特征值,比如,预测是否下雨,与云量多少,空气中二氧化碳的含量有关的特征等等,这些有关的特征就选取,像地上是否长草,这种无关因素就将其去除。通过特征选择,降低无关特征对模型的影响,提高了模型的准确性。

    2、PCA:

    PCA降维也称为主成分分析,经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征,简单来说就是去除或者减少这份数据样本的某些属性,降低冗余,但是同时也从这些现有的特征中重建新的特征,新的特征剔除了原有特征的冗余信息,因此使不同的样本数据更有区分度。通过PCA降维,减少了某些属性对模型的影响,提高了模型的准确性。

    二、并用自己的话阐述出两者的主要区别

    特征选择:从全部特征中选出对结果集有影响的特征值作为实际使用的数据集,用于训练模型。没有改变特征的形式。比如,原来的9维,后面处理完还是9维。

    PCA:降维本质上是从一个维度空间映射到另一个维度空间,特征的多少别没有减少,当然在映射的过程中特征值也会相应的变化,同时保持数据集中使方差贡献最大的特征。改变了原来特征的形式。比如,原来的9维,后面处理完还是可能是3维,4维等等。

  • 相关阅读:
    IDEA 如何恢复默认布局 和显示项目目录导航
    jdbcTemplate 和 Thymeleaf模板引擎 查询 到模板赋值例子
    <meta charset="UTF-8"> 出错
    spring boot Thymeleaf模板引擎 最简单输出例子
    spring boot jpa 无法自动生成表
    IDea 运行程序就说ClassNotFind:com.jdbc.mysql.Driver
    pom.xml 里面dependency 添加spring-boot-starter-data-jpa 后运行出错
    IDEA 同时启动两个环境
    cannot resolve symbol
    Shell之expect的测试
  • 原文地址:https://www.cnblogs.com/Azan1999/p/12789504.html
Copyright © 2011-2022 走看看