zoukankan      html  css  js  c++  java
  • 鸢尾花数据(PCA主成分分析)

    1.导包

    2.提取数据

     3.PCA降维

    3.1  调用PCA

     3.2  绘图

     

    提取两个主成分的累计贡献率达到了0.9777,说明主成分的解释效果较好。

     4  贡献率曲线

    当参数n_components中不填写任何值时,默认返回min(X.shape)个特征。一般来说,样本量都会大于特征数目,所以什么都不填就相当于转换了新特征空间,但没有减少特征的个数。一般不会使用这种输入⽅式。但我们可以使用这种⽅式来画出累计可解释⽅差贡献率曲线,以此选择最好的n_components取值。

     

     从累计贡献率曲线可以看出提取两个主成分的累计贡献率达到0.9777,提取四个主成分的累计贡献率为0.9948,增加两个主成分累计贡献率只增加0.0171,但同时却增加了模型复杂度,加大计算量,增加运行时间,所以提取二个主成分最为合适。

  • 相关阅读:
    线程的等待与唤醒
    多线程start()与run()的区别
    Thread与Runnable
    关于i++和++i的一些见解
    Mysql优化(转)
    Java 注解
    Java 泛型(转)
    Java 中的CAS
    CAS ABA问题
    Java 线程池分析
  • 原文地址:https://www.cnblogs.com/lvzw/p/11655902.html
Copyright © 2011-2022 走看看