zoukankan      html  css  js  c++  java
  • 机器学习——08、特征选择

    用过滤法对以下数据进行特征选择:

                                 [[0,2,0,3],

                                  [0,1,4,3],

                                  [0,1,1,3]]

    要求:

    1、Variance Threshold(threshold =1.0)

    2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的

    特征选择的原因:

    ①冗余:部分特征的相关度搞,容易消耗计算性能

    ②噪音:部分特征对预测结果有影响。

    这里的特征选择就是降低维度,即选择最合适的特征数量,过滤式筛选指标是方差大小。

    步骤:①初始化variance threshold,指定阈值方差。②调用fit_transform。

     源代码:

    #过滤式特征选择
    from sklearn.feature_selection import VarianceThreshold
    
    def var():
        #特征选择-删除低方差的特征
    
        var=VarianceThreshold(threshold=1.0)  #初始化variance threshold,指定阈值方差
        data=var.fit_transform([[0,2,0,3],[0,1,4,3],[0,1,1,3]])   #调用fit_transform
    
        print(data)
        return None
    
    if __name__ == "__main__":
        var();
    

                                                                                                           图1 阈值方差为1的结果

                                                                                                          图2 阈值方差为0的结果

  • 相关阅读:
    swoole创建进程
    php中,posix_getpid() 和 getmypid() 有什么不同
    php查看进程
    初探PHP多进程
    nginx转发
    mime类型
    acwing 517. 信息传递
    LeetCode 1255 得分最高的单词集合 Maximum Score Words Formed by Letters
    LEETCODE 1254 统计封闭岛屿的数目 Number of Closed Islands
    算法问题实战策略 SORTGAME
  • 原文地址:https://www.cnblogs.com/lcj170/p/12799725.html
Copyright © 2011-2022 走看看