zoukankan      html  css  js  c++  java
  • 机器学习——08、特征选择

    用过滤法对以下数据进行特征选择:

                                 [[0,2,0,3],

                                  [0,1,4,3],

                                  [0,1,1,3]]

    要求:

    1、Variance Threshold(threshold =1.0)

    2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的

    特征选择的原因:

    ①冗余:部分特征的相关度搞,容易消耗计算性能

    ②噪音:部分特征对预测结果有影响。

    这里的特征选择就是降低维度,即选择最合适的特征数量,过滤式筛选指标是方差大小。

    步骤:①初始化variance threshold,指定阈值方差。②调用fit_transform。

     源代码:

    #过滤式特征选择
    from sklearn.feature_selection import VarianceThreshold
    
    def var():
        #特征选择-删除低方差的特征
    
        var=VarianceThreshold(threshold=1.0)  #初始化variance threshold,指定阈值方差
        data=var.fit_transform([[0,2,0,3],[0,1,4,3],[0,1,1,3]])   #调用fit_transform
    
        print(data)
        return None
    
    if __name__ == "__main__":
        var();
    

                                                                                                           图1 阈值方差为1的结果

                                                                                                          图2 阈值方差为0的结果

  • 相关阅读:
    异步-promise、async、await
    node
    node基础 day1
    gulp的简介以及使用方法
    web前端安全——常见的web攻击方法
    Linux修改IP地址
    在linux下批量删除文件
    常用内容的正则表达式
    Oracle 数据库自带用户有哪些
    统计Oracle数据库当前User下各表的记录数
  • 原文地址:https://www.cnblogs.com/lcj170/p/12799725.html
Copyright © 2011-2022 走看看