zoukankan      html  css  js  c++  java
  • 机器学习——08、特征选择

    用过滤法对以下数据进行特征选择:

                                 [[0,2,0,3],

                                  [0,1,4,3],

                                  [0,1,1,3]]

    要求:

    1、Variance Threshold(threshold =1.0)

    2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的

    特征选择的原因:

    ①冗余:部分特征的相关度搞,容易消耗计算性能

    ②噪音:部分特征对预测结果有影响。

    这里的特征选择就是降低维度,即选择最合适的特征数量,过滤式筛选指标是方差大小。

    步骤:①初始化variance threshold,指定阈值方差。②调用fit_transform。

     源代码:

    #过滤式特征选择
    from sklearn.feature_selection import VarianceThreshold
    
    def var():
        #特征选择-删除低方差的特征
    
        var=VarianceThreshold(threshold=1.0)  #初始化variance threshold,指定阈值方差
        data=var.fit_transform([[0,2,0,3],[0,1,4,3],[0,1,1,3]])   #调用fit_transform
    
        print(data)
        return None
    
    if __name__ == "__main__":
        var();
    

                                                                                                           图1 阈值方差为1的结果

                                                                                                          图2 阈值方差为0的结果

  • 相关阅读:
    redis操作
    MySQL架构
    MySQL查询缓存
    MySQL数据备份与还原
    Sql性能优化
    Notepad++中每一行的开头和结尾添加引号?
    分组聚合
    Python3用scan和delete命令批量清理redis数据
    VUE+django
    python转化13位时间戳
  • 原文地址:https://www.cnblogs.com/lcj170/p/12799725.html
Copyright © 2011-2022 走看看