zoukankan      html  css  js  c++  java
  • sklearn.preprocessing.Imputer

    imputer = Imputer(missing_values="NaN",strategy="mean",axis=0)

    主要参数说明:

    missing_values:缺失值,可以为整数或NaN(缺失值numpy.nan用字符串‘NaN’表示),默认为NaN

    strategy:替换策略,字符串,默认用均值‘mean’替换

    ①若为mean时,用特征列的均值替换

    ②若为median时,用特征列的中位数替换

    ③若为most_frequent时,用特征列的众数替换

    axis:指定轴数,默认axis=0代表列,axis=1代表行

    copy:设置为True代表不在原数据集上修改,设置为False时,就地修改,存在如下情况时,即使设置为False时,也不会就地修改

    ①X不是浮点值数组

    ②X是稀疏且missing_values=0

    ③axis=0且X为CRS矩阵

    ④axis=1且X为CSC矩阵

    statistics_属性:axis设置为0时,每个特征的填充值数组,axis=1时,报没有该属性错误

    举例,原X:

    [['France' 44.0 72000.0]
    ['Spain' 27.0 48000.0]
    ['Germany' 30.0 54000.0]
    ['Spain' 38.0 61000.0]
    ['Germany' 40.0 nan]
    ['France' 35.0 58000.0]
    ['Spain' nan 52000.0]
    ['France' 48.0 79000.0]
    ['Germany' 50.0 83000.0]
    ['France' 37.0 67000.0]]
    

      

    填充

    imputer = Imputer(missing_values="NaN",strategy="mean",axis=0)
    imputer = imputer.fit(X[ : ,1:3])
    
    [['France' 44.0 72000.0]
     ['Spain' 27.0 48000.0]
     ['Germany' 30.0 54000.0]
     ['Spain' 38.0 61000.0]
     ['Germany' 40.0 nan]
     ['France' 35.0 58000.0]
     ['Spain' nan 52000.0]
     ['France' 48.0 79000.0]
     ['Germany' 50.0 83000.0]
     ['France' 37.0 67000.0]]
    

      

  • 相关阅读:
    关于java的scanner类
    switch_case注意事项
    MySQL数据库语句总结
    注册验证
    简单的java水果商店后台
    easyui判断下拉列表
    springmvc的前端控制器
    springmvc注解驱动
    双色球
    初来乍到
  • 原文地址:https://www.cnblogs.com/1113127139aaa/p/10251044.html
Copyright © 2011-2022 走看看