zoukankan      html  css  js  c++  java
  • 数据预处理--标准化/归一化

    1. fit--transform--fit_transform区别

    • fit原义指的是使适合的意思,其实有点train的含义但是和train不同的是,它并不是一个训练的过程,而是一个适配的过程,过程都是定死的,最后只是得到了一个统一的转换的规则模型
    • transform:是将数据进行转换,比如数据的归一化和标准化,将测试数据按照训练数据同样的模型进行转换,得到特征向量。
    • fit_transform:可以看做是fit和transform的结合,如果训练阶段使用fit_transform,则在测试阶段只需要对测试样本进行transform就行了。

    2. 标准化归一化

    from sklearn import preprocessing
    #标准化
    std_scale = preprocessing.StandardScaler().fit(df[['Alcohol', 'Malic acid']])
    df_std = std_scale.transform(df[['Alcohol', 'Malic acid']])
    #归一化
    minmax_scale = preprocessing.MinMaxScaler().fit(df[['Alcohol', 'Malic acid']])
    df_minmax = minmax_scale.transform(df[['Alcohol', 'Malic acid']])
    
    #结果输出
    print('Mean after standardization:
    Alcohol={:.2f}, Malic acid={:.2f}'
          .format(df_std[:,0].mean(), df_std[:,1].mean()))
    print('
    Standard deviation after standardization:
    Alcohol={:.2f}, Malic acid={:.2f}'
          .format(df_std[:,0].std(), df_std[:,1].std()))
    print('Min-value after min-max scaling:
    Alcohol={:.2f}, Malic acid={:.2f}'
          .format(df_minmax[:,0].min(), df_minmax[:,1].min()))
    print('
    Max-value after min-max scaling:
    Alcohol={:.2f}, Malic acid={:.2f}'
          .format(df_minmax[:,0].max(), df_minmax[:,1].max()))

  • 相关阅读:
    MyBatis 配置文件 用户密码加密存储
    MyBatis 实例
    mybatis 入门搭建
    文件上传
    struts 结果类型
    Struts 拦截器
    log4j
    Struts Action 控制器
    Struts
    四、常用的Maven命令
  • 原文地址:https://www.cnblogs.com/itbuyixiaogong/p/9848435.html
Copyright © 2011-2022 走看看