zoukankan      html  css  js  c++  java
  • 第二节 数值型特征进行归一化或标准化处理

    数值型特征处理:通过特定的统计方法将数据转换成算法要求的数据,归一化和标准化

    # 归一化的计算公式决定了其对异常值很敏感,一旦出现异常值会导致鲁棒性较差,所以归一化只适合传统精确小数据场景
    from sklearn.preprocessing import MinMaxScaler
    
    def mm():
        # feature_range指定归一化后的数据范围,不指定就是0-1之间
        mm = MinMaxScaler(feature_range=(2, 3))
    
        # fit_transform接收数组
        data = mm.fit_transform([[90, 2, 10, 40], [60, 4, 15, 45], [75, 3, 13, 46]])
    
        print(data)
    
    
    if __name__ == "__main__":
        mm()

     

    # 标准化也是用来去除均数、离散程度量纲差异太大的影响,但是标准化对离群值的影响无能为力
    from sklearn.preprocessing import StandardScaler
    
    def stand():
        std = StandardScaler()
    
        # fit_transform接收数组
        data = std.fit_transform([[1, -1, 3], [2, 4, 2], [4, 6, -1]])
    
        print(data)
    
    
    if __name__ == "__main__":
        stand()
  • 相关阅读:
    SSH-框架工作笔记
    Ajax基础
    Hibernate基础
    Struts1 中的国际化
    MyEclipse中的快捷键
    Oracle_存储过程
    oracle_开发子程序和包
    常用的正则表达式
    jQuery中的事件
    AcWing 1118. 分成互质组
  • 原文地址:https://www.cnblogs.com/kogmaw/p/12566209.html
Copyright © 2011-2022 走看看