zoukankan      html  css  js  c++  java
  • 类别变量转换成one hot标签的方法

    one_hot (独热)编码,和dummy variable(哑变量)的区别:

    one_hot 类别变量中n个不同类别转换为n个变量
    dummy variable 在某一设定的参考准则下,对n个不同的类别,转换为n-1个变量

    pandas 将标签转化为独热编码

    pd.get_dummies(df_NMF['cluster']).head(20)

    tensorflow 将标签转化为独热编码

    from keras.utils import to_categorical
    encoded=to_categorical(df_NMF['cluster'])

    机器学习包的独热编码使用

    from sklearn.preprocessing import LabelEncoder
    from sklearn.preprocessing import OneHotEncoder
    data = ['cold', 'cold', 'warm', 'cold', 'hot', 'hot', 'warm', 'cold', 'warm', 'hot']
    values = np.array(data)
    print(values)
    # integer encode
    label_encoder = LabelEncoder()
    integer_encoded = label_encoder.fit_transform(values)
    print(integer_encoded)
    onehot_encoder = OneHotEncoder(sparse=False)
    integer_encoded = integer_encoded.reshape(len(integer_encoded), 1)
    onehot_encoded = onehot_encoder.fit_transform(integer_encoded)
    print(onehot_encoded)
    # invert first example
    inverted = label_encoder.inverse_transform([np.argmax(onehot_encoded[0, :])])
    print(inverted)

  • 相关阅读:
    linux的lsof命令
    linux find
    linux 查看磁盘空间大小
    eclipse运行时编码设置
    WebService工作原理
    Java获取字符串编码方式
    JavaScript,base64加密解密
    如何用javascript 的eval动态执行一个需要传对象参数的函数
    struts2结果类型
    执行maven-build.cmd失败
  • 原文地址:https://www.cnblogs.com/raisok/p/12659617.html
Copyright © 2011-2022 走看看