zoukankan      html  css  js  c++  java
  • sklearn one_hot 操作

    1.编码

      one_hot编码不再过多叙述,类似于hash的那种方法去改变数的编码方式。比如label存在与(0,1,2,3),那么一条记录的label为3,那么将编码维[0,0,0,1]

    2.包: tf.one_hot(label,n_label) 需要注意的是返回的是一个tensor

       from sklearn.preprocessing import OneHotEncoder

      这个的用法就比较多了

    1 enc = OneHotEncoder()
    2 enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1],[1, 0, 2]])
    3 print "enc.n_values_ is:",enc.n_values_
    4 print "enc.feature_indices_ is:",enc.feature_indices_
    5 print enc.transform([[0, 1, 1]]).toarray()
    View Code

     这里,我们把以上一行看作是一条记录,那么每一行的第n列就是其第n个特征。基于这个理解,我们说下面的问题。

      1)其中enc.fit与平时所用的sklearn 的作用相同。

      2)enc.n_values_->各个特征的种类

      其输出:[2 3 4] 可以看到一共4行,3列,也就说4条记录3个特征,那么我们可以看出n_values_是统计各个特征的值

      3) feature_indices_ 

       输出为:[0 2 5 9]也就时说对上面n_values的累加

      4) enc.transform(one_array) 这个就不用说了

  • 相关阅读:
    maven配置
    redis测试
    智慧社区技术总结
    视频导航
    Delphi 任务栏中不显示窗口
    Delphi 设置程序图标为系统默认图标
    清除Windows系统图标缓存
    C/C++ 变量的本质分析
    005 C/C++ 数据类型_void
    004 C/C++ 数据类型_类型别名
  • 原文地址:https://www.cnblogs.com/silence-tommy/p/8053636.html
Copyright © 2011-2022 走看看