In [5]: from sklearn import preprocessing ...: le =preprocessing.LabelEncoder() ...: le.fit(["paris", "paris", "tokyo", "amsterdam"]) ...: print('标签个数:%s'% le.classes_) ...: print('标签值标准化:%s' % le.transform(["tokyo", "tokyo", "paris"])) ...: print('标准化标签值反转:%s' % le.inverse_transform([2, 2, 1])) ...: 标签个数:['amsterdam' 'paris' 'tokyo'] 标签值标准化:[2 2 1] 标准化标签值反转:['tokyo' 'tokyo' 'paris']
sklearn.preprocessing.LabelEncoder():标准化标签,将标签值统一转换成range(标签值个数-1)范围内
例如
["paris", "paris", "tokyo", "amsterdam"];里面不同的标签数目是3个,则标准化标签之后就是0,1,2,并且根据字典排序