决策树-ID3版本

import csv
from sklearn.feature_extraction import DictVectorizer
from sklearn import preprocessing
from sklearn import tree

film_data = open('fime.csv','rt')
reader = csv.reader(film_data)
headers = next(reader)

feature_list=[]     #特征值
result_list=[]      #结果
for row in reader:
    # 结果
    result_list.append(row[-1])

    # 去掉没用的信息列
    feature_list.append(dict(zip(headers[1:-1],row[1:-1])))

# 对特征值扁平化处理，结果集亦然
vec = DictVectorizer()
dummyX = vec.fit_transform(feature_list).toarray()
dummyY = preprocessing.LabelBinarizer().fit_transform(result_list)


clf = tree.DecisionTreeClassifier(criterion='entropy',random_state=0)
clf = clf.fit(dummyX,dummyY)
print('clf:'+str(clf))

#  将这个树可视化
import pydotplus
dot_data = tree.export_graphviz(clf,
                                feature_names=vec.get_feature_names(),
                                filled=True,rounded=True,
                                special_characters=True,
                                out_file=None
)
graph = pydotplus.graph_from_dot_data(dot_data)
graph.write_pdf("film.pdf")


#预测
predict_result=clf.predict()

查看全文

相关阅读:
小心触发器脚本陷阱
 delphi程序如何防止多实例启动
 自定义控件wxIpCtrl –(Ip Address)
wxWidgets流操作 (三) wxMemoryInputStream/wxMemoryOutputStream与wxImage交互
 D2 std.stream 文件读写小练习
 挂钟程序
 Lazarus+FPC2.7.1 下DLL 创建及调用
 正则表达式30分钟入门教程
 Word frequency program终结
 阅读作业第二篇

原文地址：https://www.cnblogs.com/chaogehahaha/p/15438656.html