zoukankan      html  css  js  c++  java
  • 【基础知识四】决策树

    决策树可以使用不熟悉的数据集合,并从中提取出一系列的规则(如if...else),根据数据集创建规则的过程,就是机器学习的过程。专家系统中经常使用决策树。

    一、基本思想:分而治之的策略

    决策树的生成是一个递归过程;

    对于属性值是离散值的情况,结点生成问题转化为:从当前属性集合中选择哪种属性(作为分支结点)

    何为“最优划分属性”?     即属性选择的依据

    所选属性下,(分支结点)所包含的样本尽可能属于同一类别,通俗地说就是属性的“区分度”强,属性的“纯度”高;

    二、划分选择

    信息增益:基于“信息熵”;

    典型算法:

    ID3:信息增益

    C4.5:增益率

    CART:“基尼指数”

    三、防止“过拟合”

    剪枝:包括“预剪枝”、“后剪枝”

    四、连续与缺失值处理

  • 相关阅读:
    第二次站立会议
    小组第一次站立会议
    用户场景描述
    本周学习总结
    构建之法阅读笔记之三
    本周的学习收获
    java连接Oracle数据库
    scott用户不存在
    大二暑假第五周总结
    业务用例分析
  • 原文地址:https://www.cnblogs.com/eniac1946/p/8253146.html
Copyright © 2011-2022 走看看