zoukankan      html  css  js  c++  java
  • 决策树

    如何构建决策树

    1. 准备工作:
      1. 明确自变量和因变量
      2. 确定信息度量的方式
      3. 确定终止条件
    2. 选择特征
      1. 得到当前待处理子集
      2. 计算所有特征信息度量
      3. 得到当前最佳分类特征
    3. 创建分支
      • 根据选中特征将当前记录分成不同分支,分支个数取决于算法
    4. 是否终止
      • 判断是否满足终止条件
    5. 生成结果
      • 判断是否需要剪枝

    案例

    根据部分电脑购买记录,对购买者建模。该模型可以基于客户的一些信息预测他是否会购买电脑。

    记录标识 人群群体 收入层次 是否单身 信用等级 是否购买电脑
    1 青年 一般
    2 青年 良好
    3 中年 一般
    4 老年 一般
    5 老年 一般
    6 老年 良好
    7 中年 良好
    8 青年 一般
    9 青年 一般
    10 老年 一般
    11 青年 良好
    12 中年 良好
    13 中年 一般
    14 老年 良好

    准备工作

    1. 观察数据,明确自变量和因变量
      • 自变量:人群群体、收入层次、是否单身、信用等级
      • 因变量:是否购买电脑
    2. 明确信息度量方式:信息增益
      • 基尼系数
    3. 明确分支终止条件
      • 纯度
      • 记录条数
      • 循环次数

      **构建一棵决策树** 观察各自的分支,再根据情况选择是否还需要再次挑选特征进行区分,最终的结果如下。

    各类决策树算法的对比

  • 相关阅读:
    golang之panic,recover,defer
    Golang之函数练习
    Golang之strings包
    Golang之字符串操作(反转中英文字符串)
    keil中使用——变参数宏__VA_ARGS__
    到底该不该用RTOS——rtos的优点
    c语言联合union的使用用途
    c语言的#和##的用法
    c语言位域的使用注意事项——数据溢出
    基于 Keil MDK 移植 RT-Thread Nano
  • 原文地址:https://www.cnblogs.com/shayue/p/10412914.html
Copyright © 2011-2022 走看看