zoukankan      html  css  js  c++  java
  • 随机森林之oob的计算过程

    随机森林有一个重要的优点就是,没有必要对它进行交叉验证或者用一个独立的测试集来获得误差的一个无偏估计。它可以在内部进行评估,也就是说在生成的过程中就可以对误差建立一个无偏估计。

    随机森林在生成每颗决策树时,会随机且有放回的抽取样本,每棵决策树会有大概1/3的样本未抽取到,这些样本就是每棵树的oob样本。具体计算过程如下:

    根据这种特点,我们可以对其进行oob估计,步骤如下:

      1、计算决策树对其对应的oob样本的分类情况(约有1/3棵树参与oob估计)

      2、以投票的方式确定该样本的分类

      3、计算oob-error:分类错误的样本数占总样本数的比值

    oob误分率是随机森林泛化误差的一个无偏估计,它的结果近似于需要大量计算的k折交叉验证。

    https://www.cnblogs.com/zhangzhixing/
  • 相关阅读:
    特征工程
    TensorFlow学习之路1-TensorFlow介绍
    深度学习中数据的augmentation
    求解矩阵特征值及特征向量
    Faster R-CNN
    python的浅拷贝和深拷贝
    AirSim的搭建和使用
    C++11 binary Tree
    win10 开启ubuntu
    c++ priority_queue
  • 原文地址:https://www.cnblogs.com/zhangzhixing/p/11150317.html
Copyright © 2011-2022 走看看