zoukankan      html  css  js  c++  java
  • 6-7 adaboost分类器1

    如何利用特征来区分目标,进行阈值判决。adaboost分类器它的优点在于前一个基本分类器分出的样本,在下一个分类器中会得到加强。加强后全体的样本那么再次进行整个训练。加强后的全体样本再次被用来训练下一个基本的分类器。

    我们正确的样本它的系数逐渐地减小,而我们的负样本得到了加强。这就是adaboost它的优点。它的优点就是能够自适应这种过程。它能够把每一次检测中出错的负样本进行加强,那么再把整个结果算到下一个基本的分类器中。那么一轮一轮不停地循环。所以这里还有一个问题,叫循环的终止条件或者叫训练的终止条件。迭代的最大次数也就是我们循环的最大次数,如果最大次数大于某一个值,那么这个时候迭代终止。第二,每一次迭代完之后它有一个检测概率,比如说这一次训练完之后,三个苹果已经检测出来,而香蕉检测出来的是错误的。那么这个时候正确的检测概率就是75%。所以它有一个最小的检测概率。如果当这个训练过程大于这个最小的检测概率,那么整个训练就结束。这是训练的终止条件。

    分类器的结构。就是我们训练完之后如何来用这个分类器。opencv自带的人脸识别的adaboost训练分类器它的文件结构。

    Haar特征计算完之后,需要对Haar特征进行阈值判决。因此它实际上就是一个个的判决过程。有的时候通过一级分类器并不能把这个目标给区分出来。多级级联,每一级都通过这个阈值判决。两级分类器的阈值,分别是T1和T2。

    每一个强分类器它会计算出一个独立的特征点。使用这个独立的特征来对每一个强分类器进行阈值判决。每一个强分类器也有一个自己的阈值判决。

    这是3个强分类器级联以及三个强分类器它的阈值。三个强分类器全部通过之后,那么就认为是我们的目标。三个强分类器只要有任何一个不通过,那么这个时候它就认为是非苹果。所以这是强分类器的概念。那么这个阈值如何得到呢?阈值就是通过我们刚刚的训练。每一级训练的话它会产生一系列的阈值。训练的数据就来源于我们之前的样本。终止条件可以通过for循环循环次数或者是误差概率小于一定的值的时候,就会终止当前的循环。

    可以看到,一个级联的adaboost分类器,它是由若干个强分类器组成。其实每一个强分类器,它又由若干个弱分类器组成。一个强分类器又可以分解成为若干个弱分类器。而一个弱分类器又可以分解成为若干个Node结点。所以它是层层的结点结构,总共有三层结构。

    强分类器它的作用是用来判决当前的阈值与当前的特征是否吻合来达到目标判决的效果。弱分类器的作用是用来计算强分类器的特征。注意,这里有个本质的区别,强分类器是通过强分类器中计算的结果,然后阈值进行判决,最后得到当前的目标是否是苹果。而弱分类器它的作用是来计算强分类器的特征。所以当前的强分类器它的x1、x2、x3特征,是由弱分类器计算得到。

    在opencv中,一个弱分类器最高支持三个Haar特征。而在三个Haar特征中,每一个Haar特征构成了一个Node结点。所以三个Haar特征分别对应的是3个Node结点。每一个特征都看做是一个结点。

    每一个Node结点对应一个Haar特征,这是我们的最底层。opencv中,最多规定有3个Haar特征。所以最多有3个Node结点。每一个Node结点计算出来的Haar特征,与当前的Node结点的阈值进行比较判决。无论是大于它还是小于它,都会得到一个z1。z1就是我们经过计算得到的Node结点。

    如果当前我们的Z值与某一个阈值判决明显进行比较,这个时候就会计算出一个y值。y1、y2、y3表明的是弱分类器的计算特征。

    强分类器再和强分类器的阈值判决明显进行比较。如果连续通过三个强分类器的阈值判决明显,那么我们就认为是目标。我们目标就是要判决出苹果。

    #haar 1 什么是haar? 特征 = 像素 运算 -》结果 (具体值 向量 矩阵 多维)
    # 2 如何利用特征 区分目标? 阈值判决
    # 3 得到判决? 机器学习
    # 1 特征 2 判决 3 得到判决
    
    # 公式推导 1 -2
    # 特征 = 整个区域*权重1 + 黑色*权重2 = (黑+白) * 1 +黑* (-2) =
    # = 黑+白-2黑 = 白-黑
    
    # 1 haar模板 上下 左右 image size 模板 size 100*100 10*10 100次 step = 10
    # 1 100*100 2 10*10 3 step 10 4 模板1
    # 模板 滑动 缩放 10*10 11*11 20级
    # 举例 10808720 step2 10*10
    # 计算量 = 14模板*20缩放* (1080/2*720/2) * (100点+- ) = 50-100亿
    # (50-100) *15 = 1000亿次
    
    # A 1 B 1 2 C 1 3 D 1 2 3 4 
    # 4 = A-B-C+D = 1+1+2+3+4-1-2-1-3 = 4 (3+-)
    
    
    #haar + adaboost face
    # 苹果 苹果 苹果 香蕉
    # 0.1 0.1 0.1 0.5
    # 训练终止条件: 1 for count 2 p
    # 1 分类器的结构 2 adaboost 计算过程 3 xml 文件结构
    # haar> T1 and haar>T2 2个强分类器15-20
    
    # 1 分类器的结构
    # 3个强分类器 1 x1(特征) t1 2 x2(特征) t2 3 x3(特征) t3
    # x1>t1 and x2>t2 and x3>t3 目标-》苹果
    # 作用: 判决
    # 弱分类器结构
    # 作用: 计算强分类器特征x1 x2 x3
    # x2 = sum(y1,y2,y3)
    
    # y1 弱分类器特征
    # node
    # 3个haar-》node
    # 1node haar1 > nodeT1   z1 = a1
    # 1node haar1 < nodeT1   z1 = a2
    # Z = sum(z1,z2,z3)>T  y1 = AA
    # Z = sum(z1,z2,z3)<T  y1 = BB
    
    # haar->Node z1 z2 z3  Z = sum(z1,z2,z3)
    # Z>T y1 y2 y3
    # x = sum(y1,y2,y3) > T1 obj
  • 相关阅读:
    Log4j中conversionPattern的含义
    log4j.xml写入数据库,只有SQL和参数,无其他信息
    windows下根据进程ID强制杀死进程
    github简单使用教程
    junit mockito
    获取oracle 随机数
    循环插入oracle 存储过程
    2.1. 创建GitHub账号
    oracle 复制表结构表数据
    命令模式
  • 原文地址:https://www.cnblogs.com/ZHONGZHENHUA/p/9774937.html
Copyright © 2011-2022 走看看