zoukankan      html  css  js  c++  java
  • 目标检测_0

    目标检测

    1. rcnn:根据颜色等特征,将图像分为许多小区域(一般情况下颜色相同的都是一类物体)
      1. 合并区域,然后进行区域内的物体检测 即到卷积中进行预测(每个框一个卷积网络)
      2. 缺点:找到的框太多
    2. fast-rcnn:整张图片卷积得到特征图
      • 图片映射到特征图,
    3. faster-rcnn:RPN 层,根据标注中框的位置,让卷积网络自己学习框应该在哪 (在特征图上提取框)
      • 怎么学习?
        • 有基数128,256,512,3种方式
      • 对于一个像素点生成9个框,以他为中心
        • 128*256,256*128,128*128
        • 256*512,512*256,256*256
        • 512*512,512*1024,1024*512

    数据

    1. 或获途径

      • Benchmark是一个行业的基准(数据库,论文,源码,结果)。 face benchmark或MPII Human Pose Dataset
      • 论文
      • 论坛或者交流社区 如thinkface
    2. 处理

      1. 正样本:裁剪,根据标注把目标裁剪出来,例如人脸,可使用opencv工具
      2. 负样本:随便选择的框,可与正样本重叠,但不能太多 这个比例 成为 inception open union (Iou) 一般为0.3,小于0.3为负样本 大于0.7为正样本(当做遮蔽的数据),中间的舍弃
    3. 根据不同框架数据集格式生成数据集

    训练

    1. Input Image 227*227*3
    2. Conv1
      1. num_output=96 特征图数量
      2. kernel_size=11 卷积核大小
      3. stride=4 滑动步长
      4. input:55*55*96
    3. relu
    4. Pool
      1. kernel_size=3,
      2. stride=2
      3. input:27*27*96
    5. 经过多层卷积,,激活,池化,(偶尔还有规范化)
    6. 全连接层 4096*1
      1. 激活
      2. drop
    7. 全连接分类n*1
  • 相关阅读:
    弱鸡儿长乐爆肝旅Day8
    弱鸡儿终于没爆零Day7
    弱鸡儿长乐爆零旅Day6
    弱鸡儿长乐爆零旅Day5
    弱鸡儿长乐爆零旅Day4
    D1字符串哈希
    Tarjan算法
    弱鸡儿长乐爆零旅Day3
    弱鸡儿长乐爆零旅Day2
    弱鸡儿长乐爆零旅Day1
  • 原文地址:https://www.cnblogs.com/Dean0731/p/11961902.html
Copyright © 2011-2022 走看看