zoukankan      html  css  js  c++  java
  • mask rcnn和roi-align

    faster-rcnn的github源码中是round四舍五入

    但kaiming he的ppt是直接取整

    1.讲roi-align和roi-pooling区别并且详细阐述roi-align过程的博客:http://blog.leanote.com/post/afanti/b5f4f526490b,此博主还有另外一篇在rfcn中

    使用roi-align的博客:http://blog.leanote.com/post/afanti/Position-Sensitive

    2.具体讲解roi-align的计算方式,并且有整个网络的结构图,几个链接也有一些slide,这个博主的文章值得关注:http://blog.csdn.net/u013010889/article/details/78588227

    3.Mask RCNN中的RoiAlign源码(caffe2)解读: http://blog.csdn.net/yiyouxian/article/details/79221830

    roi-align总结:对于每个roi,映射之后坐标保持浮点数,在此基础上再平均切分成k*k个bin,这个时候也保持浮点数。再把每个bin平均分成4个小的空间,然后计算每个小空间的中心点的像素点对应的概率值。这个像素点大概率是一个浮点数,实际上图像的浮点是没有像素值的,但这里假设这个浮点数的位置存储一个概率值,这个值由相邻最近的整数像素点存储的概率值经过双线性插值得到,其实也就是根据这个中心点所在的像素值找到所在的小空间对应的4个整数像素存储的值,然后乘以多个参数进行插值。这些参数其实就是那4个整数像素点和中心点的位置距离关系构成参数。最后再在每个bin中对4个中心点进行max或者mean的pooling。

  • 相关阅读:
    List集合之Vector分析
    List集合之ArrayList分析
    Linux下的tar压缩解压缩命令详解
    第五次会议(4.7)
    第四次会议(3.31)
    第三次会议(3.17)
    第二次会议(3.9)
    第一次会议(3.1)
    团队的Kick off
    Parse error: syntax error, unexpected T_ENDFOREACH in..报错处理
  • 原文地址:https://www.cnblogs.com/ymjyqsx/p/8522818.html
Copyright © 2011-2022 走看看