zoukankan      html  css  js  c++  java
  • Person Re-identification 系列论文笔记(八):SPReID

     

    Human Semantic Parsing for Person Re-identification

    Kalayeh M M, Basaran E, Gokmen M, et al. Human Semantic Parsing for Person Re-identification[J]. 2018.

      这篇是截止发文时在Market-1501上性能最高的论文。主要思想可以归结到软划分的范畴,

    借助精确分割的信息去提取部件特征,再辅以其他tricks(大规模的backbone,较大的网络输入分辨率,合并多个公开数据集做fine-tune等) 。

      性能是最高的,但抛开backbone参数规模和输入图像分辨率的计算量,只谈性能,是CV界的耍流氓。所以大家还是客观看待这个最高的性能,更多的关注可借鉴的创新点。

    contributions

      为了解决行人重识别里的姿态、对齐、角度等问题,引入人体语义分割去精确提取local feature,即SPReID。

    pipeline

      输入目标图,传统的过程是经过backbone,提取GAP后的特征进行检索,如图中中间分支。

    SPReID,是上分支和下分支的结合。上分支最终提取较大的特征图,下分支是人体语义分割网络,

    提取5个语义信息的特征概率图(前景,头,上肢,下肢,鞋子)。将上分支的全部特征和下分支的概率图进行加权求和

    (2048个通道和1个通道特征概率图的prod)。考虑到特征维度爆炸(2048*5),将头、上肢、下肢和鞋的特征进行max

    操作,然后和前景特征concact,作为网络最终的输出。

      注意下SPReID,不是一个end-to-end的网络,上下分支单独训练,后续改进是可以做成end-to-end的。

    还有最后的部件特征max操作有些粗暴,可以在2048维特征上做降维操作,然后将各部件concact一起。

    experiments

    分辨率和backbone实验结果

    最终的性能比较

  • 相关阅读:
    RAID卡是否有(启用)缓存对“随机读写”性能有巨大的影响。
    《C++程序设计实践与技巧:测试驱动开发》 环境搭建遇到的坑
    c++ 实现 cout 示例
    c++ 文件
    js 鼠标事件模拟
    eclipse c++ 配置 c++ 17
    c++ 17 vector中string的性能问题 std::vector<std::string> string vs string_view
    c++ 17 模板
    C++17剖析:string在Modern C++中的实现
    编译程序加不加 -lpthread 的区别
  • 原文地址:https://www.cnblogs.com/dingz/p/9372630.html
Copyright © 2011-2022 走看看