复旦的GaitSet算法
一般的步态识别方法
文中指出,在以往文献中,步态识别主要有两大类方法:
1 将步态看作图像
将所有的步态轮廓图压缩成一幅图像,将步态识别看成一个图像匹配问题。很显然这种方法忽略了步态中的时序信息,也无法建模精细的空域信息。
2 将步态看作视频序列
考虑直接从silhouette提取特征,使用LSTM方法或者3D-CNN方法,可以很好的建模步态中的时、空域信息,但其计算代价高昂也不易于训练
GaitSet算法
论文提出了步态识别的新网络结构GaitSet,在CASIAB上达到了95.0%的rank-1准确性,在OU-MVLP上达到了87.1%的准确性。
GaitSet主要特点:
· 灵活,网络的输入图片除了大小需要固定为64*44这个约束外,不要求输入的时序图片必须具备时序顺序,同时对于个数也不要求,可以输入任意的个数,任意的姿态的,任意拍摄视角的轮廓图。
· 快速,网络直接学习步态的特征,而不是测量一系列的步态轮廓图序列和模板的相似性。通过对学习到的特征和数据库中的特征进行欧式距离的计算来进行识别。
· 刷新了CASIAB和OU-MVLP数据集。
该文的主要思想来自于人类对步态的视觉感知上,作者发现,步态中的silhouette从视觉上看前后关系很容易辨认。
所以受此启发,作者不再刻意建模步态silhouette的时序关系,而将步态silhouette当作没有时序关系的图像集,让深度神经网络自身优化去提取并利用这种关系。
作者通过三个步骤提取步态序列的特征,分别记为下图公式中F、G、H。
F 为提取单幅步态轮廓图像的CNN特征;
G 为将各幅图像的CNN特征聚合成一个特征向量;
H 为考虑提取多尺度特征,并通过全连接网络提高特征的鉴别性。
https://blog.csdn.net/qq_14845119/article/details/101067829
论文代码下载
https://github.com/AbnerHqC/GaitSet