zoukankan      html  css  js  c++  java
  • Reading papers_5(与human activity analysis综述相关,ing...)

    1. Poppe, R. (2010). "A survey on vision-based human action recognition." Image and Vision Computing 28(6): 976-990.

      这篇文章写的是关于人体动作识别的综述类文章,论文中没有对某个具体的模型或算法做详细的描述,只是将其分类到作者框架下动作识别的一个研究方向。

      在本篇论文的参考文献中,作者也列出了比较出名的此类综述性文章,但是每篇综述性文章的写作线索都不尽相同,这是因为每个学长对human action recognition的理解不完全相同。

      本领域的一些难点和特点:1.人体动作的变种太多,同一种动作其变化有时候区分度很大,而不同动作的区分度有时候又不太不明显,所以随着动作类型的增多,其分类任务难度就增大了。2.环境变化太大,比如说背景杂乱,遮挡,光照,动态背景模型,运动摄像头等加大了动作识别的难度。3.动作的时间因素,如果视频的帧率不同,则相同动作持续的时间也不相同,增加了识别的难度。4.由于是视频数据,3维的,所以数据的获取和标注也相当困难。鉴于此,作者总结了一些常用的公开数据集。KTH,Weizmann,INRIA XMAS,UCF,Hollywood 等。

      人体行为识别步骤大致分为2个部分:特征的描述+分类器。

      特征的描述又分为全局描述,局部描述。

      全局描述需要通过人体检测和跟踪来定位人体,然后对其进行特征提取来描述。因此其依赖于定位的精度。Grid-based方法用于解决全局描述对噪声,部分遮挡,视角变化的敏感弱点。运动能量图MEI和运动历史图MHI都是基于人体剪影的。另外2个代表是全局grid-based描述以及STV时空体描述。

      局部描述是对人体单独patch进行提取的。首先是检测局部的特征点,然后通过某种方法连接起来作为整体的描述,比较成功的有bga-of-feature。局部描述的优点是对于光照,部分遮挡不是很敏感。其研究方向有时空兴趣点检测和描述,局部local-based描述,局部描述子之间的相关性。

      当然除了全局和局部描述2种外,作者还总结了针对具体应用的描述子。

      当目标特征被提取出来并且表示好之后,行为识别问题就变成了一个分类问题了。

      首先是分类器中的直接分类器,在分类前需要对特征维数进行削减,常用的算法有PCA,流行学习等。KNN,SVM等都属于直接分类器。

      其次就是时空状态模型,比如说DTW动态时间规整,HMM,CRF等。

      最后作者提出了未来行为识别的研究热点:1.特征点描述的应用能力,比如说解决遮挡问题等。2.分类器的灵活性设计。3.算法的实时性。4.行为识别算法的平均标准等。

  • 相关阅读:
     selenium webdriver test
    V8 初次接触(Qt5) 1+1=2 博客频道 CSDN.NET
    C++11 FAQ中文版
    做技术的,因为年龄和颈椎问题,想逐渐脱离码农状态,大家对3035岁职业规划有什么好的建议? 知乎
    一些idea
    如何来区分是我写的还是我转载的,
    firecurl
    python为什么叫好不叫座
    QTextCodec中的setCodecForTr等终于消失了 (Qt5) 1+1=2 博客频道 CSDN.NET
    Charles Web Debugging Proxy • HTTP Monitor / HTTP Proxy / HTTPS & SSL Proxy / Reverse Proxy
  • 原文地址:https://www.cnblogs.com/tornadomeet/p/2478274.html
Copyright © 2011-2022 走看看