zoukankan      html  css  js  c++  java
  • 人脸识别“Neural Aggregation Network for Video Face Recognition”

    人脸识别的新方法。主要对视频进行处理。使用CNN提取视频中多帧人像的特征,之后使用聚合模块对全部帧的特征向量进行学习累积。实验结果表明这样的方法比手工设计的方法如平均池化要好。人脸识别结构例如以下图所看到的:

    这里写图片描写叙述

    视频中的人脸包括了目标不同姿态及光照条件下的图像,视频人脸识别的关键是怎样有效的怎样不同帧中的人脸信息,保留有效的信息并去除噪声。

    经常使用的方法有池化,即平均池化和最大化池化,作者设计了一个自适应权值方法。使得特征表示变为:
    r=kakfk

    累积模块的结构如图1所看到的。包括两个Attention块。每一个都将特征与核q进行卷积,生成一个与原始特征fk维度同样的固定长度的表示r。对与每一个Attention块,将输入特征fk与核q进行内积运算,生成显著度ek,之后输入softmax算子生成归一化的权值ak,过程公式表演示样例如以下:
    这里写图片描写叙述

    作者觉得上下文自适应的核可以获取更好的结果。因此使用了两个attention块,让第一个核通过转换函数适应第二个核:
    q1=tanh(Wr0+b)
    第一个attention块q0及转换层的參数通过SGD监督学到,结构例如以下:
    这里写图片描写叙述

    在Youtube上的实验结果例如以下:
    这里写图片描写叙述

  • 相关阅读:
    go操作windows进程相关
    HTML5-格式化
    HTML5-属性
    关于sublime建立python工程的说明
    在Windows系统中安装matplotlib,需要注意的问题
    WPF combobox数据绑定和数据获取
    String的用法——其他功能
    String的用法——获取功能
    String的用法——判断功能
    String的用法——构造方法
  • 原文地址:https://www.cnblogs.com/gavanwanggw/p/7160472.html
Copyright © 2011-2022 走看看