人脸识别“Neural Aggregation Network for Video Face Recognition” - 走看看

zoukankan html css js c++ java

人脸识别“Neural Aggregation Network for Video Face Recognition”

人脸识别的新方法。主要对视频进行处理。使用CNN提取视频中多帧人像的特征，之后使用聚合模块对全部帧的特征向量进行学习累积。实验结果表明这样的方法比手工设计的方法如平均池化要好。人脸识别结构例如以下图所看到的：

视频中的人脸包括了目标不同姿态及光照条件下的图像，视频人脸识别的关键是怎样有效的怎样不同帧中的人脸信息，保留有效的信息并去除噪声。

经常使用的方法有池化，即平均池化和最大化池化，作者设计了一个自适应权值方法。使得特征表示变为：
r=∑kakfk

累积模块的结构如图1所看到的。包括两个Attention块。每一个都将特征与核q进行卷积，生成一个与原始特征fk维度同样的固定长度的表示r。对与每一个Attention块，将输入特征fk与核q进行内积运算，生成显著度ek，之后输入softmax算子生成归一化的权值ak，过程公式表演示样例如以下：

作者觉得上下文自适应的核可以获取更好的结果。因此使用了两个attention块，让第一个核通过转换函数适应第二个核：
q1=tanh(Wr0+b)
第一个attention块q0及转换层的參数通过SGD监督学到，结构例如以下：

在Youtube上的实验结果例如以下：

查看全文

相关阅读:
开源的UML建模工具
 leetcode 559. Maximum Depth of N-ary Tree
leetcode 9. Palindrome Number
暗网 tor溯源困难根因——用户的请求会在分布全球的主机随机跳转三次，最终才到达服务器，这就造成了溯源的极其困难
 leetcode 374. Guess Number Higher or Lower
RDP协议暴力破解
 清华大学 pip 源
 暴力破解研究论文
 利用ModSecurity防御暴力破解
 IRC BOT原来是利用IRC下发C&C命令——在xx云环境遇到了，恶意软件开的是6666端口

原文地址：https://www.cnblogs.com/gavanwanggw/p/7160472.html

Copyright © 2011-2022 走看看