[Thu, 9 Jul 2015 ~ Tue, 14 Jul 2015] Deep Learning in arxiv

zoukankan html css js c++ java

[Thu, 9 Jul 2015 ~ Tue, 14 Jul 2015] Deep Learning in arxiv

这一期的神作论文有蛮多的，都很有意思。

Feature Representation In ConvolutionalNeural Networks

该论文中论述了在某种CNN结构下，是否有准确率较高的off model的分类方法（这里是指非softmax）能达到更有效的分类结果呢？

论文给出了肯定的答案。

该论文还给出了各层特征重要性的图表，蛮有意思的

该论文还交代了实验中用到的开源码。

Towards Good Practices for Very DeepTwo-Stream ConvNets

Openmpi for multi-gpu

Code: https://github.com/yjxiong/caffe/tree/action_recog

Two-Stream Convolutional Networks forAction Recognition in Videos

当中单个stream的准确率例如以下：

Combine的结果例如以下：

Understanding Intra-Class Knowledge InsideCNN

该论文利用可视化技术表述了cnn是怎样进行类内区分的

另外在该文中也有引用到利用可视化表述cnn怎样进行类间区分的。

是非常好的一篇cnn可视化理解文章

COMPRESSING DEEP CONVOLUTIONAL NETWORKSUSING VECTOR QUANTIZATION

该论文描写叙述了手机级别的模型存储压缩，很好的一篇论文。

事实上模型參数的压缩不仅会起到存储空间压缩（PQ）的作用。还会起到加速模型的作用比如SVD。

Unconstrained Facial Landmark Localizationwith Backbone-Branches Fully-Convolutional Networks

论文提出了Backbone-Branches Fully-Convolutional Neural Network (BB-FCN)的网络结构，非常有趣，论文中还给出了非常多商业非商业的方法做比較，是一篇非常好的人脸定位切入文章。

当中的网络结构例如以下：

结果对照表格：

Facial Landmark Detection by DeepMulti-task Learning

多任务学习能够提高某单一任务的精度。

查看全文