神经网络之全连接层详解 - 走看看

zoukankan html css js c++ java

神经网络之全连接层详解

Deduction

全连接结构中的符号定义如下图：

Forward Propagation

Backward Propagation

Follow Chain Rule, define loss function , so we have:

Here we define ，下面分别介绍这两个偏导项如何计算。
计算

Now we firstly get output layer . As an example, we take cross entropy as loss function, with SoftMax as output function.

继续由推有：

还是 Chain Rule, 这个chain rule决定了BP是个递推过程。

So

的求解过程是是个从后往前的递推过程。
计算

的求解比较简单。
由于：

则有：

Caffe Practice

Forward Propagation

bottom节点数, top节点数, batch size。则bottom矩阵为，top矩阵为，weight 矩阵, bias为, bias weight为。下图给出了这几个关键量在Caffe中的存在形式：

数学形式为：

Backward Propagation

后向还是分两部分算,一部分是计算; 一部分是计算bottom_diff = ，以作为下一层的top_diff, 这里实际上就是, 因此bottom_diff = 。下图给出Caffe计算后向传播时的几个关键量。

计算

则有下面的实现：

计算bottom_diff

即：

可以看出，其主要操作是GEMM和GEMV。

References

[1] http://www.jianshu.com/p/c69cd43c537a
[2] http://blog.csdn.net/walilk/article/details/50278697
[3] http://blog.sina.com.cn/s/blog_88d97475010164yn.html
[4] http://www.itnose.net/detail/6177501.html
[5] http://www.zhihu.com/question/38102762

查看全文

相关阅读:
WeakReference（弱引用）
男人怎么挑选女人
 同步方法和异步方法
 常指针与指针常量的区别（转帖）
关于WebService的一些注意事项
 ASP.Net缓存技术
 关于GridView手动绑定的一段代码，一切尽在不言中
 基本三层架构的一些代码
 写给自己看的关于DataList的和RePeater
ASP.Net绑定数据源

原文地址：https://www.cnblogs.com/Matrix_Yao/p/5977220.html

Copyright © 2011-2022 走看看