递归神经网络(RNN)简介（转载）

zoukankan html css js c++ java

递归神经网络(RNN)简介（转载）
在此之前，我们已经学习了前馈网络的两种结构——多层感知器和卷积神经网络，这两种结构有一个特点，就是假设输入是一个独立的没有上下文联系的单位，比如输入是一张图片，网络识别是狗还是猫。但是对于一些有明显的上下文特征的序列化输入，比如预测视频中下一帧的播放内容，那么很明显这样的输出必须依赖以前的输入，也就是说网络必须拥有一定的”记忆能力”。为了赋予网络这样的记忆力，一种特殊结构的神经网络——递归神经网络(Recurrent Neural Network)便应运而生了。网上对于RNN的介绍多不胜数，这篇《Recurrent Neural Networks Tutorial》对于RNN的介绍非常直观，里面手把手地带领读者利用Python实现一个RNN语言模型，强烈推荐。为了不重复作者 Denny Britz的劳动，本篇将简要介绍RNN，并强调RNN训练的过程与多层感知器的训练差异不大(至少比CNN简单)，希望能给读者一定的信心——只要你理解了多层感知器，理解RNN便不是事儿:-)。

RNN的基本结构

首先有请读者看看我们的递归神经网络的容貌：

乍一看，好复杂的大家伙，没事，老样子，看我如何慢慢将其拆解，正所谓见招拆招，我们来各个击破。
上图左侧是递归神经网络的原始结构，如果先抛弃中间那个令人生畏的闭环，那其实就是简单”输入层=>隐藏层=>输出层”的三层结构，我们在多层感知器的介绍中已经非常熟悉，然而多了一个非常陌生的闭环，也就是说输入到隐藏层之后，隐藏层还会给自己也来一发，环环相扣，晕乱复杂。
我们知道，一旦有了环，就会陷入“先有蛋还是先有鸡”的逻辑困境，为了跳出困境我们必须人为定义一个起始点，按照一定的时间序列规定好计算顺序，做到有条不紊，于是实际上我们会将这样带环的结构展开成一个序列网络，也就是上图右侧被“unfold”之后的结构。先别急着能理解RNN，我们来点轻松的，先介绍这样的序列化网络结构包含的参数记号：
- 网络某一时刻的输入
- 输入层到隐藏层直接的权重由
- 隐藏层到隐藏层的权重
- 隐藏层到输出层的权重
RNN的Forward阶段

上一小节我们简单了解了网络的结构，并介绍了其中一些记号，是时候介绍它具体的运作过程了。首先在

s1=Ux1+Wh0h1=f(s1)o1=g(Vh1)

这样时间就向前推进，此时的状态

s2=Ux2+Wh1h2=f(s2)o2=g(Vh2)

st=Uxt+Wht−1ht=f(Uxt+Wht−1)ot=g(Vht)

h=f(现有的输入+过去记忆总结)

RNN的Backward阶段

上一小节我们说到了RNN如何做序列化预测，也就是如何一步步预测出

∇U=∂E∂U=∑t∂et∂U∇V=∂E∂V=∑t∂et∂V∇W=∂E∂W=∑t∂et∂W

δht=(VTδot+WTδht+1).∗f′(st)

∇W=∑tδht×ht∇U=∑tδht×xt

RNN的训练困难

虽然上一节中，我们强调了RNN的训练程序和MLP没太大差异，虽然写程序容易，但是训练起来却是千难万阻。为什么呢？因为我们的网络是根据输入而展开的，输入越长，展开的网络越深，那么对于“深度”网络训练有什么困难呢？最常见的是“gradient explode”和“gradient vanish”。这种问题在RNN中如何体现呢？为了强调这个问题，我们模仿Yoshua Bengio的论文《On the difficulty of training recurrent neural networks》的推导，重写一下RNN的梯度求解过程，为了推导方便，我们人为地为

∂et+1∂Wt+1=∂et+1∂ht+1∂ht+1∂Wt+1

∂et+1∂Wt=∂et+1∂ht+1∂ht+1∂ht∂ht∂Wt

∂et+1∂Wt−1=∂et+1∂ht+1∂ht+1∂ht∂ht∂ht−1∂ht−1∂Wt−1

......

∂et∂W=∑1≤k≤t∂et∂ht∏k<i≤t∂hi∂hi−1∂+hk∂W

∂f(h(x))∂x=f′(h(x))

||∏k<i≤t∂hi∂hi−1||≤ηt−k

参考引用

《Recurrent Neural Networks Tutorial》
《On the difficulty of training recurrent neural networks》
查看全文

相关阅读:
原子核壳模型程序 BigStick 的用法
 c++ 中的下三角阵矩阵元标记
 BCS方程和Bogoliubov变换
 圆膜振动问题
 核结构单体跃迁算符
 python画球谐函数
 gnuplot 绘制球谐函数图
 shell 脚本小知识集锦
 6.12学习总结
 PHP网上商城

原文地址：https://www.cnblogs.com/jason-wyf/p/6144471.html

递归神经网络(RNN)简介（转载）

RNN的基本结构

RNN的Forward阶段

RNN的Backward阶段

RNN的训练困难

参考引用