RNN和LSTM系统强化学习———

zoukankan html css js c++ java

RNN和LSTM系统强化学习———

怎么也逃不开这些NLP方面的模型，那就Good good study!

一：RNN

核心思想：包含循环的网络，允许信息的持久化。可以将RNN展开为以下的这种模型，简言之就是每一步产生的输出可以从当前步传递到下一步

所有 RNN 都具有一种重复神经网络模块的链式的形式。在标准的 RNN 中，这个重复的模块只有一个非常简单的结构，例如一个 tanh 层。

二：LSTM不同于上面的RNN，RNN仅有一个单一的tanh层，而LSTM是四个类似的层，如下图所示：

这四个图标的计算具体对应着什么？？？

LSTM 中的图标

在上面的图例中，每一条黑线传输着一整个向量，从一个节点的输出到其他节点的输入。粉色的圈代表 pointwise 的操作，诸如向量的和，而黄色的矩阵就是学习到的神经网络层。合在一起的线表示向量的连接，分开的线表示内容被复制，然后分发到不同的位置。

LSTM 的核心思想

LSTM 的关键就是细胞状态，水平线在图上方贯穿运行。细胞状态类似于传送带。直接在整个链上运行，只有一些少量的线性交互。信息在上面流传保持不变会很容易。

上面的Ct就类似于细胞状态的传输。

LSTM 有通过精心设计的称作为“门”的结构来去除或者增加信息到细胞状态的能力。门是一种让信息选择式通过的方法。他们包含一个 sigmoid 神经网络层和一个 pointwise 乘法操作。Sigmoid 层输出 0 到 1 之间的数值，描述每个部分有多少量可以通过。0 代表“不许任何量通过”，1 就指“允许任意量通过”！

LSTM 拥有三个门，来保护和控制细胞状态。

要逐步理解LSTM的三个门，可以参考链接

http://blog.csdn.net/prom1201/article/details/52221822里面有相关的介绍，图文并茂。以及LSTM的变体GRU也有。

接下来想实战跑一遍RNN和LSTM：

RNN的实现过程：史上最具体的代码讲解工作。

http://blog.csdn.net/zzukun/article/details/49968129

通过颜色标记序列，可以看到为什么我们用隐藏层来存储标记序列：

隐藏层循环能学习它到底去记忆什么，但是输入层循环仅仅能记住上次的数据点。

http://blog.csdn.net/dark_scope/article/details/47056361

查看全文

相关阅读:
bootstrap如何设置每一个选项卡对应一个页面
 SpringBoot集成百度UEditor图片上传后直接访问404解决办法
 从0开始完成SpringBoot+Mybatis实现增删改查
 Luarocks 安装艰难过程
 [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: self signed certificate in certificate chain (_ssl.c:1076)')))
python + selenium 搭建环境步骤
 mongodb的安装
 git-新建git用户流程-1
git-关联远程git仓库详细步骤-2
Django启动服务的流程

原文地址：https://www.cnblogs.com/maowuyu-xb/p/6841456.html

RNN和LSTM系统强化学习———

LSTM 的核心思想