zoukankan      html  css  js  c++  java
  • 深度学习算法-长短时记忆网络LSTM(Long Short Term Memory Network)

    长短时记忆网络LSTMLong Short Term Memory Network

    思路:原始 RNN 的隐藏层只有一个状态,即h,它对于短期的输入非常敏感。再增加一个状态,即c,让它来保存长期的状态,称为单元状态(cell state)。


     

     

     例子参考:

    大脑:working memory  3.1415926

    RNNCt(cell state) 

     

    RNN:隐层+输入

    LSTM:隐层+输入+隐层输入  3个门

    LSTM的结构:

    信息流可以一直流入,不用经过W

    1.遗忘门

    输入:xt:新的输入,ct-1过去记忆存储的东西,到新的时刻,有的信息没用了,根据xtht-1进行判断。

    2.输入门:多少信息需要写进去

     

    it:计算有多少比例信息需要写进去

    Ct~:计算里面存在多少有用信息

    3.细胞状态

    It:一直等于0ft一直等于1,永久记忆。

    4.输出门

     

    LSTM保持梯度流的原因:

     

    htct有点重复,ht加了过去的信息就行了。

    于是有了GRU:

    LSTM:只能看到前面的信息。

    双向LSTM:可以看到前后的信息。

    参考链接:

    LSTM原理详解https://blog.csdn.net/qq_31278903/article/details/88690959

  • 相关阅读:
    PostgreSQL数据库笔记
    LayUI
    Spring
    Mybatis
    Mybatis生成
    server服务器信息页面添加步骤
    Java数据类型和MySql数据类型对应表
    空字符串
    json解析尖括号<>
    JSON--List集合转换成JSON对象
  • 原文地址:https://www.cnblogs.com/gcter/p/13221503.html
Copyright © 2011-2022 走看看