zoukankan      html  css  js  c++  java
  • RNN,LSTM

    RNN:

    Vanilla Neural Network :对单一固定的输入给出单一固定输出

    Recurrent Neural Network:对单一固定的输入给出一系列输出(如:可边长序列),例:图片描述

                对可变尺寸输入给出单一固定输出,例:语句的情感分析,对视频(时间长度可变)做决策

                对可变尺寸输入给出可变尺寸输出,例:机器翻译,对视频做帧数分类 

    x作为输入传入RNN,RNN有一个内部隐藏态(internal hidden state),整个隐藏态会在RNN每次读取新的输入时更新,隐藏态会在下次读取输入时将结果反馈至模型。ht代表新的状态,fw代表一种循环函数机制,xt代表输入每个时步的fw和权重都相同。

     对可变尺寸输入给出可变尺寸输出:

     

     对可变尺寸输入给出单一固定输出

     

    对单一固定的输入给出一系列输出

     多对多:机器翻译:

    机器翻译使用序列to序列模型,既一对多和多对一组合,编码器是多对一模型,输入句子,输出向量;解码器是一对多模型,输入向量,输出预测结果

    由预测结果的损失函数,同时训练编码器和解码器

     语言模型:

    通常采用截取方法计算梯度,避免梯度爆炸

     

    RNN注意力

    LSTM:

     

    1

  • 相关阅读:
    CentOS系统下的数据盘挂载
    在iOS微信浏览器中自动播放HTML5 audio(音乐)的2种正确方式
    C盘占用过满问题
    大量ECAgent报错
    微信电脑版不断崩溃
    java web 在tomcat没有正常输出
    文件解压缩失败
    在myeclipse安装beyond插件
    限时免费 GoodSync 10 同步工具【转】
    soapUI的bug切换版本解决
  • 原文地址:https://www.cnblogs.com/Manuel/p/11164849.html
Copyright © 2011-2022 走看看