zoukankan      html  css  js  c++  java
  • RNN,LSTM

    RNN:

    Vanilla Neural Network :对单一固定的输入给出单一固定输出

    Recurrent Neural Network:对单一固定的输入给出一系列输出(如:可边长序列),例:图片描述

                对可变尺寸输入给出单一固定输出,例:语句的情感分析,对视频(时间长度可变)做决策

                对可变尺寸输入给出可变尺寸输出,例:机器翻译,对视频做帧数分类 

    x作为输入传入RNN,RNN有一个内部隐藏态(internal hidden state),整个隐藏态会在RNN每次读取新的输入时更新,隐藏态会在下次读取输入时将结果反馈至模型。ht代表新的状态,fw代表一种循环函数机制,xt代表输入每个时步的fw和权重都相同。

     对可变尺寸输入给出可变尺寸输出:

     

     对可变尺寸输入给出单一固定输出

     

    对单一固定的输入给出一系列输出

     多对多:机器翻译:

    机器翻译使用序列to序列模型,既一对多和多对一组合,编码器是多对一模型,输入句子,输出向量;解码器是一对多模型,输入向量,输出预测结果

    由预测结果的损失函数,同时训练编码器和解码器

     语言模型:

    通常采用截取方法计算梯度,避免梯度爆炸

     

    RNN注意力

    LSTM:

     

    1

  • 相关阅读:
    015.Python函数名的使用以及函数变量的操作
    014.Python函数
    013.Python的文件操作
    012.Python的字典和集合的相关函数
    git入门
    Visual Studio 常见的快捷键
    SVN使用
    C++ 一些特性
    C++ 引用、构造函数、移动语义
    WPF的AutoCompleteBox控件
  • 原文地址:https://www.cnblogs.com/Manuel/p/11164849.html
Copyright © 2011-2022 走看看