zoukankan      html  css  js  c++  java
  • RNN,LSTM

    RNN:

    Vanilla Neural Network :对单一固定的输入给出单一固定输出

    Recurrent Neural Network:对单一固定的输入给出一系列输出(如:可边长序列),例:图片描述

                对可变尺寸输入给出单一固定输出,例:语句的情感分析,对视频(时间长度可变)做决策

                对可变尺寸输入给出可变尺寸输出,例:机器翻译,对视频做帧数分类 

    x作为输入传入RNN,RNN有一个内部隐藏态(internal hidden state),整个隐藏态会在RNN每次读取新的输入时更新,隐藏态会在下次读取输入时将结果反馈至模型。ht代表新的状态,fw代表一种循环函数机制,xt代表输入每个时步的fw和权重都相同。

     对可变尺寸输入给出可变尺寸输出:

     

     对可变尺寸输入给出单一固定输出

     

    对单一固定的输入给出一系列输出

     多对多:机器翻译:

    机器翻译使用序列to序列模型,既一对多和多对一组合,编码器是多对一模型,输入句子,输出向量;解码器是一对多模型,输入向量,输出预测结果

    由预测结果的损失函数,同时训练编码器和解码器

     语言模型:

    通常采用截取方法计算梯度,避免梯度爆炸

     

    RNN注意力

    LSTM:

     

    1

  • 相关阅读:
    使用正则表达式做代码匹配和替换
    python 简单日志框架 自定义logger
    UVa 221 Urban Elevations 城市正视图 离散化初步 无限化有限
    UVa 10562 Undraw the Trees 看图写树
    【如何学习Python课程】
    【linux端口号与PID的互相查询】
    supervisor基础一
    【logstash】安装配置

    markdown
  • 原文地址:https://www.cnblogs.com/Manuel/p/11164849.html
Copyright © 2011-2022 走看看