facebook 摘要生成阅读笔记（二） Abstractive Sentence Summarization with Attentive Recurrent Neural Networks - 走看看

zoukankan html css js c++ java

facebook 摘要生成阅读笔记（二） Abstractive Sentence Summarization with Attentive Recurrent Neural Networks

整体流程与第一篇差不多，只是在encoder和decoder加入了RNN

Encoder:

1.

a_i=x_i+l_i　　

a_i=词向量+词在序列中的位置信息（相当于一个权重，[M, 1]）

流程：

先是CNN获取位置信息，然后再加上词向量，然后再通过LSTM

2.

常见的求注意力权重的方法

　　a. h_t-1：RNN输出

流程：

通过LSTM进行编码，然后再求attention

3.

　　注意力累加

Decoder:

流程：

经过LSTM进行解码，然后再乘以个[cell_output_size, vocab_size]矩阵（这里是考虑依赖词库），如果不依赖词库则乘以[cell_output_size, sequence_size]（依赖输入长度）

　　本文介绍了两种Decoder，均用到了LSTM，最后输出的是K个最大词的概率，求概率求的是对整个词库分配概率，如果生成词时依赖词库，输出长度[V,1]，V表示词库大小；依赖输入句子，那么就是对整个输入句子的每个词分配概率，输出[M,1]，M表示词的长度

1.

2.

查看全文

相关阅读:
在Java当中如何优雅地处理临时文件
 lombok插件不建议使用的原因
 linux系统下修改tomcat的端口号时，需要修改的地方
 linux系统下报错为：直接在tomcat的bin目录下生成一个错误文件。
Linux下修改tomcat端口号
 python实现断点续传下载文件
 Python中下划线---完全解读
 linux 　指令　备注
 Linux下高并发socket最大连接数所受的各种限制
 python和pywin32实现窗口查找、遍历和点击

原文地址：https://www.cnblogs.com/callyblog/p/9662434.html

Copyright © 2011-2022 走看看