1.Attention-based seq2seq
e(t,i):求上一时刻的输出和这一时刻编码器的输出的相似度
a(t,i):求这个词在整个文本中占多大的比重,每个时刻都存在着一个值,这个只是求一个softmax
c(t):文本向量,求和,n代表序列长度,每个词都有一个softmax值,用每一个概率值去乘以隐变量,这个隐变量就是最初的文本向量,这个概率值就是每个词在整个文本中占多大的比重,结果就是一个最终的文本向量
s(t):解码器
P(vocal):求出的是一个概率值,表示多大概率取到哪一个词(然后根据这个概率值去字典中进行采样)