zoukankan
html css js c++ java
从 RNN 到 LSTM (Short-Term Memory)
理论上循环神经网络可以支持任意长度的序列,然而在实际中,如果序列过长会导致优化时出现梯度消散(the vanishing gradient problem)的问题,在实际中一把会规定一个最大长度,当序列长度超过规定长度后会对序列进行
截断
;
1. variant:GRU(gated recurrent unit)
z
t
=
σ
(
W
z
⋅
[
h
t
−
1
,
x
t
]
)
r
t
=
σ
(
W
r
⋅
[
h
t
−
1
,
x
t
]
)
h
~
t
=
tanh
(
W
⋅
[
r
t
∗
h
t
−
1
,
x
t
]
)
h
t
=
h
t
−
1
∗
(
1
−
z
t
)
+
h
~
t
∗
z
t
查看全文
相关阅读:
20162302
20162302
20162302 实验三《敏捷开发与XP实践》实验报告
20162302 第九周作业
20162302 第八周作业
20162302 实验二《面向对象程序设计》实验报告
20162302 第七周作业
项目Alpha冲刺Day8
项目Alpha冲刺Day7
项目Alpha冲刺Day5
原文地址:https://www.cnblogs.com/mtcnn/p/9422582.html
最新文章
20162306陈是奇 四则运算结对编程(挑战出题)总结
20162306陈是奇 第四次实验报告
20162306陈是奇 四则运算结对编程总结
20162306陈是奇 四则运算阶段总结
20162306 陈是奇 实验报告三
课堂测试Mysort
20162306 2016-2017-2《程序设计与数据结构》第九周学习总结
20162304 2016-2017-2《程序设计与数据结构》课程总结
实验五 网络编程与安全 20162304 张浩林
20162304 阶段编程四则运算(挑战出题)
热门文章
第十四周实验报告:实验四 Android程序设计
结对编程项目-四则运算(第二周总结)
结对编程项目-四则运算(第一周阶段性总结)
实验三 敏捷开发与XP实践实验报告
MySort的后续学习
20162304 2016-2017-2 《程序设计与数据结构》第9周学习总结
20162304 2016-2017-2 《程序设计与数据结构》第8周学习总结
20162302 实验五《网络编程与安全》实验报告
20162302
20162302 实验四《Android程序设计》实验报告
Copyright © 2011-2022 走看看