〔转载〕深度学习中的几种激活函数

zoukankan html css js c++ java

〔转载〕深度学习中的几种激活函数
转载自：http://blog.csdn.net/u012526120/article/details/49149317

1. sigmoid激活函数

sigmoid将一个实数输入映射到[0,1]范围内，如下图（左）所示。使用sigmoid作为激活函数存在以下几个问题：
- 梯度饱和。当函数激活值接近于0或者1时，函数的梯度接近于0。在反向传播计算梯度过程中：
- 函数输出不是以0为中心的。我们更偏向于当激活函数的输入是0时，输出也是0的函数。
因为上面两个问题的存在，导致参数收敛速度很慢，严重影响了训练的效率。因此在设计神经网络时，很少采用sigmoid激活函数。

2. tanh激活函数

tanh函数将一个实数输入映射到[-1,1]范围内，如上图（右）所示。当输入为0时，tanh函数输出为0，符合我们对激活函数的要求。然而，tanh函数也存在梯度饱和问题，导致训练效率低下。

3.Relu激活函数

Relu激活函数（The Rectified Linear Unit）表达式为：

相比sigmoid和tanh函数，Relu激活函数的优点在于：
- 梯度不饱和。梯度计算公式为：
- 计算速度快。正向传播过程中，sigmoid和tanh函数计算激活值时需要计算指数，而Relu函数仅需要设置阈值。如果
因此，Relu激活函数可以极大地加快收敛速度，相比tanh函数，收敛速度可以加快6倍（如上图（右）所示）。

参考资料：
1. http://cs231n.stanford.edu/syllabus.html
2. Krizhevsky A, Sutskever I, Hinton G E. Imagenet classification with deep convolutional neural networks. NIPS. 2012: 1097-1105.
查看全文

相关阅读:
HTML学习（4）属性
 HTML学习（3）基础
 HTML学习（2）编辑器
 HTML学习（1）简介
 winform学习（10）设置控件透明背景色
 winform学习（9）无边框拖动窗体
 《分布式机器学习：算法、理论与实践》——【RE5】
《分布式机器学习：算法、理论与实践》——【RE4】
《机器学习在搜索广告中的机遇和挑战》
>>《learning to rank(ltr)

原文地址：https://www.cnblogs.com/itdyb/p/7866114.html

〔转载〕深度学习中的几种激活函数

转载自：http://blog.csdn.net/u012526120/article/details/49149317

1. sigmoid激活函数

2. tanh激活函数

3.Relu激活函数