稀疏自动编码之神经网络 - 走看看

zoukankan html css js c++ java

稀疏自动编码之神经网络

考虑一个监督学习问题，现在有一些带标签的训练样本(x⁽ⁱ⁾,y⁽ⁱ⁾).神经网络就是定义一个复杂且非线性的假设h_W,b(x)，其中 $W, b 是需要拟合的参数.$

$下面是一个最简单的神经网络结构，只含有一个神经元，后面就用下图的形式代表一个神经元：$

把神经元看作是一个计算单元，左边的 $extstyle h_{W,b}(x) = f(W^Tx) = f(sum_{i=1}^3 W_{i}x_i +b)$

$f(z) = frac{1}{1+exp(-z)}.$

还有一种激活函数是正切函数（tanh function）:

$f(z) = anh(z) = frac{e^z - e^{-z}}{e^z + e^{-z}},$

下面是两种激活函数图像：

$tanh(z)函数式sigmoid函数的变体，它的输出范围是[-1,1]，而不是[ 0,1].$

$注意一个对后后面推导有用的等式：$

$对于sigmoid函数 f (z) = 1 / (1 + exp( - z))，它的导函数为 f'(z) = f (z)(1 - f (z)).$

$神经网络模型$

$神经网络就是把许多神经元连接到一起，使得一个神经元的输出作为另一个神经元的输入。下面是一个小规模的神经网络：$

图中同样用圆圈表示神经网络的输入（蓝色的圆圈表示整个网络的输入，红色圆圈表示神经元），截距项为+1，但是这里称为偏置节点。网络的最左边的一层叫做输入层，最右边的一层叫做输出层（输出层可以有很多神经元节点，这个例子只有一个节点）。中间的一层称为隐层，因为它们的值在训练集中观察不到。可以说图中神经网络有3个输入节点（不包括偏置节点），3个隐层节点，1个输出节点。

用 $L_{n_l}$

$a^{(l)}_i$

$egin{align} a_1^{(2)} &= f(W_{11}^{(1)}x_1 + W_{12}^{(1)} x_2 + W_{13}^{(1)} x_3 + b_1^{(1)}) \ a_2^{(2)} &= f(W_{21}^{(1)}x_1 + W_{22}^{(1)} x_2 + W_{23}^{(1)} x_3 + b_2^{(1)}) \ a_3^{(2)} &= f(W_{31}^{(1)}x_1 + W_{32}^{(1)} x_2 + W_{33}^{(1)} x_3 + b_3^{(1)}) \ h_{W,b}(x) &= a_1^{(3)} = f(W_{11}^{(2)}a_1^{(2)} + W_{12}^{(2)} a_2^{(2)} + W_{13}^{(2)} a_3^{(2)} + b_1^{(2)}) end{align}$

$z^{(l)}_i$

$extstyle z_i^{(2)} = sum_{j=1}^n W^{(1)}_{ij} x_j + b^{(1)}_i$

$于是上面计算过程的表示就可以更简洁地写为：$

$egin{align} z^{(2)} &= W^{(1)} x + b^{(1)} \ a^{(2)} &= f(z^{(2)}) \ z^{(3)} &= W^{(2)} a^{(2)} + b^{(2)} \ h_{W,b}(x) &= a^{(3)} = f(z^{(3)}) end{align}$

$称这个过程为前向传播（ forward propagation ）.$

$更为一般的是，用 a (1) = x 表示输入层的值，于是 l 层的激活值就是 a (l) ，计算 l + 1 层的激活值 a (l + 1) ：$

$egin{align} z^{(l+1)} &= W^{(l)} a^{(l)} + b^{(l)} \ a^{(l+1)} &= f(z^{(l+1)}) end{align}$

$把所有参数矩阵化，用矩阵—向量操作，可以利用线性代数的优势快速求解网络参数。$

$到目前为止，我们只关注了一个神经网络的例子，但是神经网络还有许多其它的结构（神经元之间的连接类型），包括多个隐层的神经网络。最常见的方式是，对于一个 n l 层的神经网络，第1层代表输入层， n l 层代表输出层，中间的每个 l 层与 l+ 1 层紧密相连。设置好以后，就可以像上述的前向反馈一样，逐层计算激活值，这就是一种前馈神经网络（ feedforward neural network），因为连接中没有回路或者闭环。$

$神经网络可以有多个输出节点。这里给出一个含有2个隐层和2个输出节点的网络：$

$y^{(i)} in Re^2$

$学习来源： http://deeplearning.stanford.edu/wiki/index.php/Neural_Networks$

查看全文

相关阅读:
JavaEE各种Javadoc的下载
 Failed to stop Abandoned connection cleanup thread
检查Encoding-name是否合法
 flex 实现图片播放方案一图片全部预加载放内存
 Example 2
ncl 实例参考
 flex 动画笔记
 Example 1
给DBGrid动态赋值后，如何用程序指定某行某列为当前焦点？(100分)
能详细说一下action:=cafree这句吗?好多书都没说清楚!

原文地址：https://www.cnblogs.com/90zeng/p/neural_network.html

Copyright © 2011-2022 走看看