动手学深度学习三---多层感知机MLP

zoukankan html css js c++ java

动手学深度学习三---多层感知机MLP

1、隐藏层

多层感知机在单层神经网络中引入了一到多个隐藏层，隐藏层位于输入层和输出层之间

输入层特征数为4个，输出层标签类别为3，隐藏单元5个，输入层不涉及计算，多层感知机层数为2

隐藏层中神经元和输入层中各个输入完全连接，输出层神经元与隐藏层神经元完全连接，因此全连接层有两个：输出层和隐藏层

假设隐藏层权重和偏差分别为w_h、b_h，输出层权重和偏差分别为w_o、b_o，输出o的计算为

H = XW_h + b_h，

O =HW_o + b_o

即，O = (XW_h + b_h)W_o + b_o=XW_hW_o+b_hW_o+ b_o

此时，仍等价于单层神经网络，输出层权重为W_hW_o，偏差为b_hW_o+ b_o

问题：模型仍为线性模型，如何解决非线性问题？

解决方式：引入非线性变换---激活函数，解决非线性问题

2、激活函数

（1）ReLU函数

给定元素x，ReLU(x)=max(x,0)

（2）sigmod函数

将元素的值变换到0和1之间，在早期的神经网络中使用较为普遍，现在更常用的是ReLU

（3）tanh函数

tanh双曲正切函数可以将元素的值变换到-1和1之间

3、多层感知机

多层感知机就是含有至少一个隐藏层的由全连接层（隐藏层）组成的神经网络，其中每一个隐藏层的输出都会通过激活函数进行变换

多层感知机的层数和隐藏层的层数都是超参数，可以自己设定

表示激活函数

查看全文

相关阅读:
word2vector 资料
 回声状态网络（ESN）基础教程
 GBDT：梯度提升决策树
 B-树，B+树，B*树详解
 HTTP权威指南-基础知识
 JavaScript高级程序设计--对象，数组（栈方法，队列方法，重排序方法，迭代方法）
HTML自定义对象与属性探究（谷歌，火狐，IE9浏览器没问题）
冒泡，setinterval，背景图的div绑定事件，匿名函数问题探究
 JavaScript高级程序设计--表单脚本
 我是跨域的JSONP

原文地址：https://www.cnblogs.com/slfh/p/10897126.html